Linux服务健康检查需三重校验:进程状态(systemctl)、端口监听(ss/netstat)、接口响应(curl);监控CPU负载、内存available、磁盘使用率及inode、S.M.A.R.T.状态;日志按时间范围扫描error/fail/timeout;脚本化实现阈值判断与自动恢复。

Linux服务健康检查不是只看“有没有在跑”,而是要确认它是否真正可用、响应及时、资源充足、日志干净。自动检测的关键在于“可量化、可触发、可恢复”——指标得有阈值,异常得能发现,问题得能自愈。
基础服务状态与端口连通性检查
最直接的判断方式是验证进程是否存在、端口是否监听、服务能否响应请求。
- 用 systemctl is-active servicename 判断服务当前状态(active/inactive/failed)
- 用 ss -tuln | grep :端口号 或 netstat -tuln | grep :端口号 确认端口是否被正确监听
- 对 Web 类服务,加一层 HTTP 探活:curl -s -o /dev/null -w "%{http_code}" http://localhost:8080/health,返回 200 才算真健康
- 避免仅依赖 ps 查进程名,因为僵尸进程或假 PID 可能干扰判断;建议结合 systemctl + 端口 + 接口三重校验
资源使用率与系统级指标监控
CPU、内存、磁盘、负载这些底层指标一旦越界,服务大概率会降级甚至崩溃。
标签: mysql linux word node go nginx 端口 curl ai
还木有评论哦,快来抢沙发吧~