Linux服务健康检查怎么做_自动检测方案说明【技巧】

admin 百科 2025-12-20 25

Linux服务健康检查需三重校验：进程状态（systemctl）、端口监听（ss/netstat）、接口响应（curl）；监控CPU负载、内存available、磁盘使用率及inode、S.M.A.R.T.状态；日志按时间范围扫描error/fail/timeout；脚本化实现阈值判断与自动恢复。

Linux服务健康检查怎么做_自动检测方案说明【技巧】-第1张图片-佛山资讯网

Linux服务健康检查不是只看“有没有在跑”，而是要确认它是否真正可用、响应及时、资源充足、日志干净。自动检测的关键在于“可量化、可触发、可恢复”——指标得有阈值，异常得能发现，问题得能自愈。

最直接的判断方式是验证进程是否存在、端口是否监听、服务能否响应请求。

用 systemctl is-active servicename 判断服务当前状态（active/inactive/failed）
用 ss -tuln | grep :端口号 或 netstat -tuln | grep :端口号 确认端口是否被正确监听
对 Web 类服务，加一层 HTTP 探活：curl -s -o /dev/null -w "%{http_code}" http://localhost:8080/health，返回 200 才算真健康
避免仅依赖 ps 查进程名，因为僵尸进程或假 PID 可能干扰判断；建议结合 systemctl + 端口 + 接口三重校验