Linux高负载如何排查_深度讲解提升系统稳定性【教程】

admin 百科 12
负载值是“正在运行+等待运行”的进程平均数,非CPU使用率;需结合CPU核心数判断:≤0.7较空闲,>1已过载,远高于核心数则存在严重阻塞。

Linux高负载如何排查_深度讲解提升系统稳定性【教程】-第1张图片-佛山资讯网

看懂负载值和CPU核心数的关系

执行 uptimecat /proc/loadavg,会看到三个数字,比如 2.45 1.98 1.72,分别代表过去 1 分钟、5 分钟、15 分钟的平均负载。这个数值不是 CPU 使用率,而是“正在运行 + 等待运行”的进程平均数量。

nprocgrep -c 'processor' /proc/cpuinfo 查出逻辑 CPU 核心数(比如 8 核)。关键判断标准是:
– 负载值 ÷ CPU 核心数 ≤ 0.7:系统较空闲
– 负载值 ÷ CPU 核心数 > 1:已过载,需干预
– 负载值远高于核心数(如 16 核机器负载达 30+):存在严重阻塞或资源争抢

分方向快速定位瓶颈类型

负载高 ≠ CPU 忙。可能是 CPU、内存、磁盘 I/O 或中断在拖慢系统。按以下顺序快速筛查:

  • CPU 是否真忙? 运行 top,关注第三行 %Cpu(s):若 us + sy 持续 > 80%,说明用户或内核代码在大量消耗 CPU;若 wa 高(>20%),说明进程卡在等磁盘,实际 CPU 是空闲的
  • 有没有进程疯占 CPU?top 中按 Shift+P 排序,看前几位 %CPU 是否异常(如单个进程长期 >300%);再用 ps -eo pid,ppid,cmd,%cpu --sort=-%cpu | head -10 精确输出
  • 磁盘是不是堵了? 执行 iostat -x 1 3,重点关注 %util(接近 100% 表示磁盘饱和)、await(单次 I/O 平均耗时,>20ms 值得警惕)、r/s w/s(读写频次是否突增)
  • 内存是否快见底或触发 OOM? free -h 看可用内存和 available 列;dmesg | grep -i "killed process" 检查是否被内核杀过进程;slabtop 查内核对象内存占用是否异常膨胀

深入线程与 Java 进程排查(适用常见服务场景)

当确认是某个 Java 或多线程服务导致高负载,不能只停在进程层:

标签: linux java js go 硬盘 ai ios 内存占用

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~