Linux高负载需按“负载值→资源类型→进程→线程→调用链”逐层排查:先比对负载与CPU核心数(阈值=核数×0.7),再用mpstat/iostat/pidstat区分CPU型或I/O型,接着用strace/jstack定位线程级瓶颈,最后检查内存与swap影响。

Linux高负载不是“CPU用满了”那么简单——它反映的是系统整体任务队列的积压程度。真正关键的是:先看负载值是否越界,再分清是CPU忙、IO堵、内存缺,还是进程卡在系统调用里。定位准了,修复才快。
一、确认负载是否真超标
别只盯着uptime或top里那个数字。先查CPU核心数:
-
grep -c 'processor' /proc/cpuinfo或nproc - 合理阈值 = 核心数 × 0.7(比如8核,负载持续>5.6就要查)
- 重点看三个值:
load average: 12.4, 9.8, 7.2—— 若1分钟值远高于15分钟值,说明突发尖峰;若三者都高且平稳,大概率是长期瓶颈
二、区分负载类型:CPU型 vs I/O型
高负载但CPU使用率低?大概率是I/O卡住了。反过来,CPU使用率飙高+负载高,才是计算密集问题。
- CPU型:用
mpstat -P ALL 1 3看各核%idle是否接近0;再用pidstat -u 1找出%CPU最高的进程 - I/O型:用
iostat -x 1 3看%util是否持续>90%,同时%wa(iowait)是否>10%;再用iotop -o找实际在刷盘的进程 - 混合型:
pidstat -u 1 -d 1可同时输出CPU和IO指标,一眼比对
三、快速定位“元凶”进程
找到高消耗进程只是第一步,得往下挖一层——是哪个线程、哪段代码、甚至哪个系统调用在拖慢它。
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
还木有评论哦,快来抢沙发吧~