Linux性能优化核心是定位瓶颈+精准干预,关键看CPU(%us/%sy/%wa)、内存(MemAvailable/PSS)、磁盘(%util/await)、网络(丢包/队列溢出)四大指标,坚持“观察→假设→验证→收敛”循环。

Linux性能优化不是堆参数、不是盲目调优,核心在于定位瓶颈 + 精准干预。系统资源就那么几样:CPU、内存、磁盘I/O、网络,问题一定出在其中一环或它们的协同上。先看清“哪堵了”,再决定“怎么通”,这才是高效优化的起点。
看懂指标,比调参更重要
很多同学一上来就改sysctl、调ulimit、换调度器,结果压根没搞清真实瓶颈。真正该花时间的是读懂基础监控信号:
-
uptime / proc/loadavg:看平均负载,但注意——它包含等待CPU和等待不可中断状态(如磁盘)的进程,高负载不等于CPU满,得结合
top或htop里的%CPU和%wa(iowait)一起看 -
free -h:关注
available列,不是free;buff/cache高是正常现象,内核会自动回收,别急着echo 3 > /proc/sys/vm/drop_caches -
iostat -x 1:重点看
%util(设备忙时占比)、await(I/O平均等待毫秒)、r_await/w_await,单个设备%util持续超80%+ await飙升,基本锁定磁盘瓶颈 -
ss -s 或 netstat -s:查连接数、重传、丢包、socket队列溢出(如
prune、overflow字段),网络卡顿往往藏在这里
CPU高?先分清是“忙”还是“等”
CPU使用率高≠程序写得差。用pidstat -u 1或perf top定位热点函数,但更关键的是看上下文:
- 如果
%sy(系统态)占比高,可能是频繁系统调用——检查是否小文件读写多、锁竞争激烈、或strace看到大量read/write/futex - 如果
%us(用户态)高且集中在某进程,用perf record -g -p PID抓火焰图,看是不是算法复杂度问题或未用缓存 - 如果
%wa高,说明CPU在等I/O,此时降CPU占用没意义,得去查磁盘或慢SQL、同步日志等源头
内存不够用?先确认是不是真缺
Linux的OOM Killer不是bug,是保命机制。触发前通常有迹可循:
标签: linux docker app 字节 工具 ai ios 热点 内存占用 overflow
还木有评论哦,快来抢沙发吧~