Linux性能优化需聚焦CPU、内存、磁盘IO、网络四大维度:CPU要查上下文切换与软中断;内存应合理设swappiness而非禁swap;磁盘IO需区分慢盘与队列拥堵;网络要调端口范围与conntrack参数。

Linux性能优化不是堆硬件或调几个参数就完事,关键在理解瓶颈在哪、影响谁、怎么验证改动有效。盲目改sysctl、关swap、调OOM分数,反而容易引发更隐蔽的故障。下面从四个最常出问题的维度讲清楚怎么做才真正提升稳定性。
CPU:别只盯%us,先看上下文切换和软中断
top里看到CPU使用率高,不等于程序写得差。可能是频繁进程切换(context switch)、软中断(softirq)压满一个核,或者中断都集中在一个CPU上。
- 用 vmstat 1 看 cs(每秒上下文切换)是否持续超 10k;若高,再用 pidstat -w 1 找频繁切换的进程
- 查软中断分布:cat /proc/softirqs,配合 mpstat -P ALL 1 看哪个CPU被NET_RX占满——这时要开RPS/RFS或调整网卡中断亲和性(smp_affinity)
- 避免“CPU空转等锁”:用 perf record -e sched:sched_switch -g sleep 10 抓调度栈,定位自旋锁或互斥锁争用点
内存:swap不是敌人,但swappiness设0可能更糟
很多人一见swap就panic,直接vm.swappiness=0。这会让内核彻底放弃换出匿名页,在内存紧张时只能触发OOM killer——杀掉大进程,服务直接中断。
- 对数据库、Java应用这类内存大户,swappiness=1~10 更稳妥:允许换出冷页,但不抢cache
- 用 slabtop 查内核对象缓存(如dentry、inode)是否暴涨,可能是文件操作激增或泄漏,不是加内存能解决的
- 检查 /sys/kernel/mm/transparent_hugepage:对延迟敏感服务(如Redis、Kafka),建议设为madvise而非always,避免THP分配卡顿
磁盘IO:iowait高?先分清是慢设备、队列深,还是锁竞争
iostat显示%util=100%不等于磁盘真的跑满了。可能是队列堆积(avgqu-sz高)、响应时间(r_await/w_await)飙升,或单个进程死锁式刷盘。
标签: linux java redis node cookie app 端口 栈 ai ios switch .net red
还木有评论哦,快来抢沙发吧~