Linux OOM本质是内存耗尽后内核强制终止进程,排查关键在于厘清压力来源、识别真实瓶颈、验证是否误杀;需分析OOM日志定位被杀进程与触发条件,分层验证内存使用,深挖进程内存增长源头,并实施临时缓解与长期治理措施。

Linux OOM(Out of Memory)问题本质是系统内存耗尽后,内核触发OOM Killer强制终止进程来保全系统。排查关键不在于“找哪个进程占内存最多”,而在于厘清内存压力来源、识别真实瓶颈、验证是否误杀关键服务。
看懂OOM日志:定位被杀进程和触发条件
系统触发OOM时,内核会在dmesg或/var/log/kern.log中输出完整日志。重点抓三类信息:
- 时间戳与触发上下文:确认OOM发生时刻,结合业务日志判断是否有批量任务、流量突增或定时作业
- “Killed process XXX (pid YYY)”行:明确被终止的进程名、PID、UID,注意不是最高RSS的进程,而是oom_score_adj值最高且内存占用大的“综合得分最高者”
- “Mem-Info”快照:查看Active/Inactive(anon)、SwapCached、PageTables等字段,判断是匿名页(堆/栈)、页表开销还是缓存膨胀导致压力
查内存真实使用:别只盯free -h
free命令显示的“available”是估算值,易误导。需分层验证:
标签: linux java node go 虚拟内存 栈 ai 内存占用 yy
还木有评论哦,快来抢沙发吧~