linux – 通过使用所有RAM的神秘过程崩溃机器 – 如何识别?

我有一台 Linux机器,可以运行~10个内部编写的进程.

每隔一天(!)机器完全耗尽RAM,进入交换并变得无响应.这种情况在几秒钟内很快就会发生,所以坐下来观察机器直到它死亡是不可行的.这是一个突然的泄漏,而不是一个渐进的泄漏,所以top(1)并没有给出任何可能发生的坏事.

确定哪些进程导致问题的最佳方法是什么?

解决方法

你可以考虑禁用内存过量使用,这样内核就会杀掉泄漏进程而不是机器.

您可以使用以下两个sysctl禁用overcommit:

vm.overcommit_ratio=60
vm.overcommit_memory=2

第一个数字取决于你有多少内存和多少交换.
分配限制将是:

amount_of_swap + overcommit_ratio/100 * amount_of_ram

相关文章

linux常用进程通信方式包括管道(pipe)、有名管道(FIFO)、...
Linux性能观测工具按类别可分为系统级别和进程级别,系统级别...
本文详细介绍了curl命令基础和高级用法,包括跳过https的证书...
本文包含作者工作中常用到的一些命令,用于诊断网络、磁盘占满...
linux的平均负载表示运行态和就绪态及不可中断状态(正在io)的...
CPU上下文频繁切换会导致系统性能下降,切换分为进程切换、线...