linux – 如何诊断ubuntu服务器重启

我的ubuntu服务器(12.04)有时会在没有通知的情况下重启.如何检查触发服务器重启的内容

解决方法

这是一门艺术.

如果可以,启用串行控制台(您需要BIOS支持,可能需要启用GRUB支持,并运行TTY),并确保syslog和内核写入控制台.将此捕获到另一个服务器上的文件的屏幕会话可能很有用.

通常的日志怀疑:/ var / log / messages,/ var / log / syslog,/ var / log / kernel.log,/ var / log / debug.请注意,/ var / log / dmesg仅在引导后立即捕获内核环缓冲区,因此可能不会有太多信息.

最有用的事情之一是启用netconsole,一种内核内日志记录服务.您需要一个系统日志服务器(最好是附近)来捕获输出.假设数据可以安全地记录到磁盘,kdump也很有用.

如果您仍然难过,请开始查看硬件组件(内存,cpu和主板组件是主要问题),更换/禁用其中的部分或全部内容等.内核驱动程序可能会导致故障,因此加载/卸载模块可能会显示的东西.

BIOS配置可能会产生问题.例如:几年前戴尔发布了“CSTATE”设置问题,英特尔在北门/南门配置方面有一个问题.请咨询您的BIOS /系统供应商,了解任何建议的设置或固件更新.

多年来,由于电容器坏,RAM坏,BIOS,samba驱动程序,硬件加密加速器,电源/分配元件,主板接线,主电源中断以及各种形式的运算符错误/干预,我发生了随机锁定/崩溃.通常,从简单/可记录的东西开始,并开始从可能的候选者中删除组件(硬件或软件).

相关文章

在Linux上编写运行C语言程序,经常会遇到程序崩溃、卡死等异...
git使用小结很多人可能和我一样,起初对git是一无所知的。我...
1. 操作系统环境、安装包准备 宿主机:Max OSX 10.10.5 虚拟...
因为业务系统需求,需要对web服务作nginx代理,在不断的尝试...
Linux模块机制浅析 Linux允许用户通过插入模块,实现干预内核...
一、Hadoop HA的Web页面访问 Hadoop开启HA后,会同时存在两个...