linux – 远程服务器挂起,卡住了.怎么调试?

我在使用Ubuntu 8.04 LTS的VmWare ESX上运行vps.
它在过去3个月里一直运行顺畅,但最近我们注意到两个奇怪的错误.

一个.服务器挂起,今天是第二次.悬挂的本质很奇怪.
我可以ping到服务器服务器,它发送回响应很好.但是sshd,apache,mysql等所有其他服务根本不响应.
工作时

telnet servername 22
Escape character is '^]'.
SSH-2.0-OpenSSH_5.X Debian-5ubuntu1

其他网络服务运行良好.当它挂起时,我可以将tcp连接到22以及80,但根本没有响应.

telnet servername 22
Escape character is '^]'.

我该如何调试这个问题?是否有可以运行的守护程序会定期记录状态?请告诉我如何处理它.

湾另一个奇怪的问题是,最近我无法传输大于100KB的文件,大约1-2 KB工作文件的较小文件.

scp anotherserver:filename .

要么

wget http://www.example.com/file

会卡住.仍有大约6GB的空间,所以我不认为这是一个问题.我应该研究哪些指针?

解决方法

我建议使用sysstat(或atsar)包中的sar.这作为一个cron作业每10分钟运行一次并记录您的服务器的重要统计信息 – 内存使用情况,cpu使用率,磁盘活动,网络活动等.

你这样使用它:

显示处理器活动(认)
sar -p(或者只是sar)

显示内存(“ram”)统计信息
sar -r

显示27日的内存统计信息
sar -r -f / var / log / sysstat / sa27

请注意,路径因安装而异.在基于redhat的系统上,文件通常位于/ var / log / sa /中,而如果安装了atsar软件包,它们将位于/ var / log / atsar / – 但模式是文件将以数字结尾,表示收集数据的当月.

某些版本(如atsar)允许您只指定日期:sar -n 27.检查安装附带的联机帮助页,以找出正确的语法以及可以检索的数据.

一旦你安装并运行了(你可能已经这样做了!),你可以使用它收集的信息来了解崩溃之前发生的事情.例如,如果报告显示您的内存已耗尽且可用交换空间倒计时为零,那么您将非常清楚要查找的内容.

有了这些信息,您可以设置其他报告,以便更好地了解错误:例如,您可以编写一个简短的bash脚本来检查某些系统统计信息(例如/ proc / meminfo或/ proc的内容) / loadavg)并且如果满足触发条件,可能会将适当的调试信息(如ps auwwxf的输出)附加到文件中,或者将信息通过电子邮件发送给您.

相关文章

/etc/sysctl.conf这个目录主要是配置一些系统信息,/etc/sys...
1.作用 useradd或adduser命令用来建立用户帐号和创建用户的起...
它们都是多模式编辑器,不同的是vim 是vi的升级版本,它不仅...
不管是我们在安装软件还是监测软件的使用性能,我们都要随时...
装好Tomcat7后,发现除了本机能访问外界访问不了,岂有此理。...
修改防火墙配置需要修改 /etc/sysconfig/iptables 这个文件,...