linux – 诊断高CPU等待

我有一个运行icinga / collectd / graphite的监控服务器,大约有50台主机.我注意到盒子上的高负载/段塞性能.如果你看一下top,你会看到:

cpu(s):0.6%us,0.2%sy,0.0%ni,7.6%id,23.4%wa,0.0%hi,0.2%si,0.0%st

注意HUGE%wa值,据我所知,这意味着网络或磁盘瓶颈. ifconfig显示没有丢包,并且没有大量的带宽,所以这会留下磁盘问题,对吧?还没有很多磁盘写入… iotop报告说我们每秒只写1 MB以上,RAID工具报告一切都是A-OK并且启用了写入缓存.

我该如何试图弄清楚如何解决这个问题?

更新:
iostat -x输出是:

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.62    0.10    0.31    9.65    0.00   89.31

Device:         rrqm/s   wrqm/s     r/s     w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util
sda               0.21    33.34   83.55   16.54  1599.94   399.07    19.97    43.21  416.98   3.71  37.13

解决方法

NFS,SMB和其他远程文件系统也会生成i / o等待.

使用vmstat 2查看系统性能的详细视图,包括io wait.

相关文章

在Linux上编写运行C语言程序,经常会遇到程序崩溃、卡死等异...
git使用小结很多人可能和我一样,起初对git是一无所知的。我...
1. 操作系统环境、安装包准备 宿主机:Max OSX 10.10.5 虚拟...
因为业务系统需求,需要对web服务作nginx代理,在不断的尝试...
Linux模块机制浅析 Linux允许用户通过插入模块,实现干预内核...
一、Hadoop HA的Web页面访问 Hadoop开启HA后,会同时存在两个...