linux – 如何衡量复杂的I / O活动以开发真实的基准测试?

我需要从我的服务服务器检索一些指标来测试另一个stroage解决方案.基准程序提供了各种选项(我选择了FIO,http://freecode.com/projects/fio).我可以轻松地设置io模式.但我不知道如何才能检索实际服务的指标,以尽可能真实地设置基准变量.

例如,我需要设置,

>随机/顺序读/写比率文件大小和每个的分布
>文件大小(如果可能的话,每个大小的随机/顺序读/写比率)
> iodepth
>随机访问的重访率(可能会影响随机访问性能)

我目前正在测试ceph(http://ceph.com/),至少从上述指标看来,这对我研究中的那种存储有显着影响.我该如何检索这些价值?

collectcl(http://collectl.sourceforge.net/)似乎很有希望.但除了读/写比率之外,还无法弄清楚.除了那些东西,我无法弄明白.我真的很想知道其他人如何决定那些基准变量.

提前致谢.

解决方法

您可以使用 blktrace记录实际系统存储活动并分析现有工作负载.这可以捕获到文件.

跟踪可以是replayed.

一个有趣的可能性是使用新的sysdig utility来尝试分析代表性工作负载下发生的情况.

此外,这里的答案显示了使用System TapLinux utility to record IO statistics (random/sequential,block sizes,read/write ratio)的有趣方法

相关文章

在Linux上编写运行C语言程序,经常会遇到程序崩溃、卡死等异...
git使用小结很多人可能和我一样,起初对git是一无所知的。我...
1. 操作系统环境、安装包准备 宿主机:Max OSX 10.10.5 虚拟...
因为业务系统需求,需要对web服务作nginx代理,在不断的尝试...
Linux模块机制浅析 Linux允许用户通过插入模块,实现干预内核...
一、Hadoop HA的Web页面访问 Hadoop开启HA后,会同时存在两个...