使用哪种统计模型来确定平均RTT网络中的往返时间变化率,以确定网络问题

问题描述

我正在用python写一个工具,通过感知avgRTT值的非正常趋势来确定由于网络引起的延迟(这些值来自类似于nfsiostat输出的自定义工具,这是客户端之间的nfs挂载状态和服务器或挂载点)。此自定义工具将以5分钟为间隔输入以下avgRTT时间。我想确定平均RTT中的非正常趋势。例如,正常趋势如下:

| time  | avgRTT (nfsiostat) |
|-------|--------------------|
| 10:30 | 5.1                |
| 10:35 | 4.2                |
| 10:40 | 4.8                |
| 10:45 | 18.9               |
| 10:50 | 4.0                |
| 10:55 | 8.5                |
| 11:00 | 4.6                |
| 11:30 | 5.2                |
| 11:35 | 4.5                |
| 11:40 | 5.0                |

^^的意思是,我不在乎单个离群值,而是在乎增长趋势。所以上面的输出是正常的。

这是一个非正常趋势,我希望我的工具提醒您可能存在网络问题。

| time  | avgRTT (nfsiostat) |
|-------|--------------------|
| 10:30 | 5.1                |
| 10:35 | 4.2                |
| 10:40 | 4.8                |
| 10:45 | 18.9               |
| 10:50 | 21.9               |
| 10:55 | 20.9               |
| 11:00 | 19.7               |
| 11:30 | 18.8               |
| 11:35 | 4.5                |
| 11:40 | 5.0                |

从这里^^,在10:45到11:30之间存在非正常趋势。 (也许连续2或3个值都可以视为趋势)

就上下文而言,avgRTT在一段时间间隔内可能会变坏,然后恢复正常(如上表2所示),然后又变坏(这种情况发生在开关如“自我修复”和重新启动,或者流量不一定总是到达群集中的同一故障网络设备。

到目前为止,我已经考虑过:

  1. 标准差-我知道avgRTT的方式,我的标准差非常窄。然后,我可以查看我的模型跨越了多少(或者我的模型传播了多少sigma)。如果我的钟形曲线的扩展范围大于第一个标准偏差附近的幅度,那么我可以说存在异常值,并且我的趋势是非正态的。我在这里预期的问题是,这并没有真正给我“趋势”,整个数据中可能有6个单独的异常值,并且我的SD贝尔曲线会比应该的宽。因此,我认为这不适合此目的。如果我错了,请纠正我。
  2. 最小二乘最佳拟合模型-我在这里了解到,任何离群值都会改变线的斜率,因此可以准确表示avgRTT的“趋势”。这样做的好处是可以得到变化率,因为我在x轴上具有时间函数。谢谢您在这里的任何更多信息/或指出的任何漏洞。
  3. 我还考虑了移动平均模型,其中当我在列表中移动时,我一直在计算avgRTT值的平均RTT,并将新值与该平均值进行比较。如果在任何时候某个值显示出比所计算的平均值高100%,则停止计算移动平均值并冻结该值(例如,该移动平均值位于var frozen_avg中),并从此“异常值”读取下三个值”,这3个值是否也超过了Frozen_avg?如果是,则有趋势。我了解在这种情况下可能会有漏洞,如果您在此方法中发现任何明显的漏洞,也将不胜感激。

我需要知道可以依靠哪些统计模型/方法来感知时间戳平均中的这种非正常趋势。如上所述的RTT值。

感谢您的帮助!谢谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)