Prometheus 增加功能提醒

问题描述

所以我的目标是为网络接口丢失设置警报机制。我正在使用 node_network_receive_drop_total 这是一个计数器。我的目标是在发生滴落时发出警报,这意味着滴数上升时。假设我有一段时间内下降的这些值。

|node_network_receive_drop_total |difference
|0                               |0
|1                               |1
|5                               |4
|5                               |0  
|7                               |2

在这个例子中,如何在 grafana 中使用增加函数和警报条件在差异非零时发出警报?

解决方法

在您的示例中,您应该使用 delta function。类似于:

delta(node_network_receive_drop_total[5m]) > 0

这意味着,只要您在过去 5 分钟内的 delta 大于 0,就会触发您的警报。

PS:如果您有多个实例,请考虑使用 sum。

,

Query 选项卡中,一个名称类似于 node network drops 的图表并查询如下内容:increase(node_network_receive_drop_total[5m])

当没有下降时,此图应在 0 处有一条平线。当发生跌落时,图表将在跌落后 5 分钟内在 1 处显示一条线。

在警报选项卡中创建一个条件为 WHEN max() OF query(A,15m,now) IS ABOVE 0 的警报。

由于查询只会返回一个值,因此您可以使用 max()min()max()(它们都将返回相同的值)。

A 中的 query 应与 Query 选项卡中查询中的字母匹配。如果图表上显示了多个查询,则可能需要更改此设置。

15mnow 查看过去 15 米的数据。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...