问题描述
所以我的目标是为网络接口丢失设置警报机制。我正在使用 node_network_receive_drop_total
这是一个计数器。我的目标是在发生滴落时发出警报,这意味着滴数上升时。假设我有一段时间内下降的这些值。
|node_network_receive_drop_total |difference
|0 |0
|1 |1
|5 |4
|5 |0
|7 |2
在这个例子中,如何在 grafana 中使用增加函数和警报条件在差异非零时发出警报?
解决方法
在您的示例中,您应该使用 delta function。类似于:
delta(node_network_receive_drop_total[5m]) > 0
这意味着,只要您在过去 5 分钟内的 delta 大于 0,就会触发您的警报。
PS:如果您有多个实例,请考虑使用 sum。
,在 Query
选项卡中,一个名称类似于 node network drops
的图表并查询如下内容:increase(node_network_receive_drop_total[5m])
。
当没有下降时,此图应在 0
处有一条平线。当发生跌落时,图表将在跌落后 5 分钟内在 1
处显示一条线。
在警报选项卡中创建一个条件为 WHEN max() OF query(A,15m,now) IS ABOVE 0
的警报。
由于查询只会返回一个值,因此您可以使用 max()
、min()
或 max()
(它们都将返回相同的值)。
A
中的 query
应与 Query
选项卡中查询中的字母匹配。如果图表上显示了多个查询,则可能需要更改此设置。
15m
和 now
查看过去 15 米的数据。