3 个 dns 服务器 promethus、grafana、promql、bind_exporter、DNS 之间的组合正常运行时间监视器

问题描述

情况是,我正在努力为具有基于 Bind9 和绑定导出器的 3 个 DNS 服务器的集群制作 DNS % Uptime Monitor。

我已经通过这个查询成功地为每台服务器制作了监视器

avg_over_time(bind_up{instance="server1"}[1d])*100
avg_over_time(bind_up{instance="server2"}[1d])*100
avg_over_time(bind_up{instance="server3"}[1d])*100

现在的问题是当我尝试制作组合全局监视器时,它为我提供了 3 个服务器的正常运行时间百分比 挑战在于最后 3 个监视器之间的平均值会给我一个错误的结果。

如果任何服务器立即给 bind_up = 1,则全局监视器状态必须为 1

第一个问题我该如何进行

第二个问题: 这两个查询有什么区别

avg_over_time(bind_up{instance="server1"}[1d])*100

sum(sum_over_time(bind_up{instance="server1"}[1d]))
/
sum(count_over_time(bind_up{instance="server1"}[1d])) * 100

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)