Prometheus CPU使用率直方图指标

问题描述

我的目标是在服务器及其运行的Docker容器上使用Prometheus观察指标(例如cpu,内存使用情况等)。在发送警报之前,我想将这些指标的某些值与0.95分位数。但是,经过数周的互联网搜索,我仍然在努力为某些分位数创建指标。因此,我在此线程中询问您的帮助/建议,如何为某些指标创建分位数。

背景

代码库是docprom存储库的分支。此代码依赖于Prometheus进行监视。 Prometheus从正在运行的cAdvisor容器中检索其数据。可以在以下page上看到cAdvisor为Prometheus提供的指标。但是,它仅提供GaugeCounter度量标准类型。在研究过程中,我找不到能够修改/扩展所提供指标的参数。

问题

根据我目前的理解,度量类型应该是HistogramSummary,以便观察分位数。在cAdvisor提供的指标上使用histogram_quantile查询的最佳方法是什么?

我目前的想法是

  1. 创建自定义服务器
  2. 从Prometheus获取所需数据
  3. 计算所需数据
  4. 将其作为服务器提供的指标,以便Prometheus可以对其进行抓取
  5. 自定义指标运行histogram_quantile

为了创建可用于分位数的度量标准,这是正确的方法吗?

例如,如果某些容器的cpu使用率超过0.95分位数,我想发出警报。可以在以下示例中看到有关cpu使用率的代码

sum(rate(container_cpu_usage_seconds_total{name="CONTAINER_NAME"}[10m]))) / count(node_cpu_seconds_total{mode="system"}) * 100

创建所需分位数的最佳方法是什么?我在正确的道路上还是在这里错过了一些简单的事情?因为它对于我来说很难获得带有分位数的简单查询

感谢所有帮助和信息。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)