Flink statsd 报告器未发出预期的 JVM 垃圾收集指标

问题描述

在 AWS EMR 中运行 Flink 1.6.2 和 1.11.2,启用 statsd 报告器并发送到 Telegraf,以便我们可以可视化和警报。大多数指标都运行良好,但文档说我应该看到:

Job-/TaskManager    
 Status.JVM.GarbageCollector    
  <GarbageCollector>.Count
  <GarbageCollector>.Time

相反,我得到的是:

taskmanager_container_1617047470675_0027_01_000006_Status_JVM_GarbageCollector_PS_value
jobmanager_Status_JVM_GarbageCollector_PS_value

哪个不是我看过的任何 Flink 版本的文档的一部分。谷歌搜索告诉我 PS 是并行扫描,但我什至无法确定该值是时间、大小还是什么。如果我搜索该 jobmanager 指标,我会得到

您的搜索 - “jobmanager_Status_JVM_GarbageCollector_PS_value” - 做了 不匹配任何文件

这是狂野的。我错过了什么导致我没有发出正确的 GC 指标?

Flink 1.6.2 flink-conf.yaml:

metrics.reporters: stsd
metrics.reporter.stsd.class: org.apache.flink.metrics.statsd.StatsDReporter
metrics.reporter.stsd.host: 10.xxxxxxx
metrics.reporter.stsd.port: 8125
metrics.scope.jm: jobmanager
metrics.scope.jm.job: jobmanager.<job_id>
metrics.scope.tm: taskmanager.<tm_id>
metrics.scope.tm.job: taskmanager.<tm_id>.<job_id>
metrics.scope.task: taskmanager.<tm_id>.<job_name>.<task_name>.<subtask_index>
metrics.scope.operator: taskmanager.<tm_id>.<job_name>.<operator_name>.<subtask_index>

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)