问题描述
在另一个命名空间中自定义fluentd
后,我很难在GKE上启用指标。
我在fluentd
配置图中添加了一些更改,因为fluentd
命名空间中的GKE默认configmap
和kube-system
无法更改(更改总是被还原),因此我部署了{{ 1}}和事件导出程序在另一个名称空间中。
但是我进行更改后缺少指标。所有日志都还可以,仍在日志查看器中。
需要做什么才能使GKE再次收集指标?还是我错了,有没有办法修改fluentd
中的默认fluentd
configmap
?
解决方法
我找不到关于此主题的任何有用信息。因此,我创建了一个GCP支持票证。 Google提供了一种解决方案:
使用GKE的Cloud Operations,您可以仅收集系统日志[1],从而在群集中保持启用监视的状态。请注意,只能通过控制台启用此选项,而不能通过gcloud命令行启用。有一个跟踪错误,https://issuetracker.google.com/163356799相同。
此外,您可以将自己的可配置Fluentd守护程序集部署到 自定义应用程序日志[2]
您将使用此配置运行2个后台程序以使其流畅 为了减少日志重复的数量,建议 您可以减少CloudOps的日志记录以仅捕获系统日志[2], 而您自定义的fluentd守护程序集将能够捕获您的 应用程序工作负载日志。
使用这种方法的缺点是:确保您的自定义 部署不会与CloudOps监视的内容(例如文件, 日志),API调用的数量将会增加,您将 负责更新/维护和管理您的自定义流利 部署。
[2]。 https://cloud.google.com/solutions/customizing-stackdriver-logs-fluentd