为kubernetes容器配置通知/警报的方法，该容器已达到90％的内存并且未暴露给Internet后端微服务

问题描述

我目前正在研究警报/通知的解决方案，其中我们以前端和后端服务的方式在kubernetes上部署了微服务。在很多情况下，如果后端服务遇到内存用尽的情况，它们将无法重新启动或达到分配的90％的pod限制。为了识别此类Pod，我们希望在它们出现故障或达到饱和级别时使用警报机制进行查找。我们将prometheus和grafana作为监视服务，但是由于我对这些知识的了解有限，因此无法配置警报，但是提供的任何建议和参考都可以帮助我实现这一目标的详细方法。请让我知道我确实在互联网上尝试过这种方法，但是几乎所有对象都指向节点级别，仅用于集群级别监视。：（

enter image description here

用于检查内存使用情况的查询为：总和（container_memory_working_set_bytes {image！=“”，name =〜“ ^ k8s _。*”，namespace =〜“ ^ $ namespace $”，pod_name =〜“ ^ $ deployment- [a-z0-9] +-[a- z0-9] +“}）由（pod_name）

解决方法

我最近在Google上看到了此内容。这可能对您有帮助。 https://groups.google.com/u/1/g/prometheus-users/c/1n_z3cmDEXE?pli=1

alert grafana kubernetes kubernetes-pod prometheus