为kubernetes容器配置通知/警报的方法,该容器已达到90%的内存并且未暴露给Internet后端微服务

问题描述

我目前正在研究警报/通知解决方案,其中我们以前端和后端服务的方式在kubernetes上部署了微服务。在很多情况下,如果后端服务遇到内存用尽的情况,它们将无法重新启动或达到分配的90%的pod限制。为了识别此类Pod,我们希望在它们出现故障或达到饱和级别时使用警报机制进行查找。我们将prometheus和grafana作为监视服务,但是由于我对这些知识的了解有限,因此无法配置警报,但是提供的任何建议和参考都可以帮助我实现这一目标的详细方法。请让我知道 我确实在互联网上尝试过这种方法,但是几乎所有对象都指向节点级别,仅用于集群级别监视。 :(

enter image description here

用于检查内存使用情况的查询为: 总和(container_memory_working_set_bytes {image!=“”,name =〜“ ^ k8s _。*”,namespace =〜“ ^ $ namespace $”,pod_name =〜“ ^ $ deployment- [a-z0-9] +-[a- z0-9] +“})由(pod_name)

解决方法

我最近在Google上看到了此内容。这可能对您有帮助。 https://groups.google.com/u/1/g/prometheus-users/c/1n_z3cmDEXE?pli=1