我目前正在开发一个警报/通知解决方案,其中我们在kubernetes上以前端和后端服务的方式部署了微服务。如果后端服务遇到内存耗尽,则会多次出现无法重启或无法达到90%分配的pod限制的情况。为了识别这样的pod,我们需要一种警报机制,以便在它们失败或饱和程度时进行查看。我们有普罗米修斯和grafana作为监测服务,但无法配置警报,因为我在这些方面的知识相当有限,但任何建议和参考,在那里我可以有详细的方式实现这将是有帮助的。请让我知道我确实在互联网上尝试过这样的方法,但几乎所有的都指向节点级别,集群级别的监控。:( enter image description here 用于检查内存使用情