我有几个客户将他们的指标推送到Pushgateway,然后被Prometheus抓取。最后,我将Grafana用于仪表板--我想这不是一个很奇特的设置。
令我困惑的是,当其中一个客户端停止工作,不再推送它的指标时,Pushgateway将进一步将它收到的最后一个值提供给Prometheus,Grafana将很高兴地显示一条水平线。
但是,如果指标太旧,我更喜欢收到警报。如何做到这一点呢?
发布于 2020-11-08 00:22:24
Prometheus使用time()提供当前时间,它提供自1970年1月1日UTC以来的秒数。推送网关为每个作业保留一个度量: push_time_seconds,它显示自1970年1月1日协调世界时以来的最后一次推送的时间(秒)。
所以查询
time() - push_time_seconds将显示您的每个exported_job的年龄以秒为单位。现在,如果该值超过定义的阈值,则很容易进一步过滤和报警。对于预计一天运行一次的作业(因此,它们的指标预计永远不会超过24小时),我在Grafana中将阈值配置为25小时(90000秒),它就像一个护身符。
https://stackoverflow.com/questions/64729855
复制相似问题