腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
每次
出现
错
误时
使用
prometheus
创建
警报
、
、
我是普罗米修斯和
警报
系统的新手。我已经开发了一个微服务,并添加了度量代码,以便在
出现
错
误时
获得增量的总数。现在,我正在尝试
创建
一个
警报
,以便每当错误中
出现
增量时,它都会标记出来并发送一封邮件。我
使用
了类似error_total >0的东西来发送
警报
,但它
每次
都会起作用,因为除非我们手动重置它,否则计数将>0。
浏览 16
提问于2020-03-13
得票数 0
回答已采纳
1
回答
Prometheus
警报
规则未检测到首次度量增加
只要
出现
错误,就调用counter.inc();。我有下面的警告表达式,它在计数器增加时触发。expr: increase(error_in_execution[5m]) > 0现在的问题是,当不存在度量并且第一次
出现
错
误时
,计数器值将增加到1。此
警报
表达式未检测到该值,也未触发该值。然后,当计数器增加到2时,触发
警报
。
Prometheus
: error_in_execution --> No Metric Exsi
浏览 3
提问于2021-03-08
得票数 1
1
回答
Prometheus
警告flink失败的作业?
、
我正在尝试
使用
Prometheus
警报
监视我的flink作业的可用性。我尝试过
使用
flink_jobmanager_ job _uptime/downtime指标,但它们似乎不适合,因为它们只是在作业失败/完成后停止发送。我已经被指出了numRunningJobs指标,以便在缺少作业时发出
警报
。我不想
使用
这个解决方案,因为
每次
我想要部署一个新作业时,我都必须更新我的
prometheus
配置。是否有人
使用
Pr
浏览 2
提问于2019-12-20
得票数 0
1
回答
prometheus
能否动态地找到
警报
管理器而不重新启动?
我运行
prometheus
和alertmanager在k8s集群中的豆荚上,我希望
prometheus
能够动态地找到alertmanager,当alertmanager pod启动时,将它添加到它的配置文件中而不重新启动它自己,因为如果
prometheus
停止它意味着承载
prometheus
结束的pod,有什么方法可以做到吗?
浏览 2
提问于2018-11-15
得票数 0
回答已采纳
1
回答
使用
Prometheus
中的度量监视批处理作业的状态
、
、
、
、
这些批处理作业是Python脚本,它们
使用
Prometheus
Pushgateway将指标值推送到
Prometheus
,并且我们有一些规则,可以在这些指标无效(例如,超过某个阈值)时触发
警报
(在Alertmanager我们现在还想
使用
Prometheus
指标来仔细检查批处理作业本身是否正确运行:例如,作业是否按时启动?是否发生了任何错误?作业是否运行到完成?为此,我们希望更改Python脚本,以便在脚本开始和结束以及发生任何错
误时
推送一个指标。然而,这确实带来了一些问
浏览 42
提问于2020-07-13
得票数 3
回答已采纳
1
回答
监视在GKE上运行的Cron作业
、
、
、
、
如果CronJob运行的时间不超过X,并且Stackdriver似乎不支持这一点,我想触发一个
警报
。目前,我尝试
使用
基于日志指标的
警报
,但这只能在应用程序崩溃或特定错
误时
发出
警报
,而不是针对平台错误本身。 我研究了一个
使用
Prometheus
警报
的解决方案,它能集成到Stackdriver中吗?更新:只是一个后续,最终开发了一个简单的解决方案,
使用
基于日志的
警报
在Stackdriver上。如果日志在X时间之后没有<e
浏览 1
提问于2019-09-16
得票数 4
2
回答
普罗米修斯:是否可以在普罗米修斯web用户界面中
创建
/配置
警报
组?
我已经开始着手
创建
警报
组以简化UI中的浏览,但我还不能了解如何在
prometheus
UI中配置“
警报
组”,这将最终
出现
在端点/alerts上。是否有可能在
Prometheus
中配置“
警报
组”,以便能够更轻松地浏览UI?需要明确的是:
Prometheus
UI的/alerts端点包含大量我共同配置的
警报
,我希望在UI中以可视方式对它们进行分组,这样我就可以打开一个名为System的组和另一个名为APIs的组,依此
浏览 44
提问于2019-03-06
得票数 2
1
回答
普罗米修斯
我正在尝试让
Prometheus
通过
警报
管理器发送
警报
,这两者都在Docker容器中。我已经成功地通知了
Prometheus
,但是没有将这些
警报
传递给同一台主机上的
警报
管理器。这两个容器都可以从指定的卷中正确安装,您可以
使用
WebUI来检查这些卷。然而,当我触发一个
警报
,它显示为开火。
警报
管理器中没有
出现
警报
。:/etc/
prometheus
/
浏览 0
提问于2016-09-06
得票数 0
回答已采纳
2
回答
如何
使用
Prometheus
警报
管理器在Kubernetes中触发
警报
、
、
我已经在集群()中设置了kube-
prometheus
。它包含一些默认
警报
,如"CoreDNSdown等“。如何
创建
自己的提醒?有没有人可以给我提供一个示例,让我
创建
一个可以发送电子邮件到我的gmail账户的
警报
? 我关注了这个。但我不能让它工作。
浏览 10
提问于2018-11-30
得票数 5
1
回答
如何使
警报
规则在
Prometheus
用户界面上可见?
、
、
我正试图在
Prometheus
中设置一些
警报
规则,以便在实例关闭时可以发出
警报
,但是当我单击
prometheus
上的“规则”图标时,我发现没有设置用于
警报
的配置规则。我正在我的计算机上进行本地测试,我在下面列出了对接者
prometheus
、
警报
管理器、prom node_exporter和其他一些应用程序。 请帮帮我..。
prometheus
.yml文件,如PWD - /Users/spencer.ecas/
浏览 3
提问于2022-04-26
得票数 0
回答已采纳
3
回答
-在维护过程中,如何在给定的一段时间内保持所有
警报
的沉默?
、
我目前无法讨论的一个工作场景是,我希望设置一个维护模式,这意味着从
Prometheus
接收到的所有
警报
都将被忽略,我希望能够通过UI设置它,直到维护完成为止。一种方法是手动开始覆盖每个
警报
,这在
Prometheus
-操作符场景中是不正常的,否则我会损失几个小时。我可以将配置从秘密更改为将所有配置路由为null,但这是不实际的,因为它需要多个操作,而且对按时
使用
或其他用户
使用
也不好。所以我试着用regex作为键和值。两者都设置为.* .* regex。在预览中,我得到了所有
警报</
浏览 0
提问于2020-06-22
得票数 7
回答已采纳
1
回答
Prometheus
K8s extraConfigmapMounts未能将多个文件加载到同一个目录
、
、
、
、
Prometheus
问题:我在Helm上
使用
prometheus
,我想在同一个位置/etc/config/alrtingRules上挂载几个.yml文件--在git中,这些文件作为不同的文件保持分离是至关重要的我尝试过将它们安装到自己的configMap上,并
使用
"extraConfigmapMounts“将它们全部放置在位置上,但我面临着困难。subPath: app2.yml readOnly: true
浏览 5
提问于2022-06-13
得票数 0
回答已采纳
1
回答
如何对PromQL执行适当的查询以获得
prometheus
的增长率
、
、
每次
我请求increaseUrl的api时,响应时间被设置为随着时间步长增加1毫秒。假装这个api没有能力处理这样数量的请求。
每次
我请求stableUrl的api时,都没有其他设置,只需立即返回“成功”即可。通过
使用
> 0判断,您可以看到increasUrl的图形总是大于0,而stableUrl不会
出现
这种情况。 groups: rules: - alert: automati
浏览 6
提问于2022-07-06
得票数 0
回答已采纳
2
回答
使用
指标名称而不是指标标签进行匹配
、
我的一个导出器打印了一个没有标签的指标: $ curl -s http://localhost:9999/metrics | grep service_up | grep -v "#" service_up 1 在
创建
AlertManager接收器时,我通常
使用
match的度量标签之一(例如,job: 'nodeexporter-textcollector')。
浏览 60
提问于2021-05-07
得票数 0
回答已采纳
1
回答
如何在grafana中处理生成和
使用
的消息的度量和
警报
、
、
、
我在
创建
指标和稍后基于该指标触发
警报
时遇到了问题。我有两个数据源,都是elasticsearch。我想要实现的是,如果生产消息与消费消息的比例降至1以下,则触发
警报
。 不幸的是,不可能
使用
prometheus
,原因有两个: 1)
每次
重新启动服务时,计数器都会重置。2)第二个服务没有(也不会在合理的时间内)与
prometheus
集成。 问题是如何基于该数据源处理指标和
警报
?有可能吗?也许还有其他方法可以实现我的目标?
浏览 21
提问于2020-04-23
得票数 0
1
回答
异常情况下的
警报
、
、
我开发的服务很少,我希望能够在
出现
错误或失败的情况下做出快速反应。这些服务将指标公开给
prometheus
,我通过slack收到
警报
。日志在kibana中可用。
浏览 0
提问于2020-07-01
得票数 1
1
回答
如果错误计数增加,在grafana中
创建
警报
的查询是什么?
、
、
、
、
将
prometheus
集成到我的springboot应用程序中,并
使用
千分尺计算应用程序中
出现
的异常,然后添加到
prometheus
,如下所示: } error_count.increment(); } 已将
prometheus
如果异常计数中有任何增量,那么如何在grafana中引发
警报
,则需要在<e
浏览 4
提问于2022-10-07
得票数 0
1
回答
删除kube-
prometheus
-堆栈
警报
管理器CRD并且无法安装
警报
管理器
、
因此,我
使用
堆栈版本36.x,并看到最新版本有一个本地电报配置用于
警报
管理器,而不是
使用
另一个客户端电报web钩子。kubectl apply --server-side -f https://raw.githubusercontent.com
prometheus
社区/kube堆栈-f my_value_file.y
浏览 11
提问于2022-08-16
得票数 0
1
回答
Helm 3安装多个配置文件
、
、
我们
使用
的是
prometheus
操作符稳定的舵机,。知道如何传递
警报
管理器的配置吗?grafana:alertmanager: alertm
浏览 5
提问于2019-12-24
得票数 2
回答已采纳
0
回答
普罗米修斯:在某种情况下保持警觉的最佳方式是什么?
、
我正在
使用
Prometheus
为一个java应用程序收集指标。在我的应用程序中,我通过API调用进行身份验证。我正在为
Prometheus
设计最好的方法,以便在API身份验证失败时向我的电子邮件发送
警报
。我正在考虑
使用
一个仪表,将其初始化为0,如果身份验证失败,则将仪表值增加为1 --这将触发一个监视仪表的值的
警报
(如果仪表> 0,则触发一个
警报
)。 一旦身份验证成功,我将把量规的值恢复为0。这是在
Prometheus
中
创建
自定
浏览 8
提问于2018-07-09
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Prometheus 监控实战(三):Prometheus 架构
如何用Prometheus和Grafana监控Kubernetes集群?
使用Python实现任务调度监控系统
Prometheus正式从CNCF毕业
16 张图实战 Prometheus 自定义告警规则
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券