腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(915)
视频
沙龙
1
回答
pod
重新
启动时
发出
警报
:
windows
容器
上
的
Prometheus
、
、
、
我为
Windows
容器
设置了
Prometheus
,它抓取了wmi_exporter支持
的
指标。但我想要一些跟踪
pod
重启
的
指标,等等,这些都不是其中
的
一部分。但我找不到任何方法将其安装在
Windows
容器
上
。我在网上找到
的
所有helm charts都有只能与Linux
容器
一起使用
的
图像。那么,有没有办法把它安装在
Windows
容器</em
浏览 40
提问于2019-04-23
得票数 3
回答已采纳
3
回答
普罗米修斯怎么知道一个吊舱什么时候坠毁
的
?
、
、
、
我理解普罗米修斯,我们可以建立
警报
规则,可以检测和提高
警报
,如果一个吊舱崩溃。 普罗米修斯从库伯奈特斯那里得到了舱内状态信息吗?我之所以问这个问题,是因为我想设置
Prometheus
来监视我已经部署
的
现有的吊舱。我想要被警告如果一个吊舱不断崩溃,或如果它被困在待定状态。我想知道
Prometheus
是否能够检测到
浏览 0
提问于2018-07-18
得票数 3
回答已采纳
1
回答
k8s
Prometheus
:
pod
有未绑定
的
PersistentVolumeClaims
、
我在我
的
win10机器
上
的
两个virtualbox(Centos7.4)中安装kube1.10.3。我用git克隆来获取
prometheus
yaml文件。普罗米修斯
的
日志
上
写着:Error from server
prometheus
-server] or one of the init con
浏览 0
提问于2018-07-17
得票数 5
回答已采纳
1
回答
我怎样才能提醒用普罗米修斯规则
重新
启动
的
吊舱?
、
、
我喜欢使用
Prometheus
规则监视豆荚,这样当荚
重新
启动时
,我就会收到
警报
。我想知道是否有人有
Prometheus
的
警告规则是这样
的
,但为了
重新
启动 annotations: message:
Pod
{{ $labels.namespace }}/{{ $labels.
pod
}} ({{ $labels.c
浏览 0
提问于2021-03-31
得票数 1
1
回答
prometheus
能否动态地找到
警报
管理器而不
重新
启动?
我运行
prometheus
和alertmanager在k8s集群中
的
豆荚
上
,我希望
prometheus
能够动态地找到alertmanager,当alertmanager
pod
启动时
,将它添加到它
的
配置文件中而不
重新
启动它自己,因为如果
prometheus
停止它意味着承载
prometheus
结束
的
pod
,有什么方法可以做到吗?
浏览 2
提问于2018-11-15
得票数 0
回答已采纳
2
回答
Prometheus
警报
CPUThrottlingHigh升高,但监控没有显示
、
、
、
我已经安装了
Prometheus
来监视我
的
安装,它经常
发出
有关CPU节流
的
警报
。识别此
警报
的
Prometheus
警报
规则是:expr: 100 > 25如果我看一下这个
警报
所识别的一个吊舱,它似乎没有任何理由节流:
浏览 0
提问于2019-02-27
得票数 8
回答已采纳
1
回答
10分钟后停用普罗米修斯
警报
、
我有一个kubernetes集群,用于监视和
警报
,我正在使用
Prometheus
。
Prometheus
警报
管理器不断重复这些
警报
,直到它们处于活动状态。我希望将我
的
警报
管理器配置为只向空闲发送一次
警报
,并且只有在
警报
状态发生变化时才重复该
警报
。我尝试只在特定时间生成
警报
,如下所示 (kube_
pod
_container_status_restarts_total > 3) *
浏览 0
提问于2019-04-21
得票数 2
1
回答
如何在
prometheus
operator中收到配置重载器错误
的
通知或
警报
?
、
、
、
我使用
prometheus
操作符在kubernetes上部署监控堆栈。我想知道是否有一种方法可以知道配置重载程序部署
的
配置是否失败。这对于使用配置
重新
加载程序
容器
重新
加载其配置
的
prometheus
和
警报
管理器资源是有效
的
。当配置失败时。我们在
容器
中有一个日志,但是基于失败
的
配置
重新
加载,我们可以有一个通知或
警报
吗?
浏览 13
提问于2019-04-10
得票数 2
回答已采纳
3
回答
如何告警
容器
重启?
、
我喜欢使用
Prometheus
和cAdvisor监控
容器
,这样当
容器
重新
启动时
,我就会收到
警报
。我想知道有没有人对此有普罗米修斯
警报
样本。
浏览 1
提问于2017-01-04
得票数 24
2
回答
k8s中
的
Prometheus
(度量)
、
我使用手册在kubernetes部署
prometheus
作为一种存储方案被发明出来:库伯奈特斯
的
Prometeus在24小时内存储这些指标。普罗米修斯不在库伯奈特斯,而是在一周内储存这些指标。他们所面对
的
事实是,在经过一段时间(少于24小时)之后,在移除豆荚之后,它
上
缺少了度量标准。
浏览 6
提问于2017-11-17
得票数 0
回答已采纳
1
回答
CPU使用率低于一个阈值和多个节点存在-
Prometheus
我试图在
prometheus
中创建一个
警报
规则,以便在最后3分钟内标签为agentpool="worker“
的
所有节点
的
avg使用率低于30%时,它就会
发出
警报
。现在,在最后3分钟使用CPU不足30%
的
节点
上
,我可以获得
警报
。has been lower than 30% for last 3 minutes (current value is {{$value}}) 为了只对具有agentpool="worker
浏览 3
提问于2018-02-18
得票数 0
1
回答
减少对失败ECS任务
的
SNS
警报
、
、
、
、
我已经创建了ECS任务,但由于它
的
失败和
警报
服务,我使用了SNS集成与我
的
松弛通道。当
容器
无法
启动时
,...it
发出
警告,并且它具有每次
重新
启动直到手动停止为止
的
属性,而且每次
重新
启动时
,..it都会
发出
警报
,...I想要减少这些
警报
,我是否可以这样做?请help...below两种情况下使用
的
代码:
浏览 1
提问于2022-06-23
得票数 0
1
回答
Prometheus
dns服务在码头群重标实例中
的
发现
、
、
、
我
的
问题是对
的
补充。我将
prometheus
的
刮刮目标定义如下: dns_sd_configs: - 'tasks.nodeexporter' port: 9100r
浏览 0
提问于2018-06-29
得票数 2
回答已采纳
1
回答
使用
Prometheus
查找
重新
启动
的
容器
的
名称
、
目前,我正在使用以下查询 sum(rate(kube_
pod
_container_status_restarts_total{namespace="default"}[5m])) 在默认命名空间中
重新
启动一个或多个
容器
时
发出
警报
这给了我
重新
启动
的
容器
的
数量,但没有给出它们
的
名称。有没有办法获得
重新
启动
的
容器
的
名称? 谢谢你。
浏览 38
提问于2020-11-26
得票数 0
回答已采纳
1
回答
普罗米修斯在吊舱运行太久时
发出
警报
、
、
、
一旦豆荚完成了它
的
任务,它就完成了产生它
的
任务。kube_
pod<
浏览 1
提问于2020-06-03
得票数 2
回答已采纳
1
回答
地堑中
的
Prometheus
Pods重启
、
、
我希望有一个普罗米修斯图在Grafana显示(作为一个列图表)
重新
启动
的
豆荚
的
数量。谢谢
浏览 1
提问于2018-10-19
得票数 5
回答已采纳
2
回答
GKE中指标-服务器-保姆
容器
的
CPUThrottlingHigh
警报
、
、
、
、
我注意到我
的
一些集群报告了GKE中
的
metrics-server-nanny
容器
(图片:gke.gcr.io/ CPUThrottlingHigh -resizer:1.8.11-gke.0)
的
警报
。我看不到一种方法来配置这个
容器
来为它提供更多
的
CPU,因为它是作为metrics-server
pod
的
一部分自动部署
的
,而且Google会自动重置对部署/
pod
资源设置
的<
浏览 3
提问于2021-06-13
得票数 0
1
回答
如何在码头
容器
中动态管理普罗米修斯file_sd_configs?
、
、
、
、
我一直在本地运行
的
node.js应用程序中使用targets.json,以便为
prometheus
动态添加ip地址,以便将服务发现作为file_sd_configs选项进行探测。它运行得很好。我能够添加新
的
ip并从节点应用程序执行
prometheus
reload api,监控这些ip并
发出
警报
(使用blackbox和alert管理器)。然而,现在应用程序和
prometheus
在同一个网络
上
的
docker内部运行。如何使我
的<
浏览 21
提问于2019-10-29
得票数 0
1
回答
pod
容器
因内存不足销毁导致重启
的
可能原因是什么?
、
我在我
的
系统
的
pod
中运行了以下部署: apiVersion: v1metadata:spec: memory: 1Gi memory: 256Mi Reason: OOMKill
浏览 81
提问于2020-09-15
得票数 0
1
回答
在普罗米修斯中将两个不同
的
指标分组后如何划分?
、
我目前正在尝试提醒可用区内
的
Kubernetes pods堆叠。我已经设法使用了两种不同
的
度量标准,这样我就可以看到在特定
的
可用区
上
运行了多少个应用程序
的
pod
。然而,由于可伸缩性,我希望
警报
是百分比based...so,当特定百分比
的
pods在一个可用区
上
运行(即超过70%)时,我们可以
发出
警报
。4 db-1个
pod
,而az1
上
堆叠了1个
pod
浏览 18
提问于2019-01-14
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
11个Kubernetes集群监控工具
11个Kubernetes集群监控工具,收藏了
深入理解 VPA Recommender
K8s + SpringBoot实现零宕机发布
Prometheus 监控实战(三):Prometheus 架构
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券