前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >EMR入门学习之集群的监控与告警(四)

EMR入门学习之集群的监控与告警(四)

原创
作者头像
披荆斩棘
修改2019-11-14 10:40:55
1.5K0
修改2019-11-14 10:40:55
举报
文章被收录于专栏:乘风破浪

一、集群监控

监控入口

登录【控制台】,选择【弹性MapReduce】进入左侧的【集群监控】,可以看到监控分为服务监控与主机监控

如下图可以看到服务监控主要是一些集群组件的监控:

下面的主机监控主要是CPU、内存、文件句柄、磁盘、网络、进程等指标的监控:

二、告警策略

所谓告警策略,就是当你的集群发生异常时,你对集群进行了监控,也就是制定了策略,那么发生异常的这个事件将会告知给你选择的接收人,并且针对不同的策略类型做了不同的触发条件,同样也有不同的告警接受渠道。

相关说明

告警触发条件是指标、比较关系、阈值、统计周期和持续周期组成的一个有语义的条件。例如指标为“CPU 利用率” 、比较关系为 > 、阈值为 80% 、统计周期为5分钟 、持续周期为 2个周期表示:每5分钟收集一次 CPU 利用率数据,若某台云服务器的 CPU 利用率连续三次大于80%则触发告警。

您可以为您的每一条告警规则设置重复通知策略。即当告警产生时,您可以定义告警以特定的频率重复通知。 可选:不重复、5分钟、10分钟、周期指数递增...等重复频率。 周期指数递增的含义是当该告警第1次、第2次、第4次、第8次...第2的N次方次被触发时,向您发送告警信息。意义是告警信息发送时长间隔将越来越长,一定程度上避免重复告警对您的骚扰。

重复告警默认逻辑:

  • 告警产生后的24小时内,将按您设定的重复通知频率重复给您发送告警信息。
  • 告警产生满24小时,将默认切换为1天通知1次的策略进行重复通知。
  • 告警产生满72小时,发送最后一次告警信息,过后不再重复发送此条告警的告警信息。

告警入口

进入【控制台】,【云监控】左侧【告警配置】如下图:

创建告警策略

  • 单击【新增】,配置告警策略。
  • 配置基础选项,配置说明如下。
  • 策略名称:填写策略名称。
  • 备注:填写策略备注。
  • 策略类型:选择监控项。
  • 所属项目:根据需求选择项目。
  • 配置告警对象。
  • 选中全部对象,则该告警策略绑定当前账号的全部实例。
  • 选中选择部分对象,则该告警策略绑定用户选中的实例。
  • 选中选择实例组,则该告警策略绑定用户选中的实例分组。
  • 设置告警触发条件。有两种方式,触发条件模板和配置触发条件,您可选择其中一种触发条件。
  • 触发条件模板 开启触发条件模板,并在下拉列表选择已配置的模板,具体配置请参阅 配置触发条件模板 文档。若新建的模板没有显示,则单击右侧的【刷新】,即可刷新触发告警模版选择列表。
  • 配置触发条件 开启配置触发条件,触发条件分为指标告警和事件告警。 告警触发条件是指标、比较关系、阈值、统计周期和持续周期组成的一个有语义的条件。例如指标为 CPU利用率 、比较关系为 > 、阈值为 80% 、统计周期为 5 分钟 、持续周期为 2 个周期 表示:每 5 分钟收集一次CPU利用率数据,若某台云服务器的 CPU 利用率连续两次大于80%则触发告警。 您可以为您的每一条告警规则设置重复通知策略。即当告警产生时,您可以定义告警以特定的频率重复通知。 可选:不重复、5分钟、10分钟、周期指数递增...等重复频率。 周期指数递增的含义是当该告警第1次、第2次、第4次、第8次...第2的N次方次被触发时,向您发送告警信息。意义是告警信息发送时长间隔将越来越长,一定程度上避免重复告警对您的骚扰。
  • 配置告警渠道。 根据需求,配置告警接收组、有效时段、接收渠道(邮件、对象、微信)。

注意: 云服务器告警需要云服务器实例 安装监控控件 上报监控指标数据后才能正常发送。在云产品监控页面可以查看未安 装监控 agent 的云服务器,并下载 IP 列表。

  • 您可以将已有的策略设为默认告警策略,新购买的云服务器会自动关联默认策略。

注意:

  • 每种策略类型每个项目仅有一个默认策略。
  • 设置为默认的告警策略不可删除。
  • 为方便用户操作,云监控会自动创建默认云服务器策略(告警触发条件为磁盘只读、ping 不可达)和默认云数据库策略(磁盘占用空间 > 90MB或磁盘使用率 >80% 持续5分钟)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、集群监控
    • 监控入口
    • 二、告警策略
      • 相关说明
        • 告警入口
          • 创建告警策略
          相关产品与服务
          弹性 MapReduce
          弹性 MapReduce (EMR) 是基于云原生技术和泛 Hadoop 生态开源技术的安全、低成本、高可靠的开源大数据平台。提供易于部署及管理的 Hive、Spark、HBase、Flink、StarRocks、Iceberg、Alluxio 等开源大数据组件,帮助客户高效构建云端企业级数据湖技术架构。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档