温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
如何使用主机监控?主机监控是监控系统的重要功能之一。我们可以采集到主机操作系统相关的指标。如CPU、内存、硬盘、网卡、网络连接等多种指标。首先我们进入蓝鲸监控平台。在菜单页进入主机监控。在这个页面,我们可以看到主机列表和当前的指标数据。同时,我们可以查看主机的数据采集状态。应用内存的使用率以及当前机器运行的进程等信息。同时支持对不同的状态进行筛选,如告警未恢复的主机。CPU使用率超过80%的主机应用内存使用率超过80%的主机等。另外,蓝鲸监控平台还提供了字段显示,可以根据不同的需求进行显示。同时还提供了强大的搜索功能,支持按集群模块不同字段的多种组合方式进行搜索。例如这里搜索目前CPU使用率超过30%的主机。点击IP右侧的置顶,则可以将我们需要特殊关注的主机放在第一行的位置。
01:03
点击具体的IP,可以切换到查看该IP的视图模式。可以在这个界面查看该IP的可视化指标。左侧这里是一个树形结构,展示该IP所在业务的CMDB拓扑结构。顶部可以设置查询的时间范围,页面刷新的周期。以及想要展示出来的图的个数。右侧这边是所选IP的相关属性展示,如采集状态、所属的集群模块等信息。默认页面只展示了部分指标的图,我们可以点击视图排序来展示更多指标图,同时我们可以对不关心的指标进行隐藏。如果需要对比不同的IP下相同的指标,可以选择目标对比功能。通过页面的视图,我们可以排查多个关键指标的差异,从而找到系统指标的差异情况,为排查问题提供有效的数据。那么采集状态异常的话需要怎么处理呢?在安装蓝鲸agent之后,默认是会正常采集主机监控数据的,如发现采集异常,则需要关注采集器的运行状态,打开蓝鲸节点管理,进入插件管理,对需要更新插件的IP更新主机监控插件。
02:07
这里我们演示更新support插件。选择新包执行结束后,插件就更新成功了。采集状态显示正常及代表正在采集主机数据,那么数据是如何被采集的呢?采集器定期从系统收集数据,数据发送给g SE agent,然后g agent将数据转发给数据管道。数据管道将数据写入到消息队列,然后监控后端,从消息队列消费数据最后存储到监控的时序数据库。以上就是数据从采集到展示的全部流程了。
我来说两句