找到当前对公网带宽消耗最大的 10 台服务器”;
容量规划: 比如”分析过去一个月某类型服务的资源用量”;
高级报警: 比如”对比过去一周的指标值, 根据标准差进行报警”;
整合业务监控: 业务的监控信息存在于另一套监控系统中...而对于阿里云 Exporter 而言, 由于阿里云有数十种类型的资源(RDS, ECS, SLB…), 因此我们无法推测用户到底希望抓哪些监控信息, 因此只能全部交给用户配置....当然, 项目还是提供了包含 SLB, RDS, ECS 和 Redis 的默认配置文件, 尽力做到开箱即用....比如 “IP” 这样的标签, 假如我们只知道 ECS ID 而不知道 IP, 那么根本对不上号, 排查问题也会异常麻烦....1
当 aliyun_acs_rds_dashboard_MemoryUsage_up 这个指标出现 0 的时候, 我们就能知道 aliyun rds 内存信息的抓取不正常, 需要报警出来人工介入处理了