作为 Apache Doris 的智能管理工具,Doris Manager 提供一键部署、实时监控、弹性扩缩容、升级重启等核心功能,并支持告警、日志、审计、巡检等高级运维能力。历经千家企业验证,24.3 版本更稳定高效,让集群管理更简单!在新的版本中,Doris Manager 丰富了集群巡检,监控等能力。
在 Doris Manager 24.3 版本中,对以下内容进行了优化改进:
智能集群巡检:
稳定部署保障:
高效监控运维:
流畅操作体验:
详细优化与更新功能可以参考 Doris Manager 24.3.0 release notes。
在 Doris Manager 24.3 版本中,重构了集群巡检功能,为了直观的感受巡检功能的丰富,我们特此录制了巡检能力的 Demo,具体见下方视频:
<video width="100%" controls poster=""><source src="https://cdn.selectdb.com/static/5_16_e25ca7ca20.mov" type="video/mp4" /></video>
本次版本更新一共新增了五类巡检项功能:
在设置集群巡检时,可以开启定期巡检,在特定时间周期性的对集群进行检查,并保存巡检报告。如在本例中指定每天两点进行巡检,巡检后通过邮箱与企业微信进行巡检信息推送。巡检会对集群数据进行扫描,占用集群 IO 资源,建议避开集群资源高峰时进行巡检。
在巡检后,可以从巡检报告中查看巡检结果与建议。Doris Manager 针对以下内容给出巡检建议:
如下例中,对集群参数进行了检查,列出了非默认参数,并针对参数 enable_profile 给出了修改意见。
用户可以根据业务自定义巡检项,通过脚本添加巡检项。如在下例中,添加了 CheckBadTablet 与 CheckSwapOff 两个用户自定义巡检项,关闭 CheckBadTablet 巡检项,打开 CheckSwapOff 巡检项。
$ cat webserver/inspection/script/user-defined-tasks.json
{
"tasks": [
{
"name": "CheckBadTablet",
"source": "DORIS",
"reason": "ensure tablets are all healthy.",
"script": "check-bad-tablet.sh",
"timeout": 600,
"enabled": false
},
{
"name": "CheckSwapOff",
"source": "AGENT",
"reason": "doris be requires swap off.",
"script": "check-swap-off.sh",
"timeout": 600,
"enabled": true
}
]
}
自定义巡检支持两种脚本定义类型:
通过 user-defined-tasks.json 可以关联用户自定义脚本,在巡检时会对自定义项进行巡检操作。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。