数据湖计算 DLC 提供了基于腾讯云可观测平台服务的接入点网关引擎的监控服务,保障您能实时了解网关情况。
使用须知
使用数据湖计算 DLC 的监控服务前,您需要开通腾讯云可观测平台服务(使用详情可参见 腾讯云可观测平台文档)。如暂未开通该服务,可使用主账号开通该服务。
腾讯云可观测平台服务使用过程中可能产生相关资费,详细资费信息参见 腾讯云可观测平台计费概述。
监控入口
入口一:数据湖计算 DLC 控制台
1. 登录数据引擎 > 标准引擎 页面,择服务地域。
2. 选择标准引擎,在接入点处单击监控,即可进入监控数据展示界面。
监控数据展示界面如下:
配置入口:腾讯云可观测平台
1. 登录 腾讯云可观测平台控制台,登录账号需具备相关权限。
2. 左侧菜单选择云产品监控,进入告警管理的策略管理页面,选择数据湖计算选择对应的接入点网关引擎。
接入点网关引擎监控配置类型
新建告警策略
2. 单击新建策略,策略类型选择“数据湖计算”。接入点网关支持三种维度的告警,其中:
“网关”告警维度为:appid/gatewayid。
“网关(多维)”告警维度为:appid/gatewayid/instanceid。
“网关引擎(多维)”告警维度为:appid/gatewayid/engineid/processid。
名称 | 支持维度 | 优势及适用场景 |
网关(多维) | 支持:CPU、内存、磁盘、网络细粒度告警。 例如:对接入点网关的 CPU 利用率进行告警配置,可以选择配置某个接入点网关下的一个、多个实例或者任意一个实例节点触发阈值就告警。 | 告警支持的维度更多,告警方式更加灵活。 基础指标推荐使用此方式。 |
网关 | 主要针对当前网关整体负载情况进行监控,对基础指标按照接入点网关节点进行聚合,同时支持服务级别的指标告警。 例如:execute_statement_num(执行 statement 数量),opened_operation_num(打开的 operation 数量),
launch_engine_num(启动的引擎数量),engine_process_thread_num(engine 启动的线程数)。 | 支持 Dashboard。适用于单节点接入点网关或者需要对服务指标告警。 |
网关引擎(多维) | 网关引擎指接入点网关对启动 DLC 引擎的进程进行监控告警。 例如:
engine_process_thread_num(engine 启动的线程数),主要针对当前接入点网关启动的引擎的进程信息进行监控 | 支持细粒度告警,例如:常配置某个接入点网关 ID 下任意一个引擎的进程数达到阈值就告警。适用于对接入点网关启动的进程指标告警。 |
配置监控项示例
网关(多维)配置
示例1:配置某个接入点网关接入点id的任意一个实例的 CPU 使用率达到90%或者内存使用率达到80%告警,配置如下图所示:
示例2:要配置某个接入点网关id的其中一个或者多个实例的 CPU 使用率达到90%告警(这种配置方式只能对选中的实例进行告警,集群重建后需要重新配置),配置如下图所示:
网关配置
示例1:配置某个接入点网关 ID 中的执行的 statement 数量大于100告警,配置如下图所示:
网关引擎(多维)
示例1:配置某个接入点网关 ID 中启动的任意引擎进程中线程数量达到500告警,配置如下图所示:
示例2:配置某个接入点网关 ID,某个引擎中任意一个进程的线程数达到500告警,配置如下图所示: