接入点网关引擎监控

最近更新时间:2023-12-08 15:00:22

我的收藏
数据湖计算 DLC 提供了基于腾讯云可观测平台服务的接入点网关引擎的监控服务,保障您能实时了解网关情况。

使用须知

使用数据湖计算 DLC 的监控服务前,您需要开通腾讯云可观测平台服务(使用详情可参见 腾讯云可观测平台文档)。如暂未开通该服务,可使用主账号开通该服务。 腾讯云可观测平台服务使用过程中可能产生相关资费,详细资费信息参见 腾讯云可观测平台计费概述

监控入口

入口一:数据湖计算 DLC 控制台

1. 登录数据引擎 > 标准引擎 页面,择服务地域。
2. 选择标准引擎,在接入点处单击监控,即可进入监控数据展示界面。



监控数据展示界面如下:




配置入口:腾讯云可观测平台

1. 登录 腾讯云可观测平台控制台,登录账号需具备相关权限。
2. 左侧菜单选择云产品监控,进入告警管理的策略管理页面,选择数据湖计算选择对应的接入点网关引擎。




接入点网关引擎监控配置类型

新建告警策略

1. 数据湖计算 DLC 接入点网关支持告警能力,进入腾讯云可观测平台,单击告警管理,选择策略管理页
2. 单击新建策略,策略类型选择“数据湖计算”。接入点网关支持三种维度的告警,其中:
“网关”告警维度为:appid/gatewayid。
“网关(多维)”告警维度为:appid/gatewayid/instanceid。
“网关引擎(多维)”告警维度为:appid/gatewayid/engineid/processid。
名称
支持维度
优势及适用场景
网关(多维)
支持:CPU、内存、磁盘、网络细粒度告警。
例如:对接入点网关的 CPU 利用率进行告警配置,可以选择配置某个接入点网关下的一个、多个实例或者任意一个实例节点触发阈值就告警。
告警支持的维度更多,告警方式更加灵活。
基础指标推荐使用此方式。
网关
主要针对当前网关整体负载情况进行监控,对基础指标按照接入点网关节点进行聚合,同时支持服务级别的指标告警。
例如:execute_statement_num(执行 statement 数量),opened_operation_num(打开的 operation 数量), launch_engine_num(启动的引擎数量),engine_process_thread_num(engine 启动的线程数)。
支持 Dashboard。适用于单节点接入点网关或者需要对服务指标告警。
网关引擎(多维)
网关引擎指接入点网关对启动 DLC 引擎的进程进行监控告警。
例如: engine_process_thread_num(engine 启动的线程数),主要针对当前接入点网关启动的引擎的进程信息进行监控
支持细粒度告警,例如:常配置某个接入点网关 ID 下任意一个引擎的进程数达到阈值就告警。适用于对接入点网关启动的进程指标告警。




配置监控项示例

网关(多维)配置

示例1:配置某个接入点网关接入点id的任意一个实例的 CPU 使用率达到90%或者内存使用率达到80%告警,配置如下图所示:


示例2:要配置某个接入点网关id的其中一个或者多个实例的 CPU 使用率达到90%告警(这种配置方式只能对选中的实例进行告警,集群重建后需要重新配置),配置如下图所示:




网关配置

示例1:配置某个接入点网关 ID 中的执行的 statement 数量大于100告警,配置如下图所示:




网关引擎(多维)

示例1:配置某个接入点网关 ID 中启动的任意引擎进程中线程数量达到500告警,配置如下图所示:



示例2:配置某个接入点网关 ID,某个引擎中任意一个进程的线程数达到500告警,配置如下图所示: