模型管理

最近更新时间:2025-12-11 11:04:52

我的收藏

概述

模型管理,即通过共有标识(如用户 ID、订单号、商品编码等)建立数据表之间的关联规则,让原本独立的表(或数据集)产生逻辑连接。例如,“用户表”(含用户 ID、姓名)和 “订单表”(含用户 ID、订单金额)可通过 “用户 ID” Join,从而得到 “每个用户的订单消费情况”。仅支持选择 StarRocks 、TCHouse-D和Doris共3种类型数据源,且该数据源为授权本项目的数据源。

准备工作

1. 确保按照 前置准备完成准备工作。
2. 确保当前用户拥有数据治理 > 语义建模 > 模型管理的只读权限或读写删权限。
说明:
读写删权限:拥有读写删权限的人可以管理本项目下所有模型的查看、编辑、发布、下线、删除等操作。
只读权限:拥有只读权限的人可以查看本项目所有模型,可新建模型,但是只能编辑、发布、下线、删除自己是负责人的模型。

新建/编辑模型

1. 进入数据治理 > 语义建模 > 模型管理。
2. 单击模型列表上方的“新建模型”按钮。
3. 进入新建模型页面,如下图1所示。在画布左侧选择数据源、catalog,可以看到所选 catalog下所有数据库,单击库名称前的箭头可展开数据库下的表,单击选中表可将其拖动到画布区域。
图1. 新建/编辑模型
图1. 新建/编辑模型

区域
简介
左侧:表列表
展示选择数据源、各个catalog下的库表list,单击数据库名前的箭头可展开数据库下的表,选中表可将其拖动到画布区域。注意,此处展示的数据源仅为归属当前项目或授权给当前项目的数据源,仅支持 StarRocks 、TCHouse-D 和 Doris 共3种类型数据源。
右侧:画布区域
可配置被拖动到画布区域的表、字段信息,并配置表与表之间的关联关系。注意:对于已经采集了元数据的表(单击此处查看如何进行元数据采集),可单击表名查看表详情,未采集元数据的表不支持查看表详情。
也可单击画布中表右上角的...按钮,选择“配置维度&字段”,可查看当前表的字段列表(含虚拟字段)、以及当前表上配置的维度列表。
右侧下方:维度和指标列表
维度列表:展示拖入画布区的表中,已经配置的维度,您也可以根据分析场景,新建维度和编辑已有维度。
指标列表:展示基于当前模型创建的所有原子指标和衍生指标。如果当前模型未发布,不可基于该模型创建指标。
顶部:操作区域
左上角展示当前模型英文名、模型别名、模型描述、负责人信息,可以单击小笔编辑;右上角可发布当前模型或取消对当前模型的修改操作。
4. 鼠标单击连接画布区表信息卡片左右的圆点,即可在弹窗中配置两个表之间的关联关系,如图2所示。目前支持配置单个或多字段组合关联。
图2. 配置表之间的关联关系
图2. 配置表之间的关联关系

5. 单击画布中,表右上角的...按钮,选择“配置维度&字段”,可查看当前表的字段列表(含虚拟字段)、以及当前表上配置的维度列表,注意,此步骤并非必选,如果当前表上已有维度已经满足分析诉求,可直接跳过此步。
字段列表:展示当前表的所有字段列表。在字段列表中,可批量选中多个字段生成维度。如果该字段已经配置了维度,则会展示关联的维度,这类字段不可再创建维度。
虚拟字段:支持基于当前表已有的字段,通过自定义计算逻辑配置为虚拟字段。如下图3所示,可根据客户的消费金额生成CustomerLevel虚拟字段,该字段可用以配置维度、表之间的关联关系以及原子指标等。
图3. 虚拟字段配置
图3. 虚拟字段配置

维度列表:展示当前表在本项目内已经定义的维度,也支持用户在此快速创建、编辑和删除维度,相同表下的同一个字段在一个项目内只能生成一个维度,且维度英文名、维度别名需在本项目内唯一。
6. 单击右上角“发布”按钮,即可发布当前模型。如果是新建场景,单击发布时,会有弹窗要求补充模型英文名、模型别名、模型描述、负责人等信息后,提交发布;如果是编辑场景,则会直接提交发布。
后续操作:发布模型后,便可基于该模型配置原子指标。

发布模型

模型发布后,才可以基于该模型创建指标。在新建或编辑模型场景,可通过模型创建/编辑页面右上角的“发布”按钮直接发布即可,参考上面“新建/编辑模型”章节的介绍。
对于已经下线的模型,可以在模型列表中,单击发布按钮,即可再次发布模型。
1. 进入数据治理 > 语义建模 > 模型管理。
2. 选择需要发布的模型。
3. 单击模型列表操作列的“发布”按钮即可发布模型。
后续操作:发布模型后,便可基于该模型配置原子指标。

下线模型

对于不再使用的模型,可以进行下线操作。下线后,该模型不可被用于指标配置,但是仍旧可以在模型列表中被查看,也可以再次发布模型。
1. 进入数据治理 > 语义建模 > 模型管理。
2. 选择需要下线的模型。
3. 单击模型列表操作列的“下线”按钮,确认后即可下线模型。注意:下线模型时,基于该模型配置的指标也将被同步下线。
后续操作:下线模型后,如果后续不再使用该模型,便可删除该模型。

删除模型

对于已经下线的模型,可以进行删除操作。
1. 进入数据治理 > 语义建模 > 模型管理。
2. 选择需要删除的模型。
3. 单击模型列表操作列的“删除”按钮,确认后即可删除模型。