参数 | 说明 |
数据源 | 可用的 TBase 数据源。 |
库 | 支持选择、或者手动输入需读取的库名称 默认将数据源绑定的数据库作为默认库,其他数据库需手动输入库名称。 当数据源网络不联通导致无法直接拉取库信息时,可手动输入数据库名称。在数据集成网络连通的情况下,仍可进行数据同步。 |
模式 | 支持选择、或者手动输入需读取该数据源下可用的模式。 |
表 | 支持选择、或者手动输入需读取的表名称。支持同时读取多张表。当配置为多张表时,您需要保证多张表的 schema 结构一致。 |
切割键 | Tbase 进行数据抽取时,如果指定 splitPk,表示您希望使用 splitPk 代表的字段进行数据分片,数据同步因此会启动并发任务进行数据同步,提高数据同步的效能。 推荐 splitPk 用户使用表主键,因为表主键通常情况下比较均匀,因此切分出来的分片也不容易出现数据热点。 目前 splitPk 仅支持整型数据切分,不支持字符串、浮点和日期等其它类型 。如果您指定其它非支持类型,则忽略 splitPk 功能,使用单通道进行同步。 如果设置 splitPk 值为空,底层将视作您不允许对单表进行切分,因此使用单通道进行抽取。 |
筛选条件(选填) | 根据数据类型填写对应筛选语句,该语句会作为将要同步数据的筛选条件。
Gbase 根据指定的 where 条件拼接 SQL,并根据该 SQL 进行数据抽取。例如在测试时,可以将 where 条件指定为 limit10。在实际业务场景中,往往会选择当天的数据进行同步,将 where 条件指定为 gmt_create > $bizdate 。where 条件可以有效地进行业务增量同步。 where 条件为空,视作同步全表所有的信息。 |