元数据
元数据,简单定义就是描述数据的数据。在企业中,只要有数据存在的地方,就有其对应元数据。只有完整、准确的元数据存在,才能更好地理解数据,充分挖掘数据的价值。本文针对数据分析类场景,描述其包含元数据,方便读者更好地理解它。
01
技术元数据
1
物理元数据
描述物理资源的元数据,包括但不限于服务器、操作系统、机房位置等信息。
2
数据源元数据
描述数据源的元数据,通常包括四类信息:
3
存储元数据
描述对象存储的元数据,也是通常"狭义"上的元数据,包括几大类
4
计算元数据
描述数据计算过程的元数据,通常可分为数据抽取(ETL)或数据加工(JOB)两类计算。每类计算又可以进一步细分
5
质量元数据
描述数据质量的一类元数据。通常情况下,是通过定义一系列质量指标反映数据质量。
6
操作元数据
描述数据是如何进行使用的一类元数据。
7
运维元数据
描述系统运维层面的元数据,通常包括任务类、报警类及故障类。
8
成本元数据
描述数据存储及计算成本的元数据。
9
标准元数据
描述数据标准化内容的元数据。
10
安全元数据
描述数据安全内容的元数据。
11
共享元数据
描述数据是如何共享的部分,包括接口方式、格式、内容等。
02
业务元数据
1
模型元数据
数据建模,是一种对业务的描述,通过模型可更好地了解业务。常见的建模方式有范式模型、维度模型、多维建模等。下面以维度模型为例进行说明。
2
应用元数据
描述数据应用类的元数据。
3
分析元数据
从数据分析角度,描述业务的元数据。
03
管理元数据
1
管理元数据
描述企业内部,数据管理相关内容。