首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据仓库设计规范

以下是常用的数据仓库术语,请按照需求创建schema名字,其中DWH与DWE不是数据仓库的术语 名词 名词简称 名词解释 Data Warehouse DW 数据仓库主体 Operational Data...Data Warehouse History DWH 该层不在数据仓库设计的范围之内,按照业务新增的数据层,主要储存历史数据。...Data Warehouse Exception DWE 该层不在数据仓库设计的范围之内,按照业务新增的数据层,主要储存异常数据。...Enterprise Data Warehouse EDW 作为企业唯一的数据仓库,EDW提供统一的数据服务,查询结果有效一致。数据设计支持跨部门,支持海量数据,并支持大量的查询请求。...生产报表,也支持adhoc查询,数据反范式设计。 Data Lake Database DLD 该层存储非加工数据,比如日志、视频等,以后结构化数据,并且不分类,没有为了特定程序进行设计和加工。

1.9K00

数据仓库设计规范

Data Warehouse Detail DWD 数据源的细节层,有的也称为ODS层,是业务层与数据仓库的隔离层,在该层可以把业务表分的更细 Data Warehouse Base DWB 数据仓库基础数据层...Data Warehouse History DWH 该层不在数据仓库设计的范围之内,按照业务新增的数据层,主要储存历史数据。...Data Warehouse Exception DWE 该层不在数据仓库设计的范围之内,按照业务新增的数据层,主要储存异常数据。...Enterprise Data Warehouse EDW 作为企业唯一的数据仓库,EDW提供统一的数据服务,查询结果有效一致。数据设计支持跨部门,支持海量数据,并支持大量的查询请求。...生产报表,也支持adhoc查询,数据反范式设计。 Data Lake Database DLD 该层存储非加工数据,比如日志、视频等,以后结构化数据,并且不分类,没有为了特定程序进行设计和加工。

55610
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    数据仓库中的模型设计

    个人感觉,很多模型的设计都在同构化,而且在工作中也不是单独地用一种模型,会根据业务场景做出各种取舍。...一、范式模型 范式是数据库逻辑模型设计的基本理论,一个关系模型可以从第一范式到第五范式进行无损分解。在数据仓库的模型设计中目前一般采用第三范式。...我们提到的范式模型由数据仓库之父 Inmon 提倡 ,可以大致地按照OLTP设计中的3NF来理解,它在范式理论上符合3NF,它与OLTP系统中的3NF的区别在于数据仓库中的3NF上站在企业角度面向主题的抽象...三、Data Vault Data Vault 是 Dan Linstedt 发起创建的一种模型方法论,现在应该叫做Data Vault 2.0了,它也是一套完整的数据仓库理论,其中也有专门的一部分关于数据模型设计...关于数据模型,个人感觉在实际的场景中会有很多个性化的设计,有时候还不得不做一些反模式的设计。模型很重要,业务场景也很重要。

    2.4K20

    Greenplum 实时数据仓库实践(2)——数据仓库设计基础

    2.4.3 数据集市设计 2.5 数据仓库实施步骤 2.6 小结 本篇首先介绍关系数据模型、多维数据模型和Data Vault模型这三种常见的数据仓库模型和与之相关的设计方法,然后讨论数据集市的设计问题...2.5 数据仓库实施步骤 实施一个数据仓库项目的主要步骤是:定义项目范围、收集并确认业务需求和技术需求、逻辑设计、物理设计、从源系统向数据仓库装载数据、使数据可以被访问以辅助决策、管理和维护数据仓库...在数据仓库设计的初始阶段,需要确定数据源有哪些、数据需要做哪些转换以及数据的更新频率是什么。 3. 逻辑设计 定义了项目的范围和需求,就有了一个基本的概念设计。...下面就要进入数据仓库的逻辑设计阶段。逻辑设计过程中,需要定义特定数据的具体内容,数据之间的关系,支持数据仓库的系统环境等,本质是发现逻辑对象之间的关系。...实施一个数据仓库项目的主要步骤是:定义范围、确认需求、逻辑设计、物理设计、装载数据、访问数据、管理维护。

    1.9K30

    数据仓库(07)数仓规范设计

    规范设计在这里取《大数据之路:阿里巴巴大数据实践》中的定义,这里记录一下本人对这一块自己的理解。...一般的规范设计包含一下几个方面:划分和定义数据域、业务过程、维度、度量 原子指标、修饰类型、修饰词、时间周期、派生指标。 数据域:指面向业务分析,将业务过程或者维度进行抽象的集合。...需要数据仓库资料可以点击这个领取数据仓库(13)大数据数仓经典最值得阅读书籍推荐 参考资料:数据仓库(01)什么是数据仓库,数仓有什么特点数据仓库(02)数仓、大数据与传统数据库的区别数据仓库(03)...数仓建模之星型模型与维度建模数据仓库(04)基于维度建模的数仓KimBall架构数据仓库(05)数仓Kimball与Inmon架构的对比数据仓库(06)数仓分层设计数据仓库(07)数仓规范设计数据仓库(...08)数仓事实表和维度表技术 数据仓库(09)数仓缓慢变化维度数据的处理数据仓库(10)数仓拉链表开发实例数据仓库(11)什么是大数据治理,数据治理的范围是哪些数据仓库(12)数据治理之数仓数据管理实践心得数据仓库

    57030

    一篇文章搞懂数据仓库:数据仓库规范设计

    目录 一、为什么要进行规范设计?...二、设计规范 - 指标 三、命名规范 - 表命名 3.1 常规表 3.2 中间表 3.3 临时表 3.4 维度表 四、开发规范 五、流程规范 ---- 一、为什么要进行规范设计? 无规矩、不方圆。...一个良好的规范设计,应当起到以下作用:提高开发效率,提升质量,降低沟通对齐成本,降低运维成本等。...下面小编将带领大家盘一盘数据仓库有哪些规范,从中挑选几个重点细说: 设计规范             逻辑架构、技术架构、分层设计、主题划分、方法论  命名规范             各层级命名、任务命名...有没有检查分区键值为NULL的情况11DQC质量监控规则是否配置,严禁棵奔12代码中有没有进行适当的规避数据倾斜语句13Where条件中is null语句有没有进行空字符串处理 五、流程规范 根据阿里流程规范,本文将数据仓库研发流程抽象为如下几点

    88620

    数据仓库的设计开发应用(一)

    一、数据仓库设计的特点 1、“数据驱动” 的设计   数据仓库是从已有数据出发的设计方法,即从数据源抽取数据,经转换形成面向主题,支持决策的数据集合。   以全面了解并利用现有数据为出发点。...3、“需求模糊” 的设计   数据仓库设计的数据分析处理需求更加灵活,也没有固定的模式,有时用户自己对所要进行的分析处理也不能事先确定。...数据仓库的分析需求在设计初期往往是模糊或不明确的,通常只有在数据仓库设计过程中,或后来数据仓库的决策支持过程中逐渐明确。...二、数据仓库系统开发过程   数据仓库系统的开发过程的5个时期:规划时期、设计时期(需求分析、概念设计、逻辑设计、物理设计)、实施时期、开发时期和应用时期。   ...4、确定数据仓库项目预算   数据仓库的设计开发具有需求模糊,螺旋周期的特点,但可以根据决策使用部门、使用人数、基础软件和硬件平台、以及数据仓库设计开发等所需费用,对数据仓库系统开发方案预算进行粗略的宏观估计

    3700

    数据仓库的设计开发应用(二)

    四、数据仓库的设计   数据仓库的设计包括需求分析、概念设计、逻辑设计和物理设计四个阶段,其设计工作一般由项目中标的软件企业负责完成。...例3-2 请根据例 3-1需求分析结果,完成警务数据仓库 “入住” 主题的概念设计。 解: 按照概念设计的步骤分别设计如下。...当前数据仓库大都建立在关系数据仓库管理系统(RDWMS,如 SQL Server 等)之上,下面介绍 RDWMS 中的数据仓库逻辑设计。...商品化关系数据仓库管理系统(RDWMS)作为数据仓库的管理平台,数据仓库的大量内部物理结构都由 RDBMS 自动完成,只留有少量的、用户可参与的物理结构设计内容。 主要介绍如下几种物理设计内容。...4、数据存储分配设计   商品化数据仓库管理系统提供了一些存储分配的参数供设计者进行物理优化处理,比如块的尺寸、缓冲区的大小和个数等。

    9910

    数据仓库(06)数仓分层设计

    目前主流的数据仓库分层大多为四层,也有五层的架构,这里介绍基本的四层架构。 分别为数据贴源层(ods)、数据仓库明细层(dw)、多维明细层(dws)和数据集市层(dm)。   ...数据仓库明细层(dw):这一层存放的是一致的、准确的、干净的数据,即对源系统数据进行了清洗(去除了杂质)后的数据。一层一般来说是按照维度建模抽取的明细数据。通常是星形或雪花结构的数据。...需要数据仓库资料可以点击这个领取数据仓库(13)大数据数仓经典最值得阅读书籍推荐 参考资料:数据仓库(01)什么是数据仓库,数仓有什么特点数据仓库(02)数仓、大数据与传统数据库的区别数据仓库(03)...数仓建模之星型模型与维度建模数据仓库(04)基于维度建模的数仓KimBall架构数据仓库(05)数仓Kimball与Inmon架构的对比数据仓库(06)数仓分层设计数据仓库(07)数仓规范设计数据仓库(...08)数仓事实表和维度表技术 数据仓库(09)数仓缓慢变化维度数据的处理数据仓库(10)数仓拉链表开发实例数据仓库(11)什么是大数据治理,数据治理的范围是哪些数据仓库(12)数据治理之数仓数据管理实践心得数据仓库

    78720

    数据仓库专题(3)-分布式数据仓库事实表设计思考

    一、前言   最近在设计数据仓库的数据逻辑模型,考虑到海量数据存储在分布式数据仓库中的技术架构模式,需要针对传统的面相关系型数据仓库的数据存储模型进行技术改造。...设计出一套真正适合分布式数据仓库的数据存储模型。 二、事实表设计基础       事实表记录发生在现实世界中的操作型事件,其所产生的可度数值。...事实表的设计完全依赖于物理活动,不受可能产生的最终报表的影响。事实表中,除数字度量外,事实表总是包含外键,用于关联与之相关的维度,也可以包含退化的维度键和日期/时间戳。...三、传统模式   以FS-LDM数据存储模型Event主题域数据存储模型设计为例,其事件主题域数据逻辑模型结构如下图所示: ?    ...分布式数据仓库的设计,恰恰相反,因为单表数据规模的问题,如果要满足分析和处理的性能,合理的按照业务进行数据的分表存储。如财务相关事件、账户相关事件,单独成表。更有利于数据的计算和分析。

    96930

    数据仓库的设计开发应用(三)

    (一)数据仓库的创建   根据逻辑设计阶段的结果,创建一个数据库文件,并在其中创建事实表、维度表以及详细类别表结构(没有任何数据记录),同时根据物理结构设计结果完成存储位置、存储分配等物理参数设置,等待数据抽取...例 3-5 试根据例3-3和3-4的设计结果创建警务数据仓库。...2、使用程序设计语言   利用某种高级语言或 Web 程序设计语言,开发用户访问数据仓库的程序或应用工具,具有相当的灵活性和较强的应变能力。...3、综合使用两种途径   因为商品化开发平台可能无法完成一些复杂的访问工具,这时就需要结合程序设计语言来开发部分复杂的功能,并集成为一个完整的数据仓库访问工具。...即进入数据仓库新一轮的生命周期,完成对新决策主题的规划、设计、实施、开发和应用等任务。

    10910

    数据仓库实践之业务数据矩阵的设计

    0x00 概述 数据仓库的设计不能完全依赖于业务的需求,但又必须服务于业务的价值。那么,该如何地从业务的角度出发,设计一套切实可行的数据仓库呢?...本文将分享数据仓库实践中的业务数据矩阵的设计经验,帮助大家在工作中快速理解业务并规划数据仓库体系。...一般来讲,在数据仓库的设计初期,数据仓库架构师会根据对业务和数据的理解来设计一个全局的业务数据矩阵,以此从宏观的角度来描述公司的业务和数据现状,并指导后续的数据仓库建模。...简单来讲: 能够帮助数据仓库架构师清晰地梳理整个数据体系。 能够帮助决策者(各位老板)从宏观的角度了解数据仓库的整体情况。...能够让所有的数据仓库参与者了解数据仓库的设计,根据矩阵有规划地填充数据表即可。 0x02 举个栗子 趁热打铁,居士举一个栗子来说明业务数据矩阵的设计。

    2.2K31

    数仓基础(五):数据仓库设计理论

    ​数据仓库设计理论一、数据仓库分层规划优秀可靠的数仓体系,需要良好的数据分层结构。合理的分层,能够使数据体系更加清晰,使复杂问题得以简化。以下是标准的分层规划。...二、数据仓库构建流程以下是构建数据仓库的完整流程:1、 数据调研数据调研重点要做两项工作,分别是业务调研和需求分析。这两项工作做的是否充分,直接影响着数据仓库的质量。...2、明确数据域数据仓库模型设计除横向的分层外,通常也需要根据业务情况进行纵向划分数据域。划分数据域的意义是便于数据的管理和应用。...所以构建业务总线矩阵的过程就是设计维度模型的过程。但是需要注意的是,总线矩阵中通常只包含事务型事实表,另外两种类型的事实表需单独设计。...5 维度模型设计维度模型的设计参照:大数据基础:维度建模理论之维度表-CSDN博客注意:事实表存储在DWD层,维度表存储在DIM层。

    23010

    关于【你们数据仓库是怎么设计的】如何回答?

    你们数据仓库都是怎么设计的,数据怎么抽象? 关于这个问题,我说一说我的想法,不一定是正确的,但希望能给你提供一些思路 1、数据仓库是怎么设计的? 如果真的要完全回答这个问题,真的太大了。 ?...可以按照自己的习惯,把数仓怎么设计的分成几个模块,比如: 技术架构 数据流转 分层建模 然后,询问一下,面试官重点想要听哪一块?...分层建模: 这块主要讲公司目前仓库的分层,每一层的作用,有哪些基础数据,讲一下自己对目前公司仓库设计的一些看法,好的地方,不好的地方。不好的地方,需要怎么改进。...另外还可以讲一讲,自己的一些设计比较巧妙的模型,比如留存,留存的设计可以依据业务需求,从易到难,有多种设计。....等等 维度建模,星型模型,这么多年了,都是这些,也没什么创新,如果只讲这些,会让人觉得耳朵都起茧子了,可以把这些融合到实际案例中,多讲自己的思考和感悟,平时工作中也要细心观察,现在没有任何一家公司的数据仓库是完美的

    79670

    数据仓库设计和规范—数仓分层和规范

    抽取规则和策略说明 ①.ODS设计 抽取周期日抽取条件每日全量,基于create_time或者是update_time字段进行数据抽取 ②.数据源和ods的对应 列名描述来源转换规则安全等级user_id...加工规则和策略说明 ①.DWS设计 加工周期日加工条件每日增量,基于create_time进行数据加工 ②.数据源和dwm的对应, 是基于dwm层数据 列名描述来源转换规则安全等级user_id用户主键...加工说明 ①.DWA设计 加工周期日加工条件每日增量,基于分区字段进行数据加工 ②.数据源和dws层对应,视图方式 列名描述来源转换规则安全等级user_id用户主键user_id create_time...维表设计开发     1. 维表设计字段冗余,为了使用时字段的全表扫描,采用列存储方式;     1. 针对缓慢变化维,保留历史数据和版本TTL为30天, 方便数据追踪,后续统一使用新的维表。 三....背景说明 完成数据仓库的分层后,针对各层次的数据之间的调用关系作出约定。 二. 调用规范          ①.

    5.4K23

    一篇文章搞懂数据仓库:维度表(设计原则、设计方法)

    2、维度表设计原则 (1)维度属性尽量丰富,为数据使用打下基础 (2)给出详实的、富有意义的文字描述 (3)区分数值型属性和事实 (4)沉淀出通用的维度属性,为建立一致性维度做好铺垫 (5)退化维度(DegenerateDimension...) (6)缓慢变化维(Slowly Changing Dimensions) 3、维度表设计方法 ---- 1、什么是维度表?...维度的作用一般是查询约束、分类汇总以及排序等,我们在进行维度表设计时,应当提前考虑: (1)维度属性尽量丰富,为数据使用打下基础 比如淘宝商品维度有近百个维度属性,为下游的数据统计、分析、探查提供了良好的基础...③ TYPE3 增加属性列 3、维度表设计方法 第一步:选择维度或新建维度。作为维度建模的核心,在企业级数 据仓库中必须保证维度的唯一性。以淘宝商品维度为例,有且只允许有 一个维度定义。...数据仓库是业务源系统的数据整合,不同业务系统或者同 一业务系统中的表之间存在 关联性。根据对业务的梳 理,确定哪些表和主维表存在关联关系,并选择其中的某些表用于生成维度属性。

    2.8K20

    数据仓库①:数据仓库概述

    注:如果您还不清楚完整参照性约束,请参考《数据库关系建模》 :,如果您还不了解范式,请参考《更新异常与规范化设计》 。...数据仓库(data warehouse)定义 聪明的读者应该已经意识到这个问题:既然分析型数据库中的操作都是查询,因此也就不需要严格满足完整性/参照性约束以及范式设计要求,而这些却正是关系数据库精华所在...~这就是关于数据仓库最贴切的定义了。事实上数据仓库不应让传统关系数据库来实现,因为关系数据库最少也要求满足第1范式,而数据仓库里的关系表可以不满足第1范式。...有了这些数据快照以后,用户便可将其汇总,生成各历史阶段的数据分析报告; 数据仓库组件 数据仓库的核心组件有四个:各源数据库,ETL,数据仓库,前端应用。如下图所示: ? 1....数据仓库开发流程 在数据库系列的第五篇 中,曾详细分析了数据库系统的开发流程。数据仓库的开发流程和数据库的比较相似,因此本文仅就其中区别进行分析。 下图为数据仓库的开发流程: ?

    2.9K72

    模型设计(数据仓库、星型、雪花型、星系模式)

    1.数据仓库 数据仓库是多维数据库,它扩展了关系数据库模型,以星形架构为主要结构方式的,并在它的基础上,扩展出理论雪花形架构和数据星座等方式,但不管是哪一种架构,维度表、事实表和事实表中的量度都是必不可少的组成要素...采用星形模式设计的数据仓库的优点是由于数据的组织已经过预处理,主要数据都在庞大的事实表中,所以只要扫描事实表就可以进行查询,而不必把多个庞大的表联接起来,查询访问效率较高,同时由于维表一般都很小,甚至可以放在高速缓存中...5.数据集市 数据集市是在构建数据仓库的时候经常用到的一个词汇。...数据集市面向企业中的某个部门(或某个主题)是从数据仓库中划分出来的,这种划分可以是逻辑上的,也可以是物理上的。...数据仓库由于是企业范围的,能对多个相关的主题建模,所以在设计其数据构成时一般采用星系模式。

    1.2K30
    领券