首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据分层(ODS DWD DWS ADS)换个角度看

数据分层简介 1. 背景 是什么, 其实就是存储数据,体现历史变化的一个数据仓库. 因为互联网时代到来,基于数据量的大小,分为了传统和现代数....传统,使用传统的关系型数据库进行数据存储,因为关系型数据库本身可以使用SQL以及函数等做数据分析.所以把数据存储和数据分析功能集合为一体,加上一个可视化界面,就能从数据存储,数据分析,数据展示完整方案...企业需要也希望从这些海量数据中挖掘有效信息,如行为日志数据,业务数据,爬虫数据等等中提炼出有价值信息.但传统的关系型数据库由于本身技术限制,无法很好承担这么大数据量存储和分析的任务,现代大数据技术应运而生.而就是做这些海量数据存储的地方...经典分层架构 其实数数据分层,就跟代码分层一样.如果所有数据都放在一层,就跟代码都放在一个文件,肯定是可以运行的,但带来的问题就是阅读性差,复用性和维护性降低....的分层也是一样,每一层都有自己的职责,同时都是基于下一层或者下面多层做数据处理之后的结果.

1.6K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    名,懂

    做数据开发不能绕过数据仓库的建设,是数据分析/数据挖掘的基础料,更是描述一个企业蓝图的智库。...如何打造出一个反映企业全局的视图是“路漫漫其修远兮”的任重远道; 在数据公众号“数据指象”的上一篇推文《矛盾的演进之旅》中,描述了由简入繁的其中道理。今天我们接着了解数的名义。...数据集成性:集成是最重要的特点之一,也是突出与传统数据库的特性之一;没有集成数就没有价值;只有将:同义不同名、同名不同义、多数据源、码值分解等等杂乱无章的数据,以集成就行统一、进行归一、进行编排形成一致性统一的的...非易失性:不易丢失数据是的基本属性,承接经年累月的数据输入,保存历史的数据细节,在时间的作用慢慢地聚沙成塔,让微小的数据也能发出耀眼的光芒。...具体中粒度如何选择,后续将分享如何构建双粒度数 周末快乐

    50820

    设计和规范—背景知识

    数据仓库的分层       基于数据仓库模型理论指导,以数据分析,统计指标为导向,为了能够记录数据的历史,便于处理业务变化,把复杂问题简单化,通过空间换时间提高数据访问效率,数据集成考虑,在数实际开发过程中进行分层处理...当另外一种不是做指标统计,而是明细数据处理的时候也是在这一层进行处理,如用户画像的标签经常会变,所以在这一层将用户维度表做宽表处理,达到尽可能方便DWS层使用。 4. ...数据服务层:DWS(Data WareHouse Servce)      数据汇总层或者大宽表层,按照主题如财务,客户管理等划分,或者按照业务划分,如流量、订单等,生成字段比较多的宽表,用于提供后续的业务查询...可以是从DWS层汇总数据,然后导出到MySQL、Redis等系统中供线上系统使用;也可以是基于DWS层表创建视图提供给Spark/Presto等自主分析使用。 6....从上往下看对应数据仓库分层如下: image.png 从分层开发来看: 流程.png 附:阿里数据仓库分层 1.分层和作用 image.png 2.数据分层架构 分层架构.png 3.网易数据架构

    2.3K01

    建设篇」主题域划分

    一、前言数据仓库具有面向主题的特性,那么就会有主题的概念,建设是遵循纵向分层开发,横向划分主题域设计,分层就不在这次谈了,这次我会结合本人数工作实践总结的经验来聊聊主题域划分,同时会引申出主题划分...这个对于工程师来说是必备的能力,比如当你面临着一个新业务的开启,需要从0到1开始搭建数据仓库或者数据集市,这时候就要考虑到主题域和主题的合理划分。二、建设的步骤1....分层设计模型表6. 公共层表迭代升级三、主题和主题域下面结合本人对搬家业务的建设,进行主题域划分和主题划分实践,当然项目的大小决定着这是一个小型的数据集市 还是 企业级的数据仓库。1....数据域:面向业务分析,将业务过程或者维度进行抽象的集合,针对公共汇总层(DWS)进行数据域划分。业务过程:指企业的业务活动事件,如下单、支付、退款都是业务过程,业务过程就是一个不可拆分的行为事件。...:「建设篇」主题域划分 另外,公众号有海量大数据领域资料 欢迎领取。同时也欢迎大家加我微信,拉你进大数据技术交流群,一同成长。图片

    2K01

    分层

    000概述 分层是数据仓库设计中十分重要的一个环节,优秀的分层设计能够让整个数据体系更容易理解和使用 本文的大纲 001,介绍数据分层的作用 002,分层设计的原则以及介绍一种通用的数据分层设计...Middle) 在DWD层的数据基础上,对数据做轻度的聚合操作,生成一系列的中间表提升公共指标的复用性,减少重复加工,直观来说,就是对通用的核心维度进行聚合操作,算出相应的统计指标 Ⅲ,数据服务层:DWS...在DWM层先计算出多个小的中间表,再拼接成一张DWS的大宽表。...由于宽和窄的界限不易界定,也可以去掉DWM这一层,只保留DWS层,将所有的数据放在DWS亦可 一般采用维度模型方法作为理论基础,更多的采用一些维度退化手法,将维度退化至事实表中,减少维度表与事实表的关联...类似的 需要做很多歌DWM的中间表 4,然后再DWS层,将一个人在整个网站中的行为数据放到一张表中,这就是我们的大宽表。

    54221

    分层

    分层 数据分层是数据仓库设计中一个十分重要的环节,良好的分层设计能够让整个数据体系更容易被理解和使用。本文介绍的是如何理解数据仓库中各个分层的作用。...图解数据分层 何为DW Data warehouse(可简写为DW或者DWH)数据仓库,是在数据库已经大量存在的情况下,它是一整套包括了etl、调度、建模在内的完整的理论体系。...分层中每个层的作用是什么? …… 在实际的工作中,我们都希望自己的数据能够有顺序地流转,设计者和使用者能够清晰地知道数据的整个声明周期,比如下面左图。...streaming或者Flink、Kafka来实时接入 消息队列:来自ActiveMQ、Kafka的数据等 数据仓库层 数据仓库层从上到下,又可以分为3个层:数据细节层DWD、数据中间层DWM、数据服务层DWS...简答来说,对通用的核心维度进行聚合操作,算出相应的统计指标 数据服务层DWS 数据服务层:Data Warehouse Service,DWS; 该层是基于DWM上的基础数据,整合汇总成分析某一个主题域的数据服务层

    27810

    数据开发工程师上手指南(七)CDM-DWS层搭建规范及流程

    数据开发/工程师上手指南(七)CDM-DWS层搭建规范及流程前言进入到了CMD公共数据层的结尾最后一层-DWS层了,该层基本就是直接与业务强关联,也就是说产品提出的需求,或是报表、用户画像统计好还是数据大屏都是在这一层给处理好数据...一般我们也可以从DWS这一层,也就是需求侧结果出发来逆向推理我们需要建立的ODS和DWD层,总之DWS层需要我们仔细琢磨,需要上生产的东西一定得小心再小心。...一、理解DWSDWS层旨在为业务分析提供高效、快速的汇总数据访问。这一层是基于分析主题对象进行建模,提供了关键指标的汇总视图,支持上层应用的决策和洞察。...通过构建公共粒度的汇总指标事实表,DWS层可以帮助识别趋势、模式和异常。原始数据可以比作城市地图上每条街道和建筑的详细信息,而DWS层就像导航应用中的路况总结。...时间维度:按月、季度、年度进行统计地域维度:按省、市进行汇总三、DWS设计流程3.1明确分析目标在设计DWS表之前,首先明确供应商画像分析的目标。

    40220

    最新面试题_知行教育项目

    5、项目是如何分层的 6、一般怎么做分层处理呢? 7、分层的作用是什么? 8、项目中有做按照主题分析吗?...数据仓库主要用于数据挖掘和数据分析,辅助领导做决策; 它们的主要区别体现在数是综合的或提炼的,数据库是细节的,主要用星型模型或雪花模型;面向分析,支持决策需求;而数据库用的是实体-关系(E-R)...5、项目是如何分层的 一般分成三层 ODS DW ADS 也会有Dimen层 6、一般怎么做分层处理呢? ODS——》DWD——》DWM——》DWS 7、分层的作用是什么?...14、一个企业一般构建几个数据仓库最好,并说明 最好一个, 因为企业面临的困境就是数据孤岛问题,如果数据存储太过分散就无法发挥的优势。即使是两个数也会遇到数据同步问题,会浪费时间,降低效率。...同时对事务的支持性不行 适用的场景: 的特性很大一部分是针对列的过滤,列的搜索,列的匹配,所以很多数结构比较适合使用列存储 列存储也比较适合做OLAP 30、什么是Hive的分区?

    1.5K21

    如何设计

    一、为什么要分层?   合理的数据仓库分层一方面能够降低耦合性,提高重用性,可读性可维护性,另一方面也能提高运算的效率,影响到数据需求迭代的速度,近而影响到产品决策的及时性。...建立数据分层可以提炼公共层,避免烟囱式开发,可见一个合适且合理的分层是极其重要。...在设计DWS表的时候,很多人会把所有可以聚合的维度进行cube,这样就得到了很多个派生指标,而这些派生指标放在同一张表中无疑会增加这张表的使用难度,比如在实际的取时,往往只关心某个统计粒度的指标。...建设是一个不断迭代的过程,数据建模同样是一个不断迭代的过程。同时,业务是不断变化的,建模人员对业务的理解也是变化的,这些也就注定了建模是一个迭代过程。...如何评价DWS层建设的好坏?   由于的建设是与业务息息相关的,建设的方法论仅仅只是指引我们构建的一个方向,在实际的落地执行过程中会存在各种各样的问题,且不可被这些理论所禁锢。

    1.4K30

    详解数中的数据分层:ODS、DWD、DWM、DWS、ADS

    何为DW Data warehouse(可简写为DW或者DWH)数据仓库,是在数据库已经大量存在的情况下,它是一整套包括了etl、调度、建模在内的完整的理论体系。...分层中每个层的作用是什么? …... 在实际的工作中,我们都希望自己的数据能够有顺序地流转,设计者和使用者能够清晰地知道数据的整个声明周期,比如下面左图。...streaming或者Flink、Kafka来实时接入 消息队列:来自ActiveMQ、Kafka的数据等 数据仓库层 数据仓库层从上到下,又可以分为3个层:数据细节层DWD、数据中间层DWM、数据服务层DWS...简答来说,对通用的核心维度进行聚合操作,算出相应的统计指标 数据服务层DWS 数据服务层:Data Warehouse Service,DWS; 该层是基于DWM上的基础数据,整合汇总成分析某一个主题域的数据服务层

    7.6K40
    领券