前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >OLAP介绍

OLAP介绍

作者头像
Flink实战剖析
发布于 2022-11-21 12:23:40
发布于 2022-11-21 12:23:40
1.9K0
举报
文章被收录于专栏:Flink实战剖析Flink实战剖析

OLAP概念

OLAP(On-Line Analytical Processing)即联机分析处理,通过对数据大量分析,得出分析报告,提供决策支持,其侧重数据分析能力,比喻说用户行为分析。

与之对应的是OLTP(on-line transaction processing)即联机事务处理,也就是我们熟知的关系系数据处理,比喻说MySQL、Oracle等,用来记录某类业务发生的行为,其强调的是在线事务处理、小批量数据操作,比喻说银行交易、电商会员注册等。

OLAP/OLATP对比

OLAP 功能型分类

ROLAP: 关系型OLAP

特点:基于原始数据灵活的查询分析,但是其性能差

代表:HiveSpark、Impala、Presto、Clickhouse、Hologres

MOLAP: 多维型OLAP

特点:基于预聚合数据分析,性能高,灵活性差

代表:Kylin、Druid

HOLAP: 混合型OLAP

混合型OLAP同时具有ROLAP、MOLAP的特点,查询明细数据使用ROLAP,查询聚合数据使用MOLAP。

架构上分类

MPP架构

MPP即大规模并行处理,也就是一种分布式并行处理的方式,将一个计算任务下发给不同的计算节点共同完成计算结果。对于MPP架构有以下几个特点:

1.并行计算(基于内存)

2.shard-nothing,无共享模式,即每个节点有自己CPU、Memory、DISK

批处理

批处理也是一种分布式并行计算框架,也就是我们所熟知的MapReduce、Hive、Spark等,与MPP相比:

1.MPP确定的计算必须要在确定的节点上,而批处理可以在任务节点上

2.MPP中间结果保存在缓存中,而批处理需要落入磁盘,因此其查询延时更高

3.MPP做横向扩展需要数据重分布,而批处理只需要增加计算并发即可,其横向扩展能力更强

MPP on Hadoop架构

由于MPP的计算能力与批处理架构的扩展能力,因此衍生了MPP on Hadoop架构,以impala、presto为代表。

基于此架构,中间结果不写磁盘,极大降低了其查询延时,并且也可以通过横向扩展计算节点提升其计算能力。

OLAP 选择

在当前面对大数据量、低延时、灵活查询的场景下,没有一个OLAP引擎能够完全满足所有场景,需要根据特定的场景做tradeoff.


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-09-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Flink实战剖析 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
主流大数据OLAP框架对比
随着互联网、物联网、5G、人工智能、云计算等技术的不断发展,越来越多的数据在互联网上产生,对互联网的运营也开始进入精细化,因此大数据、数据分析、数字营销开始变成每个互联网企业的重点。在做数据分析时有OLAP、OLTP是我们必定会遇到的技术,在介绍OLAP引擎技术选型之前,我们先看看这两个技术分别是什么意思?
qihang
2024/03/16
2.1K0
数仓:Doris在美团的应用实践
美团外卖数据仓库技术团队负责支撑日常业务运营及分析师的日常分析,由于外卖业务特点带来的数据生产成本较高和查询效率偏低的问题,他们通过引入Apache Doris引擎优化生产方案,实现了低成本生产与高效查询的平衡。并以此分析不同业务场景下,基于Kylin的MOLAP模式与基于Doris引擎的ROLAP模式的适用性问题。希望能对大家有所启发或者帮助。
Freedom123
2024/03/29
5070
数仓:Doris在美团的应用实践
关于OLAP和OLTP你想知道的一切
OLAP是英文Online Analytical Processing的缩写,中文称为联机分析处理。它是一种基于多维数据模型的分析处理技术,用于从不同的角度进行数据挖掘和分析,以帮助用户快速发现数据之间的相关性和趋势。
用户1413827
2023/11/28
7.1K0
关于OLAP和OLTP你想知道的一切
主流的 OLAP 引擎介绍 - OLAP极简教程
随着互联网、物联网、5G、人工智能、云计算等技术的不断发展,越来越多的数据在互联网上产生,对互联网的运营也开始进入精细化,因此大数据、数据分析、数字营销开始变成每个互联网企业的重点。在做数据分析时有OLAP、OLTP是我们必定会遇到的技术,在介绍OLAP引擎技术选型之前,我们先看看这两个技术分别是什么意思?
一个会写诗的程序员
2021/12/24
8.7K0
主流的 OLAP 引擎介绍 - OLAP极简教程
大数据Doris(一):Doris概述篇
Doris由百度大数据部研发,之前叫百度Palo,于2017年开源,2018年贡献到 Apache 社区后,更名为Doris。
Lansonli
2023/12/28
22.8K0
大数据Doris(一):Doris概述篇
常见开源OLAP技术架构对比
OLAP(On-line Analytical Processing,联机分析处理)是在基于数据仓库多维模型的基础上实现的面向分析的各类操作的集合。可以比较下其与传统的OLTP(On-line Transaction Processing,联机事务处理)的区别来看一下它的特点:
shengjk1
2021/11/09
2.4K0
常见开源OLAP技术架构对比
大数据OLAP框架对比
以上是在大数据处理方面常用的四种技术原理, 上面这些处理数据的方式极大程度的提高了单位时间内数据处理的能力, 但是其还是没有摆脱数据量和查询时间的线性关系。 于是在OLAP处理方式上, 我们多了一种:
solve
2020/03/20
4K0
数仓数据处理DB基本概念解析与理解 OLAP OLTP HATP 异同 MPP架构
学习数仓的时候,可能一开始总是被一些英文缩写名字迷惑,OLAP MPP架构 KAPPA架构 ODS等等,这篇文章就来梳理一下这些基本概念。
大鹅
2021/08/05
3.6K0
HAWQ取代传统数仓实践(十九)——OLAP
本文介绍了 Zeppelin 是什么、能做什么,以及 Zeppelin 的特性、组件和扩展。主要内容包括:Zeppelin 是基于 Apache Spark 的开源大数据可视化分析平台,支持交互式查询、实时数据可视化和机器学习等功能。Zeppelin 的特性包括支持多种数据源、提供交互式查询、支持实时数据可视化、提供机器学习接口等。Zeppelin 的组件包括: Notebook:交互式查询工具,支持多种编程语言; Interpreter:解释器,支持多种编程语言; Notebook Server:服务端,支持交互式查询; Shell:命令行工具,支持交互式查询; Spark:基于 Spark 的数据科学平台,支持交互式查询; ML:机器学习平台,支持交互式查询; Gallery:数据可视化模块,支持数据可视化; Extensions:扩展模块,支持自定义功能。
用户1148526
2018/01/03
1.9K0
HAWQ取代传统数仓实践(十九)——OLAP
猿辅导 x DorisDB:构建统一OLAP平台,全面升级数据分析能力
猿辅导公司的数据中台部门为猿辅导、斑马、猿编程、小猿搜题、猿题库、南瓜科学等各个业务线的产品、运营、研发提供标准化的数据集(OneData)和统一数据服务(OneService)。OLAP平台作为数据中台的一个核心部分,为各个业务线提供统一标准化的、可复用的、高可靠的数据服务,支持各个业务线人员进行快速灵活的查询和分析,是连接前台和后台的桥梁。
伊泽瑞尔
2022/06/01
7130
猿辅导 x DorisDB:构建统一OLAP平台,全面升级数据分析能力
【实践案例分享】Apache Doris在美团外卖数仓中的应用实践
美团外卖数据仓库通过MOLAP+ROLAP双引擎模式来适配不同应用场景。MOLAP引擎使用了Apache Kylin。ROLAP我们经过综合考虑,选择了Apache Doris。本文将介绍Doris在美团外卖数仓的实践。
木东居士
2020/04/20
2.6K0
【实践案例分享】Apache Doris在美团外卖数仓中的应用实践
OLAP是什么及其发展历程
画像数据的产出、画像平台工程化实现都会涉及OLAP技术领域,本节先介绍一下OLAP是什么以及相关技术的发展历程。
张叔叔讲互联网
2023/10/02
6480
OLAP是什么及其发展历程
MPP大规模并行处理架构详解
这个问题不少小伙伴在面试时都遇到过,因为对MPP这个概念了解较少,不少人都卡壳了,但是我们常用的大数据计算引擎有很多都是MPP架构的,像我们熟悉的Impala、ClickHouse、Druid、Doris等都是MPP架构。
五分钟学大数据
2021/04/02
6.3K0
一个比 MySQL 快 800 多倍的数据库...
大家好呀!这里是爱学习的 Guide!今天给大家科普一个速度快到飞起的数据库——ClickHouse。
Guide哥
2021/10/11
2.2K0
从架构特点到功能缺陷,重新认识分析型分布式数据库 (转载非原创)
转载来源: https://www.cnblogs.com/ivan-uno/p/9051225.html
xlj
2022/05/03
5880
建议收藏!浅谈OLAP系统核心技术点
OLAP系统广泛应用于BI、Reporting、Ad-hoc、ETL数仓分析等场景,本文主要从体系化的角度来分析OLAP系统的核心技术点,从业界已有的OLAP中萃取其共性,分为谈存储,谈计算,谈优化器,谈趋势4个章节。
数据社
2020/08/27
1.3K0
一篇文章搞懂数据仓库:数据应用--OLAP
数仓系列传送门:https://blog.csdn.net/weixin_39032019/category_8871528.html
不吃西红柿
2022/07/29
1.3K0
一篇文章搞懂数据仓库:数据应用--OLAP
你需要的不是实时数仓 | 你需要的是一款强大的OLAP数据库(下)
在上一章节《你需要的不是实时数仓 | 你需要的是一款强大的OLAP数据库(上)》,我们讲到实时数仓的建设,互联网大数据技术发展到今天,各个领域基本已经成熟,有各式各样的解决方案可以供我们选择。
王知无-import_bigdata
2019/09/16
1.7K0
大数据平台架构及主流技术栈
互联网和移动互联网技术开启了大规模生产、分享和应用数据的大数据时代。面对如此庞大规模的数据,如何存储?如何计算?各大互联网巨头都进行了探索。Google的三篇论文 GFS(2003),MapReduce(2004),Bigtable(2006)为大数据技术奠定了理论基础。随后,基于这三篇论文的开源实现Hadoop被各个互联网公司广泛使用。在此过程中,无数互联网工程师基于自己的实践,不断完善和丰富Hadoop技术生态。经过十几年的发展,如今的大数据技术生态已相对成熟,围绕大数据应用搭建的平台架构和技术选型也逐渐趋向统一。
全栈程序员站长
2022/09/02
4.2K0
大数据OLAP系统(1)——概念篇
OLAP(OnLine Analytical Processing),即联机分析处理。OLAP对业务数据执行多维分析,并提供复杂计算,趋势分析和复杂数据建模的能力。它主要用于支持企业决策管理分析,是许多商务智能(BI)应用程序背后的技术。OLAP使最终用户可以对多个维度的数据进行即席分析,从而获取他们所需知识,以便更好地制定决策。OLAP技术已被定义为实现“快速访问共享的多维信息”的能力。
Spark学习技巧
2020/12/28
2.2K0
大数据OLAP系统(1)——概念篇
相关推荐
主流大数据OLAP框架对比
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档