首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Apache Doris 在有赞的初步尝试

兼容性 由于我们第一阶段的目标是将Doris替换Apache Druid,因此我们基于Druid场景做了一些兼容性测试。...然后由一个Kafka消费者消费上Druid的请求,做SQL改写,将Druid SQL转换为Doris的查询语句发往Doris进行流量回放。 ‍...有一些Druid Function 的函数的参数入参含义、个数,都和Apache Doris有较大不同,这导致SQL改写的过程繁琐一些,但这对于平台型的服务团队通常是不得不做的过程。...后续计划 至于后续的计划,我们的目标是视资源情况推进Doris在有赞落地,尽量将ClickHouse、Druid的技术栈收敛为Apache Doris,解决前面提到的问题,同时也做技术栈的收敛、迭代。...当然这还有一些工作要做,包括兼容性测试、性能测试,确保业务上Doris与ClickHouse、Druid有相当的体验,为此我们也在尝试一些手写SIMD优化关键执行代码,希望最终能够借助Apache Doris

1.2K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    日增百亿数据,查询结果秒出, Apache Doris 在 360商业化的统一 OLAP 应用实践

    + Druid + TIDB 的模式 以及 Flink + Doris 的模式,基于 Apache Doris 的新一代架构的成功落地使得 360 商业化团队完成了实时数仓在 OLAP 引擎上的统一,...实时数仓演进 为提升各场景下数据服务的效率,助力相关业务团队更好推进商业化增长,截至目前实时数仓共经历了三种模式的演进,分别是 Storm + Druid + MySQL 模式、Flink + Druid...第一代架构 该阶段的实时数仓是基于 Storm + Druid + MySQL 来构建的,Storm 为实时处理引擎,数据经 Storm 处理后,将数据写入 Druid ,利用 Druid 的预聚合能力对写入数据进行聚合...,我们只能利用 MySQL 定时任务的方式将数据定时从 Druid 写入 MySQL 中(类似于将 MySQL 作为 Druid 的物化视图),再通过 Druid + MySQL 的模式对外提供服务。...在升级完成后,我们按照不同业务场景的需求,将 Flink 处理完的数据分别写入 Druid 和 TiDB ,由 Druid 和 TIDB 对外提供数据查询服务。

    58210

    doris架构

    Doris on ES Doris-On-ES将Doris的分布式查询规划能力和ES(Elasticsearch)的全文检索能力相结合,提供更完善的OLAP分析场景解决方案: ES中的多index分布式...,让Doris可以具有了访问各式数据库的能力,并借助Doris本身的OLAP的能力来解决外部表的数据分析问题: 支持各种数据源接入Doris。...Spark Doris Connector Spark Doris Connector 可以支持通过 Spark 读取 Doris 中存储的数据。 当前版本只支持从Doris中读取数据。...Flink Doris Connector Flink Doris Connector 可以支持通过 Flink 读取 Doris 中存储的数据。...Doris output plugin 该插件用于logstash输出数据到Doris,使用 HTTP 协议与 Doris FE Http接口交互,并通过 Doris 的 stream load 的方式进行数据导入

    58310

    小米doris

    小米doris apache doris在小米演进架构中的应用,原来的方式是来自各平台的数据,都要有一个数据汇总的平台,但是由于数据量巨大,如果还用传统的mysql来做数据筛选,mysql的查询语句会变得越来越复杂...现在apache doris已经在天星数科、新零食、用户画像、BI广告投放等业务上广泛被使用,大大提高的服务的运算性能。...架构中有缓存,apache doris数据写入缓存,从缓存中读,缓存中读不到的从doris中读,那么,doris优势体现在性能更高吗?...增量数据100亿/天,导入压力大,可以从接手数据接入doris,然后做数据埋点做切入点? 它提供了留存、漏斗分析等函数,极大程度简化了开发的成本。...消息队列talos,在Flink中清洗建模后,被下游的Doris和Hive消费。全量数据会存储在Hive中,进行批量ETL或历史数据召回的查询。实时增量被存储在Doris中,用来做热数据的查询操作。

    24010

    大数据Doris(一):Doris概述篇

    Doris概述篇一、前言Doris由百度大数据部研发,之前叫百度Palo,于2017年开源,2018年贡献到 Apache 社区后,更名为Doris。...二、​​​​​​​Doris简介Apache Doris是一个现代化的基于MPP(大规模并行处理)技术的分析型数据库产品。...目前Doris最新版本已经支持Bitmap算法,配合预计算可以很好地解决去重应用场景。...总结:数据压缩率Clickhouse好ClickHouse单表查询性能优势巨大Join查询两者各有优劣,数据量小情况下Clickhouse好,数据量大DorisDoris对SQL支持情况要好六、​​​​​​​​​​​​​​...使用场景上图是整个Doris的具体使用场景,主要是它的接收数据源,以及它的一个整体的模块,还有最后它的一个可视化的呈现。

    14.7K36

    大数据OLAP系统比较

    预计算空间换时间 Apache Kylin Apache Doris Mondrian 从所有的系统中选出相对符合的再进行深入一点的比较如下: Clickhouse Druid Apache Kylin...不支持primary key sorting,支持inverted indexes 通过编写 Json 文件,以 HTTP 的方式请求 Druid 支持sql 国内使用Druid比较多,有赞,美团等...incubator-pinot/ 架构概述:https://pinot.readthedocs.io/en/latest/architecture.html 2323 star 活跃 国内使用Pinot的比较少 Apache Doris...Doris前身是Palo,Palo是百度自研的基于MPP的交互式SQL数据仓库 架构概述:https://doris.incubator.apache.org/Docs/cn/internal/metadata-design.html...#id3 项目地址:https://github.com/apache/incubator-doris 1294 star 活跃 C++ 来源百度 国内使用Pinot的比较少 Apache Kylin

    3.2K22

    从 Clickhouse 到 Apache Doris:有赞业务场景下性能测试与迁移验证

    Apache Druid: 针对 B 端商家实时分析报表场景,基于 Druid 构建维度查询系统,为商家提供实时指标查询服务。...02 Apache Druid :数据修复处理难度大 数据修复难度大: 当出现 Apache Flink 自身容错导致数据重复的情况,Druid 完全依赖写入侧进行幂等操作,由于自身不支持数据更新或删除...数据一致性问题: 对于 Druid 而言,导入数据后需要构建完 Segment 才能响应查询结果。...对于收益而言,我们需要评估新架构引入后的性能是否如预期提升,将 Apache Doris 分别与 Clickhouse、Druid、Kylin 进行对比评估。...后续在逐步完成 Clickhouse 的业务迁移后,基于 Clickhouse 的迁移经验,对未迁移的存量业务逐步完成 Druid、Kylin 两个组件的迁移,最终基于 Apache Doris 构建极速分析

    1.5K71

    大数据Doris(二):Apache Doris 部署介绍

    ----Apache Doris 部署介绍一、软硬件要求Doris 运行在 Linux 环境中,推荐 CentOS 7.x 或者 Ubuntu 16.04 以上版本,同时你需要安装 Java 运行环境,...Apache Doris的性能与节点数量及配置正相关,官方建议生产环境中部署Doris使用10~100台左右的机器来充分发挥Doris性能,其中3台部署FE(HA),剩余的部署BE。...时钟同步Doris 的元数据要求时间精度要小于5000ms,所以所有集群所有机器要进行时钟同步,避免因为时钟问题引发的元数据不一致导致服务出现异常。...关闭交换分区(swap )Linux交换分区会给Doris带来很严重的性能问题,需要在安装之前禁用交换分区。...五、网络需求Doris 各个实例直接通过网络进行通讯。

    3.3K00

    大数据Doris(二):Doris原理篇

    Doris原理篇一、Doris 特点1、支持标准SQL接口在使用接口方面,Doris 采用 MySQL 协议,高度兼容 MySQL 语法,支持标准 SQL,用户可以通过各类客户端工具来访问 Doris...5、支持物化视图Doris 也支持强一致的物化视图,物化视图的更新和选择都在系统内自动进行,不需要用户手动选择,从而大幅减少了物化视图维护的代价。...Doris 的 Runtime Filter 支持 In/Min/Max/Bloom Filter。...Doris的系统架构如下,Doris主要分为FE和BE两个组件:Doris的架构很简洁,使用MySQL协议,用户可以使用任何MySQL ODBC/JDBC和MySQL客户端直接访问Doris,只设FE(...FE:Frontend,即 Doris 的前端节点。主要负责接收和返回客户端请求、元数据以及集群管理、查询计划生成等工作BE:Backend,即 Doris 的后端节点。

    2.7K31

    常见开源OLAP技术架构对比

    MOLAP 的优点和缺点 MOLAP的典型代表是:Druid,Kylin,Doris,MOLAP一般会根据用户定义的数据维度、度量(也可以叫指标)在数据写入时生成预聚合数据;Query查询到来时,实际上查询的是预聚合的数据而不是原始明细数据...、Kylin、Presto、Impala、Doris。...从下图可知,这种场景最合适的是Elasticsearch、DorisDruid、Kylin这些。 场景二:复杂查询 复杂查询指的是复杂聚合查询、大批量数据SCAN、复杂的查询(如JOIN)。...注:部分内容来自https://zhuanlan.zhihu.com/p/55197560 5.7 Doris Doris是百度主导的,根据Google Mesa论文和Impala项目改写的一个大数据分析引擎...Doris的主要功能特性如下图所示: 【原图来自Apache Doris官方介绍PPT】 5.8 Druid Druid 是一种能对历史和实时数据提供亚秒级别的查询的数据存储。

    2.3K21
    领券