首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Apache Kylin VS Apache Doris

    Apache Kylin 和 Apache Doris 都是优秀的开源OLAP系统,本文将全方位地对比Kylin和Doris。...本文对Apache Kylin的理解基于近两年来在生产环境大规模地使用,运维和深度开发,我已向Kylin社区贡献了98次Commit,包含多项新功能和深度优化。...本文对Apache Doris的理解基于官方文档和论文的阅读,代码的粗浅阅读和较深入地测试。 注: 本文的对比基于Apache Kylin 2.0.0 和Apache Doris 0.9.0。...JobServer的高可用是基于Zookeeper实现的,具体可以参考Apache Kylin Job 生成和调度详解。...14 总结 本文从多方面对比了Apache Kylin和Apache Doris,有理解错误的地方欢迎指正。本文更多的是对两个系统架构和原理的客观描述,主观判断较少。

    3.2K31

    Apache Kylin 深入Cube和查询优化

    Apache Kylin在大数据领域对Cube进行了扩展,通过执行 MapReduce/Spark任务构建Cube,对业务所需的维度组合和度量进行预聚合,当查询到达时直接访问预计算聚合结果,省去对大数据的扫描和运算...如图1所示,Apache Kylin会对SQL的查询计划进行改写,把源表扫描、多表连接、指标聚合等在线计算转换成对预计算结果的读取,极大减少了在线计算和I/O读写的代价。...通过这个评分,就可以一眼对整个Apache Kylin的性能体现有一个直观认识,也可以直观地看出Cube优化的重要性和必要性。...如要优化,建议检查集群资源配置和调度。 ? 图14 MapReduce任务生命周期 寻找查询瓶颈 查询是Apache Kylin的强项,但也存在种种因素导致某些查询变慢。...图 - 18待优化查询(2) 总结 本文着重介绍了Apache Kylin中对Cube和查询进行优化的原理、工具、方案和案例,希望能够帮助使用Apache Kylin的朋友解决工作上的棘手问题。

    2.2K80

    Apache Kylin集成superset

    安装好这个工具之后,我们就可以通过superset连接kylin进行访问了。相应的安装步骤和使用,kylin在官方文档中已经说的非常清楚了,这里就不再一一赘述。...这篇文档主要将非root权限下的kylinpy和superset安装以及相关配置。 由于所有的开发工作都是通过ssh连接至服务器完成,一般都是登录到个人账号或者某个公共账号进行操作。...由于我们在前面已经将自定义路径加入环境变量PATH中,因此,这里可以直接通过easy_install和pip命令使用我们自己安装的版本,而并非/usr/bin下面的easy_install和pip,可以通过...superse初始化 关于superset的详细安装和配置信息可以参考:https://superset.incubator.apache.org/installation.html。...可以看到,目前我们已经能够通过页面对superset进行访问了: 通过第一步中创建的用户名和密码就可以登录进行操作了,目前,最新版本的superset已经支持中文了。

    1.1K20

    Apache Kylin存储和查询的分片问题

    相关概念介绍 为了了解Kylin存储和查询的分片问题,需要先介绍两个重要概念:segment和cuboid。相信大数据行业的相关同学都不陌生。...Kylin对于每一个cuboid都会有一个唯一的id(一个cube的所有segment都有着相同的cuboid和cuboid id)。而这个id就是根据用户在定义cube时,维度列的排序来确定的。...对于每个segment都会保存cuboidShardNums和totalShards成员。...build过程中生成的region数量和大小,从而进行相应的优化。...这样关于Kylin存储和查询的分片问题就整理的差不多了,本文省略了一些Kylin在使用HBase进行存储时的一些相关细节,后续会陆续补充上来,有感兴趣的同学可以一起交流学习。

    84660

    Apache Kylin 历险记

    Kylin 概述 1.1 Kylin 定义 Apache Kylin(麒麟)是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由...官网:https://kylin.apache.org/cn 1.2 Kylin特点 Kylin的主要特点包括支持SQL接口、支持超大规模数据集、亚秒级响应、可伸缩性、高吞吐率、BI工具集成等。...可伸缩性和高吞吐率:单节点Kylin可实现每秒70个查询,还可以搭建Kylin的集群。 BI工具集成,Kylin可以与现有的BI工具集成,具体包括如下内容。...构建过程中会涉及多个Cuboid的创建,具体创建过程由kylin.Cube.algorithm参数决定,参数值可选 auto,layer 和 inmem, 默认值为 auto,即 Kylin 会通过采集数据动态地选择一个算法...(layer or inmem),如果用户很了解 Kylin 和自身的数据、集群,可以直接设置喜欢的算法。

    78830

    Apache Kylin原理与架构

    Kylin的介绍 Apache Kylin是一个开源的大数据分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力(可以把Kylin定义为OLAP on Hadoop)。...Apache Kylin于2015年11月正式毕业成为Apache基金会(ASF) 顶级项目,是第一个由中国团队完整贡献到Apache的顶级项目。...Kylin拥有很好的快速查询能力和高并发处理能力,原因是kylin将高复杂度和多表连接操作转换成预计算结果的查询。 Kylin的一个主要特点之一就是 空间换时间。...kylin提供的JDBC驱动的classname为org.apache.kylin.jdbc.Driver, url前缀为jdbc:kylin:;使用jdbc接口和使用restful接口走的流程是相同的...,比如Tableau 资料参考: http://kylin.apache.org/cn/ 书籍:基于kylin构建大数据分析平台

    1.6K20

    Apache Kylin Cube优化方式

    中参数xxx=4096 也就是说当cubeid数量大于4096个时是无法进行创建的,会报error 为: 1.检查Cubeid数目 执行命令 :bin/kylin.sh org.apache.kylin.engine.mr.common.CubeStatsReader...: 根据业务的维度组合,划分出具有强依赖的组合,这些组合称之为聚合组,用来控制哪些CubeID用来组合计算 聚合组优化效果:如果有4个维度,分别为A,B,C,D,那么就会有16个cubeid,如果AB和CD...kylin的默认设置中kylin.hbase.region.cut时5G,kylin.hbase.region.count.min=1,kylin.hbase.region.count.max=500...=1 上面设置为最小为2个分区,每个分区大小为1G,最多设置100个region分区 参考资料 : http://kylin.apache.org/blog/2016/02/18/new-aggregation-group.../ http://kylin.apache.org/docs/howto/howto_optimize_cubes.html Apache Kylin 权威指南

    65920

    Apache Kylin的入门安装

    Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区。...从官网的介绍来看Kylin是一个OLAP的数据查询引擎,其特点就是快。...公司最近准备引入Kylin做数据分析,原来也听说过 但一直没有接触,现在正好可以验证下Kylin是否是传说中那么NB,今天我们先来看看如何安装部署Kylin。...然后去Kylin官网下载对应的kylin版本,链接如下: http://kylin.apache.org/cn/download/ 下载的具体版本是: apache-kylin-2.0.0-bin-hbase1x.tar.gz...启动成功之后,访问地址:http://hostname:7070/kylin (kylin的启动过程感觉有点慢,差不多1分钟之后,在访问这个地址基本能生效) 并输入默认的用户名和密码:ADMIN / KYLIN

    1.1K80

    Apache Kylin VS Apache Doris全方位对比

    Apache Kylin 和 Apache Doris 都是优秀的开源OLAP系统,本文将全方位地对比Kylin和Doris。...本文对Apache Kylin的理解基于近两年来在生产环境大规模地使用,运维和深度开发,我已向Kylin社区贡献了98次Commit,包含多项新功能和深度优化。...本文对Apache Doris的理解基于官方文档和论文的阅读,代码的粗浅阅读和较深入地测试。 注: 本文的对比基于Apache Kylin 2.0.0 和Apache Doris 0.9.0。...JobServer的高可用是基于Zookeeper实现的,具体可以参考Apache Kylin Job 生成和调度详解。...14 总结 本文从多方面对比了Apache Kylin和Apache Doris,有理解错误的地方欢迎指正。本文更多的是对两个系统架构和原理的客观描述,主观判断较少。

    13.4K82

    Apache Kylin的实践与优化

    从2016年开始,美团到店餐饮技术团队就开始使用Apache Kylin作为OLAP引擎,但是随着业务的高速发展,在构建和查询层面都出现了效率问题。...Apache Kylin是一个基于Hadoop大数据平台打造的开源OLAP引擎,它采用了多维立方体预计算技术,利用空间换时间的方法,将查询速度提升至亚秒级别,极大地提高了数据分析的效率,并带来了便捷、灵活的查询功能...成果展示 资源整体情况 擎天现有20+的Kylin任务,经过半年时间持续优化迭代,对比Kylin资源队列月均CU使用量和Pending任务CU使用量,在同等任务下资源消耗已明显降低。如下图所示: ?...展望 Apache Kylin在2015年11月正式成为Apache基金会的顶级项目。...从开源到成为Apache顶级项目,只花了13个月的时间,而且它也是第一个由中国团队完整贡献到Apache的顶级项目。

    1K30

    Apache Kylin最新的Streaming OLAP实现

    Apache Kylin是第一个来自中国的Apache顶级开源项目,连续两年获得了InfoWorld最佳开源大数据工具奖,2016年更是与Google TensorFlow一起获得该奖。...因此在2013年我们评估了七八种商业的和开源的技术方案之后,最后决定自己做。 我们希望把数据仓库的能力在Hadoop之上构建起来,这也就诞生了Kylin。...Apache Kylin的架构 我们会要求把数据放在Hadoop上,用Hive呈现出来。在Kylin里面定义整个元数据,在一个企业里面不是工程师去做,而应该是BI人员或者分析师去做。...如果你想把Kylin这个实时的东西拿去做实时监控和监控告警并不一定合适,因为那个是毫秒级别的,它是机器处理的。Kylin是给人用的,人去看一个报表或者查一个东西的时候,对于延迟的容忍性比较高。...声明:"Apache and Apache Kylin are either registered trademarks or trademarks of The Apache Software Foundation

    1.2K70
    领券