前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Apache Kudu 1.8.0 发布

Apache Kudu 1.8.0 发布

作者头像
Fayson
发布于 2018-11-16 03:21:09
发布于 2018-11-16 03:21:09
9150
举报
文章被收录于专栏:Hadoop实操Hadoop实操

10月26日,Kudu在其社区官宣了Kudu 1.8.0的正式发布。以下是主要的一些更新内容:

1.引入一个手动数据rebalancer的工具,可以在tablet server之间重新分布table的replica。

2.添加了对Kudu Python客户端的IS NULL和IS NOT NULL谓词的支持。

3.改进多种工具从而简化诊断和故障排除。

4.Kudu Spark connector现在支持Spark Streaming DataFrames。

5.为Python客户端增加Pandas支持。

具体参考:

https://kudu.apache.org/releases/1.8.0/docs/release_notes.html

Apache Kudu项目仅仅只是发布了源代码,要创建Kudu1.8,需要遵循以下2步:

1.下载Kudu的源代码:

https://kudu.apache.org/releases/1.8.0/

2.按照文档创建Kudu1.8:

https://kudu.apache.org/releases/1.8.0/docs/installation.html#build_from_source

为方便起见,Kudu Java客户端库,Spark DataSource,Flume sink和其他Java集成的二进制JAR文件,也都发布到了ASF Maven仓库,参考:

https://search.maven.org/search?q=g:org.apache.kudu%20AND%20v:1.8.0

Python客户端的源码参考:

https://pypi.org/project/kudu-python/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-10-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Hadoop实操 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
kudu介绍与操作方式
Kudu是cloudera开源的运行在hadoop平台上的列式存储系统,拥有Hadoop生态系统应用的常见技术特性,运行在一般的商用硬件上,支持水平扩展,高可用。
YG
2018/06/09
7.7K0
0824-7.1.4-Kudu时间同步了还是报时间未同步异常处理
Kudu对时间同步有严格的要求,本文档描述了一次集群已经使用NTP进行时间同步,Kudu组件还是报时间未同步问题处理流程。
Fayson
2020/12/29
1.5K0
0824-7.1.4-Kudu时间同步了还是报时间未同步异常处理
从 Apache Kudu 迁移到 Apache Hudi
在构建本地数据中心的时候,出于Apache Kudu良好的性能和兼备OLTP和OLAP的特性,以及对Impala SQL和Spark的支持,很多用户会选择Impala / Spark + Kudu的技术栈。但是由于Kudu对本地存储的依赖,导致无法支持的数据高可用和弹性扩缩容,以及社区的逐渐不活跃,越来越多的用户,开始迁移到云上的Trino / Spark + Hudi 技术栈,本文通过一个实际的例子,来看一下迁移过程中发生的代码的重构和数据的迁移。
ApacheHudi
2022/12/09
2.3K0
从 Apache Kudu 迁移到 Apache Hudi
Kudu设计要点面面观(下篇)
参考:《Kudu设计要点面面观(上篇)》,本文适用知识共享-署名-相同方式共享(CC-BY-SA)3.0协议。
王知无-import_bigdata
2019/07/29
2.7K0
Kudu设计要点面面观(下篇)
Apache Kudu 2
https://cloud.tencent.com/developer/article/1964369
jasong
2022/03/27
1.9K0
Kudu1.7的新功能
前两天Fayson介绍过《CDH5.15和CM5.15的新功能》,与CDH5.15同时发布的还有CDSW1.4和Kudu1.7,CDSW1.4的新功能可以参考《CDSW1.4的新功能》,以下我们具体看看Kudu1.7的新功能。
Fayson
2018/08/03
1.3K0
0540-5.15.0-Spark2使用HBase-Spark访问HBase
越来越多的用户使用Spark对接HBase,对接HBase的方式有多种,通过HBase-client API实现,也有直接Spark On HBase的方式实现,比较常见的有华为的Spark-SQL-on-HBase,Hortonworks的Apache HBase Connector和Cloudera提供的SparkOnHBase,目前Cloudera的SparkOnHBase已提交的HBase的主干版本。本篇文章Fayson主要在Spark2环境下使用Cloudera的SparkOnHBase访问HBase。
Fayson
2019/03/07
3.3K1
Apache IoTDB v0.13.3 发布!
Apache IoTDB V0.13.3 已经发布,此版本是 0.13.2 的 bug-fix 版,主要提升了文件合并的稳定性,优化了重启速度。
Apache IoTDB
2023/03/21
4200
Apache IoTDB v0.13.3 发布!
客快物流大数据项目(四十二):Java代码操作Kudu
目录 Java代码操作Kudu 一、构建maven工程 二、导入依赖 三、​​​​​​​创建包结构 四、​​​​​​​初始化方法 五、​​​​​​​创建表 六、​​​​​​​插入数据 七、​​​​​​​查询数据 八、修改数据 九、​​​​​​​删除数据 十、​​​​​​​修改表 十一、​​​​​​​删除表 Java代码操作Kudu 一、​​​​​​​构建maven工程 二、导入依赖 <repositories> <repository> <id>cloudera</id>
Lansonli
2022/02/24
6510
客快物流大数据项目(四十二):Java代码操作Kudu
Spark2Streaming读非Kerberos环境的Kafka并写数据到Kudu
在前面的文章Fayson介绍了在Kerberos环境下《Spark2Streaming读Kerberos环境的Kafka并写数据到Kudu》,本篇文章Fayson主要介绍如何使用Spark2 Streaming访问非Kerberos环境的Kafka并将接收到的数据写入Kudu。
Fayson
2018/08/17
1K0
Spark2Streaming读非Kerberos环境的Kafka并写数据到Kudu
Apache IoTDB v0.13.2 发布!
Apache IoTDB v0.13.2 已经发布,此版本是 0.13.1 的 bug-fix 版,主要修复了一部分权限问题,并在 Rest 接口中增加更多执行功能。
Apache IoTDB
2023/03/21
4100
Apache IoTDB v0.13.2 发布!
大数据物流项目:Kudu 入门使用(五)
KUDU 支持用户对一个表指定一个范围分区规则和多个 Hash 分区规则,如下图:
Maynor
2022/11/30
1.3K0
大数据物流项目:Kudu 入门使用(五)
从 0 到 1 学习Kudu 看这一篇就够了!!
最近在招聘要求下突然看到了Apache kudu 于是花了几天时间研究了下,下面简单的给大家介绍下 记得收藏。
大数据老哥
2021/07/29
3.3K0
四万字硬刚Kudu | Kudu基础原理实践小总结
Hadoop生态系统发展到现在,存储层主要由HDFS和HBase两个系统把持着,一直没有太大突破。在追求高吞吐的批处理场景下,我们选用HDFS,在追求低延迟,有随机读写需求的场景下,我们选用HBase,那么是否存在一种系统,能结合两个系统优点,同时支持高吞吐率和低延迟呢?
王知无-import_bigdata
2021/09/22
3.4K0
独家 | 一文读懂Apache Kudu
前言 Apache Kudu是由Cloudera开源的存储引擎,可以同时提供低延迟的随机读写和高效的数据分析能力。Kudu支持水平扩展,使用Raft协议进行一致性保证,并且与Cloudera Impala和Apache Spark等当前流行的大数据查询和分析工具结 合紧密。本文将为您介绍Kudu的一些基本概念和架构以及在企业中的应用,使您对Kudu有一个较为全面的了解。 一、为什么需要Kudu Kudu这个名字听起来可能有些奇怪,实际上,Kudu是一种非洲的大羚羊,中文名叫“捻角羚”,就是下图这个样
数据派THU
2018/01/30
3.2K0
独家 | 一文读懂Apache Kudu
Apache IoTDB v0.13.1 发布!
Apache IoTDB v0.13.1 已经发布,此版本是 0.13.0 的 bug-fix 版,主要修复了对齐序列的相关读写异常,memtable 刷盘异常、重启异常等。同时进行了一些改进,如支持对结果集空值的过滤,通过 Session 根据模板创建时间序列等,支持 select 表达式中填写常量,C++ 写入接口避免排序的优化等。
Apache IoTDB
2023/03/21
5940
Apache IoTDB v0.13.1 发布!
kudu可视化工具:kudu-plus
Kudu是为Apache Hadoop平台开发的列式数据库。Kudu拥有Hadoop生态系统应用程序的常见技术属性:它可以商用硬件上运行,可横向扩展,并支持高可用性操作。
chimchim
2023/10/17
4630
kudu可视化工具:kudu-plus
0718-6.3.0-CDH6.3的新功能
你现在可以在Cloudera Enterprise 6.3中使用OpenJDK 11,在集群中安装OpenJDK 11时,默认使用G1GC为CDH大多数服务作为垃圾回收机制,这可能需要进行调优以避免内存过量使用。
Fayson
2019/10/25
2.2K1
Apache Hudi 0.8.0版本重磅发布
自从Hudi 0.7.0版本支持Flink写入后,Hudi社区又进一步完善了Flink和Hudi的集成。包括重新设计性能更好、扩展性更好、基于Flink状态索引的写入Pipeline;支持Flink写入MOR表;Flink批量读取COW和MOR表;流式读取MOR表;同时支持了Hudi作为Source和Sink的Flink SQL Connector,在Hudi 0.8.0版本发布后,用户可以使用Flink1.11+体验上述所有新特性。
ApacheHudi
2021/04/13
7650
0487-CDH6.1的新功能
北京时间2018年12月19日,Cloudera正式发布Cloudera Enterprise 6.1.0,上次发布CDH6.0是8月30日,差不多过去了3个多月的时间,参考Fayson之前的文章《Cloudera Enterprise 6正式发布》。从CDH6.0到CDH6.1是一次minor version的更新,但更新内容较多,在开始接下来的细化功能讨论前,我们先看看几项重点更新的内容:
Fayson
2018/12/29
2.5K0
相关推荐
kudu介绍与操作方式
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档