ApacheHudi

文章/答案/技术大牛

发布

LV1

发表了文章 2025-11-122025-11-12 14:31:30

Grab 构建基于大模型和 Agent 的自动数据分析平台实践

导读作为东南亚市场头部超级应用，Grab 深度覆盖出行、外卖、金融科技等多元场景。受高频金钱激励活动与金融服务场景的双重驱动，平台风控需求尤为迫切——传统风控...

ApacheHudi 2025-11-122025-11-12 14:31:30

agent、模型、实践、数据、数据分析

发表了文章 2025-08-182025-08-18 14:52:13

京东流量资产基于湖仓架构的落地实践

导读在当今数字化商业浪潮中，数据无疑是企业的核心资产，而流量数据更是电商巨头京东业务运转的关键驱动力。它广泛应用于搜索推荐、广告投放等多个核心业务场景，直接影...

ApacheHudi 2025-08-182025-08-18 14:52:13

存储、架构、流量、实践、数据

发表了文章 2025-08-092025-08-09 16:31:44

2025 年 7 月 Apache Hudi 社区新闻

《Apache Hudi™: The Definitive Guide[2]》的早期版本发布了新章节——这是第一本关于Hudi的官方书籍，由Shiyan Xu、...

ApacheHudi 2025-08-092025-08-09 16:31:45

索引、apache、表格、架构、数据

发表了文章 2025-07-212025-07-21 12:14:33

使用 Apache Hudi 对 Peloton 的数据基础设施进行现代化改造

Peloton 是一个全球互动健身平台，为全球数百万会员提供互联的、由教练指导的健身体验。Peloton 以其沉浸式课程和尖端设备而闻名，将软件、硬件和数据相结...

ApacheHudi 2025-07-212025-07-21 12:14:33

服务、工作、架构、数据、apache

发表了文章 2025-06-092025-06-09 21:35:05

探索 Apache Hudi 全新 LSM Timeline

Apache Hudi 1.0 引入了新的 LSM 时间线，以扩展长期表的元数据管理。通过将时间线存储重构为紧凑的版本化树布局，Hudi 实现了更快的元数据访问...

ApacheHudi 2025-06-092025-06-09 21:35:05

数据、性能、压缩、apache、timeline

发表了文章 2025-06-092025-06-09 21:33:50

2025 年 5 月 Apache Hudi 社区新闻

Hudi开源团队将在即将到来的数据流峰会（5月28-29日）上发表关于"在Lakehouse中使用Apache Flink & Hudi的非阻塞并发控制（NBC...

ApacheHudi 2025-06-092025-06-09 21:33:50

apache、存储、表格、并发、数据

发表了文章 2025-05-222025-05-22 11:21:53

石头剪刀布：Apache Hudi中的可插拔表格式

作者：Balaji Varadarajan，Apache Hudi PMC成员，开源贡献者和湖仓（Lakehouse）爱好者

ApacheHudi 2025-05-222025-05-22 11:21:53

apache、表格、插件、服务、数据

发表了文章 2025-05-192025-05-19 11:59:07

万字长文揭秘如何衡量云数据平台 ETL 性价比

由于数千家公司花费了数十亿美元，因此在评估和选择云数据平台（无论是数据湖仓一体还是数据仓库平台）时，性价比[1]至关重要。提取/转换/加载（ETL）工作负载...

ApacheHudi 2025-05-192025-05-19 11:59:08

性能、etl、测试、工作、数据

发表了文章 2025-05-092025-05-09 12:13:38

2025 年 4 月 Apache Hudi 社区新闻

欢迎阅读由 Onehouse.ai[1] 为您带来的2025年4月版Hudi通讯！本月，我们将为您带来另一轮令人兴奋的社区更新、技术深度探讨以及展示Apache...

ApacheHudi 2025-05-092025-05-09 12:13:38

索引、优化、apache、数据湖、数据

发表了文章 2025-04-142025-04-14 11:02:36

Uptycs: 构建快如闪电的分析

在 Uptycs，我们的数据平台架构多年来随着几乎所有数据平台的自然发展而发展。最初我们的架构围绕在线事务处理（OLTP）数据库（在我们的例子中主要是 P...

ApacheHudi 2025-04-142025-04-14 11:02:36

数据湖、工作、事件、数据、数据库

发表了文章 2025-04-052025-04-05 14:08:20

2025 年 3月 Apache Hudi 社区新闻

欢迎阅读由 Onehouse.ai[1] 为您带来的 2025 年 3 月 Hudi 通讯！本月，我们为您带来新一轮的项目更新、社区焦点和技术深度探讨，这些内容...

ApacheHudi 2025-04-052025-04-05 14:08:20

存储、架构、数据、同步、apache

发表了文章 2025-03-242025-03-24 16:45:30

详解 Apache Hudi 的记录合并

与流式处理工作负载相关的主要挑战之一是传入事件的无序性质。在典型的流式处理方案中，由于网络延迟、处理延迟或其他因素，事件可能会不按顺序到达。随着从各种来源（尤其...

ApacheHudi 2025-03-242025-03-24 16:45:31

压缩、apache、事件、数据、系统

发表了文章 2025-03-032025-03-03 21:49:54

抖音集团数据湖表优化与管理实践

抖音集团内部使用的数据湖格式称为 ByteLake，它是基于 Apache Hudi 深度定制的一个数据库框架，其核心功能包括支持 ACID、增量消费更新和湖仓...

ApacheHudi 2025-03-032025-03-03 21:49:54

服务、管理、实践、优化、数据湖

发表了文章 2025-02-182025-02-18 13:43:59

一文详解开放数据湖的并发控制

并发控制在数据库管理系统中至关重要，以确保多个用户对共享数据的一致且安全的访问。关系数据库（RDBMS），例如MySQL（InnoDB）[1]和分析数据库（例如...

ApacheHudi 2025-02-182025-02-18 13:43:59

服务、事务、数据、数据湖、并发

发表了文章 2025-02-062025-02-06 13:03:52

2025 年 1 月 Apache Hudi 社区新闻

欢迎阅读2025年1月的Hudi简报，由Onehouse.ai[1]为您带来！随着我们迈入新的一年，Hudi生态系统继续发展壮大，带来新的项目更新、社区贡献和实...

ApacheHudi 2025-02-062025-02-06 13:03:52

apache、数据湖、并发、博客、入门

发表了文章 2025-01-202025-01-20 21:02:06

加速 Lakehouse 表性能完整指南

数据Lakehouse的概念是由 Uber 的一个团队于 2016 年首创，当时该团队试图解决存储大量大容量更新插入数据的问题。该项目最终成为Apache Hu...

ApacheHudi 2025-01-202025-01-20 21:02:07

数据、索引、性能、存储、服务

发表了文章 2025-01-132025-01-13 12:29:14

流式高频写入：Apache Hudi 非阻塞并发控制详解

在流式摄取场景中，有很多使用案例需要从多个流式源进行并发摄取。用户可以将所有上游源输入合并到一个下游表中，以收集记录，以便跨联合查询进行统一访问。另一种非常常见...

ApacheHudi 2025-01-132025-01-13 12:29:14

压缩、apache、并发、布局、服务

发表了文章 2024-12-232024-12-23 13:21:41

Apache Hudi 1.0 重点特性及下一代Lakehouse详解

我们很高兴地宣布 Apache Hudi 1.0 的发布，这是我们充满活力的社区取得的里程碑式成就，它定义了下一代数据湖仓一体应该实现的目标。Hudi 在 20...

ApacheHudi 2024-12-232024-12-23 13:21:41

数据湖、数据、索引、apache、存储

发表了文章 2024-12-202024-12-20 16:58:31

Apache Hudi 1.0.0 版本正式发布

Apache Hudi 1.0.0 是 Apache Hudi 的一个重要里程碑版本。此版本包含重要的格式更改和令人兴奋的新功能。

ApacheHudi 2024-12-202024-12-20 16:58:31

迁移、并发、索引、统计、apache

发表了文章 2024-12-202024-12-20 16:58:01

2024 年 11 月 Apache Hudi 社区新闻

最新发布的 Hudi-rs 0.2.0 延续了首个版本的势头，为 Rust 和 Python 生态系统中的数据湖平台带来了更多功能。Hudi-rs 让无需 JV...

ApacheHudi 2024-12-202024-12-20 16:58:01

存储、数据湖、博客、数据、apache

12 3 4 5 6 7 8...12 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2019-12-25

个人成就

获得 478 次赞同
文章被阅读 401.1K 次

关注了：1关注者：103