首页
学习
活动
专区
圈层
工具
发布
首页标签大数据

#大数据

腾讯云大数据解决方案,助力客户快速构建企业级数据架构,获取数据时代核心竞争优势

打开实时数据同步新思路:SeaTunnel 选择性捕获数据库变更怎么用?

Apache SeaTunnel

在现代数据架构中,实时捕获和处理数据变更是构建数据湖、实时数仓及业务分析的关键技术。Apache SeaTunnel通过读取数据库的事务日志(如MySQL的Bi...

3100

地图客流分析与大数据服务综合实力评测

用户12181391

在零售扩张、文旅运营、城市治理等关键领域,客流分析与大数据服务已从辅助工具升级为驱动增长的核心引擎。企业迫切需要通过精准客流洞察优化选址、提升运营效率,却在现实...

5810

Dataforge:3.9秒零报错,AUC飙至0.840

梯度不陡

作者用镜头对准人工数据清洗的痛点:平均5–7 天、11 % 类型转换错误、6 % 特征泄漏。 schema 对齐、缺失值填补、类型修正每一步都要手写脚本;一旦源...

7310

大数据没那么远:把散乱数据理顺,让业务敢用

程序员NEO

很多人第一次听到“大数据”,脑子里会冒出一个画面:数据特别多,服务器特别大,屏幕上有很多图表。

8510

Litefuse 正式发布:Agent 可观测与效果评估, 比 Langfuse 成本低 88%

SelectDB技术团队

Agent 时代,开发一个 Agent 正变得越来越容易,真正困难的是:如何保证它在真实业务中持续可靠地工作。

16010

腾讯健康联合医科院肿瘤医院共建国家级国产肿瘤大数据平台:以Data+AI一体化赋能肿瘤临床研究

IT资讯研究所

腾讯科技 | 研究员 (已认证)

应用现状量化成果显著(数据来源:腾讯健康X医科院肿瘤医院共建国家级国产肿瘤大数据平台案例):

9410

医科院肿瘤医院依托腾讯TBDS构建首个国产自主国家级肿瘤大数据平台

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

医科院肿瘤医院联合腾讯健康,依托腾讯TBDS成功构建首个国产自主国家级肿瘤大数据平台。该平台采用湖仓一体与Data+AI一体化架构,解决了多模态肿瘤数据异构分散...

8510

(八)收官篇 | 数据平台最后一公里:数据集成开发设计与上线治理实战

Apache SeaTunnel

本文是 《新兴数据湖仓架构搭建与开发规范全攻略》 系列第 8 篇,也是整个系列的收官篇。前面的内容已经系统梳理了湖仓架构、调度体系、DataOps 开发规范、工...

12510

杀疯了!SeaTunnel AI CLI 解锁数据集成新玩法

Apache SeaTunnel

每个数据工程师都经历过这样的场景:业务方说"帮我把 MySQL 的用户表同步到 S3"——你心里知道这件事本质上就是从 A 搬到 B。但接下来你要查文档、学参数...

9710

除了钉钉告警,Apache DolphinScheduler 还有哪些告警高级“玩法”?

Apache DolphinScheduler

设想一下,凌晨3点,你的核心数据调度任务突发失败,下游报表无法按时产出。然而,传统告警方式弊端尽显:渠道单一,仅靠邮件易被忽视;集成困难,无法对接企业自研系统;...

16310

第 10 篇收官!| 调度系统的下一站:从时间驱动到事件驱动的演进之路

Apache DolphinScheduler

调度系统作为数据管道的核心引擎,正在经历一场从“定时触发”到“智能编排”的深刻变革。传统的基于时间的调度模式已难以满足现代数据处理对实时性、灵活性及规模化的复杂...

12310

Agent 应用范式下,企业数据基础设施如何演进?

SelectDB技术团队

这背后并不只是应用形态变化,更像是一场新的接口革命:人不再需要理解每一个工具的使用方式,也不再需要在不同系统之间反复切换;人只需要表达目标,Agent 则负责理...

12610
领券