首页
学习
活动
专区
圈层
工具
发布
首页标签大数据

#大数据

腾讯云大数据解决方案,助力客户快速构建企业级数据架构,获取数据时代核心竞争优势

模型越大越强?一文读懂大模型的能力涌现到底是什么

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

400

别只盯着模型参数了:聊聊多模态时代最容易被忽视的一件事——训练数据准备

Echo_Wish

很多人一聊 AI 多模态,第一反应就是:“模型多大?”“参数多少?”“是不是用了 Transformer + Diffusion + RLHF?”

1500

火情卫星监测分析:遥感数据如何支撑火灾防控

星图云

该平台融合云计算、大数据、地理信息系统、北斗网格码等多元技术,依托静止、极轨卫星以及地面感知设备,实现火情信息采集、分析、应用的全流程智能化、可视化升级。

2810

Kafka核心架构与分布式存储

IvanCodes

Kafka不仅是传统的消息队列中间件,更被官方定义为新一代的分布式事件流平台。它在海量流式计算场景中占据绝对核心地位,具备以下底层物理特性:

10610

AllData数据中台打通国产全链路,国产麒麟+国产海光CPU+国产OceanBase全栈国产化落地,信创环境100%可用

奥零数据科技

在过去,“信创”从一个政策口号,逐渐演变为政府、金融、能源、交通等关键行业的“必答题”。但很多企业发现:国产硬件有了,国产系统有了,国产数据库也有了,但把它们“...

4810

AI 会写稿了,人还要不要写?——聊聊生成式 AI 在数据增强与自动写稿里的伦理和质量问题

Echo_Wish

以前我们写技术文章、做数据分析、写报告,基本都得自己一个字一个字敲。现在呢?很多人打开 AI,输入一句话:

7110

什么是主数据?主数据管理怎么做?

帆软BI

公司系统越上越多,数据越来越乱,销售部门报的客户数量和财务系统对不上,采购说的供应商名录和仓库系统里的编码完全不一致。每次开会都在扯皮,谁的数据是对的?谁也说不...

5510

什么是批处理?一文搞清批处理和流处理的区别

帆软BI

作为一个在数据领域摸爬滚打过来的人,我经常看到新手朋友对批处理和流处理这两个词感到困惑。简单来说,它们都是处理数据的方式,但背后的逻辑和适用场景完全不同。在如今...

6010

(二)燃爆!AI 加持下,新兴数据湖仓架构与开发规范全解析!

Apache SeaTunnel

上文中,我们进行了数据仓库与数据湖概述,对数据湖、数据仓库与湖仓的差异有了基本了解。

8810

Apache SeaTunnel 2 月动态:过年也没闲着,社区都在忙些什么?

Apache SeaTunnel

Apache SeaTunnel 社区近期非常活跃,从最新的 PR 提交情况来看,开发者的工作重点主要集中在 2.3.13 版本发布准备、新连接器接入、Zeta...

5210

Apache SeaTunnel 要不要升?怎么升?一文讲透 2.x 升级 7 个关键点

Apache SeaTunnel

在数据集成进入常态化运行后,Apache SeaTunnel 的升级往往不是“想升就升”。版本兼容、配置变更、插件调整,任何一步疏忽都可能影响生产任务。本文结合...

6910

Apache DolphinScheduler 2 月社区动态:功能升级与优化齐飞

Apache DolphinScheduler

2026 年 2 月,Apache DolphinScheduler 社区保持了活跃的开发节奏。本月的工作重心围绕着系统稳定性的提升、现有功能的改进以及代码质量...

4510

第 4 篇|状态机:调度系统真正的灵魂

Apache DolphinScheduler

导读:在数据平台不断演进的今天,调度系统早已不只是“定时跑任务”的工具,而是承载复杂依赖与稳定性的核心中枢。《深入理解 Apache DolphinSchedu...

5010

当参数突破千亿:大数据+大模型范式与AI涌现能力的秘密

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

7810

同事问我什么是大数据分层?我用“厨房做菜”给他讲明白了!

数智转型架构师

看着老李抓狂的样子,我忍不住笑了。其实,老李的困惑非常有代表性。不仅是业务人员,很多刚入行的产品经理、甚至是一些前端后端的开发人员,面对大数据平台的复杂架构,都...

8510

日志不是垃圾,是金矿:聊聊基于日志的大规模用户行为建模如何撑起推荐系统

Echo_Wish

很多做推荐系统的同学,一上来就聊模型:DeepFM、DIN、Transformer……仿佛模型越“深”,推荐就越准。

6510

Elasticsearch 实战 | 一文搞懂 Lucene 的那些文件,每个都有自己的故事

岳涛

腾讯云 | 大数据工程师 (已认证)

本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)。

19720
领券