首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >腾讯云叶嘉梁:大模型驱动的腾讯云储存应用创新与底层优化 | 智见

腾讯云叶嘉梁:大模型驱动的腾讯云储存应用创新与底层优化 | 智见

作者头像
云存储
发布2025-04-11 10:50:52
发布2025-04-11 10:50:52
3070
举报
文章被收录于专栏:腾讯云存储腾讯云存储

“伴随着 AI 应用而来的是,数据迎来爆发式增长,大模型本身更依赖于数据积淀,即无数据不 AI。”

叶嘉梁

腾讯云存储产品副总经理

在上海举办的以“探索未至之境”为主题,第二届 AI 大模型企业落地应用场景创新峰会上,腾讯云存储产品副总经理叶嘉梁,发表了《大模型驱动的腾讯云存储变革:应用创新与底层优化》的主题演讲。

以下为DTinsight视频精彩:

以下为DTinsight整理演讲内容精炼:

一直以来,数据、算法和算力“三驾马车”决定着人工智能发展应用广度和深度。而在 AI 大模型与产业融合的变革中,存储架构优化对数据、智能解析等发挥着重要影响。

全面拥抱AI

从今年初开始,尤其 DeepSeek 热潮开启模型平权时代,从训练进化到了推理,整个业界进入到一个新的阶段。从技术角度看,AI 技术迎来了大跃迁,推动 AI 应用层面进入到多元化时期。伴随着 AI 应用浪潮,数据也迎来爆发式增长,而模型本身依赖于数据沉淀,既无数据不 AI。

在AI浪潮下,腾讯云存储发布了 Tencent Cloud Data Platform 数据平台解决方案,包含对象存储 COS、数据万象 CI、企业网盘,以数据加速器 GooseFS 能力加速,涵盖了数据采集、数据清洗、模型训练、模型推理、数据"智"理等环节以及整个训练的完整阶段。

基于数据处理和数据管理两大挑战,腾讯云构建了数据万象平台,支持一站式数据处理服务,并在 COS 上搭建了整个数据工作流,包括图片处理、视频处理、音频处理、内容审核、文档处理、 AI 处理六大板块。其中,在 AI 大模型给存储带来变革浪潮之下,腾讯云存储针对 AI 智能处理板块的每一个细化能力进行了底层能力重构。

在数据管理方面,数据万象充分依托大模型与向量数据库技术,专门为对象存储 COS 赋予了强大的智能检索 MetaInsight 能力,形成了覆盖数据特征提取、元数据管理、跨模态检索等多个关键环节的智能数据管理体系。当数据上传至COS后,借助事件触发机制自动触发 MetaInsight 的特征提取工作以及索引构建流程,它会自动为COS存储桶创建增量式元数据和内容索引,并且有力地支持通过自然语言描述来进行秒级检索。目前该方案已在媒资管理、智能网盘、AIGC训练数据治理等众多场景得到了应用。

DeepSeek 热潮之后,腾讯云存储基于数据万象 MetaInsight 能力引入 DeepSeek 进行了探索布局,将对应的文档进行切片、相关内容检索,推进到下一层结合自研模型能力对数据知识进行判断,形成更好的知识重组,提供正确的答案。

基于 DeepSeek

打造智能知识库

DeepSeek 出来以后,为行业带来了不同思路的思考,企业网盘在知识库方面存在较大商机,AI 能够为知识库带来较大潜力。从用户问题到多模态,腾讯云也在企业知识库、团队知识库和个人知识库等方面进行了探索。

从内容检索到模型推理,再到应答阶段,贯穿整个流程,针对每种不同模态的模型,实现更精细化的权限管理,基于 DeepSeek 能力和自研模型结合,构建企业知识库的框架。腾讯云企业网盘基于 DeepSeek 的智能知识库“盘小知”上线,它针对企业各种私域知识,能够帮助企业实现更好的管理、更好的存储和用得更好。

面向自动驾驶、机器人、AIGC 场景,COS 数据湖统一存储,通过 GooseFS 对接多个处理平台,提升数据预处理和模型训练效率,加速推理过程模型分发效率5~10倍。

针对数据湖中的数据,通过三大阶段对数据进行处理:第一个阶段,整个数据的预处理阶段,提供 NVME SSD 计算节点本地SSD资源,发挥计算端的数据加速。通过高性能并行文件系统 GooseFS-X 提升数据训练效率;第二阶段训练集群,无论是 TensorFlow,还是 PYTRCH,都通过 POSIX 能力实现训练加速。第三阶段是推理阶段,在从训练到推理发展趋势下,无论是文生图还是多模态,都在进行模型分发加速,从而形成三大阶段整体加速能力。

从网盘应用到数据万象,再到 GooseFS,腾讯云存储在 AI 应用层面为客户提供相关解决方案。面对各种挑战,腾讯云存储也在进行从应用层到底层的演进,提供更好的存储性能,助力企业数字化转型进程。

关于腾讯云

腾讯云是腾讯集团倾力打造的云计算品牌,面向全世界各个国家和地区的政府机构、企业组织和个人开发者,提供全球领先的云计算、大数据、人工智能等技术产品与服务,以卓越的科技能力打造丰富的行业解决方案,构建开放共赢的云端生态,推动产业互联网建设,助力各行各业实现数字化升级。

腾讯云拥有完善的产品体系,为客户提供高效稳定、安全可靠、丰富场景、开放生态和7×24小时提供服务保障。

2025年3月28日,由DTinsight中国数智发展研究中心主办,珠峰AI、TGO20组、DT千川汇智库支持,腾讯云智算、腾讯云存储、腾讯云安全、无问芯穹、合合信息、中企通信以及光环新网联合协办,以“探索未至之境”为主题的第二届AI大模型企业落地应用场景创新峰会,在上海成功举办。来自各领域专家、学者、技术大咖以及近200名企业的CDO、CIO、IT总监以及数字化领军者与会。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯云存储 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档