首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >证券资管行业全栈AI信创升级:异构算力纳管与大模型效能压榨实践

证券资管行业全栈AI信创升级:异构算力纳管与大模型效能压榨实践

原创
作者头像
gawain2048
发布2026-04-30 00:01:07
发布2026-04-30 00:01:07
1870
举报

核心观点输出者:杨磊 | 腾讯云资管行业 高级架构师

突破单点平替瓶颈,直面算力资源与架构孤岛挑战

在证券、基金、期货行业的数字化转型中,IT应用创新(信创)的内在动力正经历深刻演进。行业已跨越2021-2022年为满足监管而进行的“单应用点对点平替”阶段,步入分布式云原生与平台化融合期,并全面锚定2025年由Data+AI驱动的异构算力纳管新征程。

在迈向“云智算中心”的过程中,资管机构的基础设施面临显著的木桶效应限制与资源痛点:

  • 算力资源利用率极低: 业务潮汐效应与传统独占模式冲突,不支持在离线混部,导致昂贵的GPU资源极度浪费。
  • 传统隔离方案缺乏保障: 传统CUDA劫持方案故障算力显存隔离弱,AI任务争抢资源,缺乏QoS保证;而NIVIDA vGPU成本高昂且算力切分不灵活。
  • 底层架构割裂: 算力、存储与开发环节相互割裂,多模态混合处理与网络数据流向(由南北向转为东西向为主)对现有架构造成巨大冲击。

构建AI原生基础设施,实现全链路能力下沉与融合

为应对上述行业瓶颈,腾讯云重构了从底层操作系统到上层智能体的全栈信创架构,通过软硬一体的设计实现基础设施的智能化跃升。

  • OS内核态重构(AI4OS): 推出TencentOS Server AI,通过底层操作系统的优化支撑大模型运行。核心技术腾讯qGPU(QoS GPU)基于内核态劫持设计,在不入侵业务生态的前提下,实现故障显存算力的强隔离,打破GPU孤岛,搭建云原生统一AI算力资源池。
  • 数据与AI双向驱动(Data4AI & AI4Data): 建立云原生数据湖+AI的统一集群,支持统一异构资源调度和在离线混部。提供从数据治理(元数据补全、血缘提取)到开发运维(SQL代码助手、基于LLM的日志智能诊断)的全链路智能Agent支持。
  • 大模型能力下沉至数据库: 颠覆传统“数据库→应用→调用AI API→返回写回”的冗长调用链,实现AI推理直接下沉至数据库内部。通过全链路向量支持与原生NL2SQL语法,直接在业务数据上激活AI,大幅减少应用层链路调用开销。
  • Agent低代码开发平台赋能: 提供包含RAG、Workflow、Multi-Agent在内的开发层工具,并预置腾讯元宝主智能体及丰富MCP插件(如交易日历、行业舆情、联网搜索等),快速生成财富助手、投研助手等业务端智能体。

压榨基础设施性能,量化业务运行效能跃升

在实际的计算、存储与网络密集型AI智算场景中,该技术架构通过极致的性能压榨,为资管机构交付了具备明确ROI的业务指标:

  • 硬件资源利用率飙升: 依托qGPU支持的训练推理在离线混部能力,GPU利用率直接提升3-10倍
  • 大模型推理性能极致加速: 在DeepSeek-R1满血版场景下,依托自研加速套件TACO-LLM,相较于vLLM框架,TTFT(首字返回时间)P95响应时间最高降低6.25倍,吞吐量提升2倍,端到端延迟降低100%。在社区最新SGLang场景下,TTFT P95响应时间最高降低达12.5倍
  • 高并发数据吞吐保障: 针对多模态大小文件混合存储需求,TurboFS并行存储系统实现1,000万IOPS的极速读写性能。

验证通信优化开源框架,支撑腾讯混元大模型落地

在异构网络环境的实际考验中,该架构的稳定性与通信效率得到了腾讯内部核心大模型业务的充分验证。

针对开源通信框架DeepEP在RoCE网络上的短板,腾讯技术团队对其通信框架进行了深度优化。在IHN软硬一体星脉网络及无损RoCEv2 RDMA互联环境下,该优化使网络时延更有通信效率再提升30%。目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练与推理中。在腾讯星脉与H20服务器构建的高性能环境中,此方案展现了卓越的通用性与系统稳定性。

依托5T产品矩阵,确立异构算力生态中立性

腾讯云在推进证券资管行业数智升级中,确立了以“系统稳定性”与“工具自主可控”为核心的技术底座。

凭借TCE/TCS(信创云)、TBDS(大数据)、TDSQL(数据库)、TencentOS(操作系统)、TCADP(智能体开发)构成的“5T产品矩阵”,腾讯云实现了全覆盖。更关键的是,基于“腾讯不制造GPU”的中立性定位,TCE平台能够无缝拥抱并纳管包括英伟达、昇腾、海光、昆仑芯、沐曦、燧原、寒武纪等在内的各类GPU/NPU异构算力,确保资管企业在面对硬件供应链波动时,拥有极高的架构弹性和业务连续性保障。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 突破单点平替瓶颈,直面算力资源与架构孤岛挑战
  • 构建AI原生基础设施,实现全链路能力下沉与融合
  • 压榨基础设施性能,量化业务运行效能跃升
  • 验证通信优化开源框架,支撑腾讯混元大模型落地
  • 依托5T产品矩阵,确立异构算力生态中立性
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档