
数据及观点来源: 腾讯全球数字生态大会 - 何阳(中国信息通信研究院云计算与大数据研究所副所长)
当前金融业正从传统的“评估与服务模式”向“可预测、个性化和生态化模式”转变,但在大模型技术的规模化商业应用中,遭遇了明显的落地断层。目前产学研各界发布的大模型基准测试(达200多个)超过50%侧重于通用语言类评测,缺少与具体金融业务结合的垂直领域能力评估。
在实际业务接入中,金融机构面临三大核心痛点:
为打破评测与业务脱节的现状,中国信息通信研究院联合多方发起“基于金融业务场景的大模型应用研究计划”(FAIS),并正式发布了《基于金融业务典型场景的大模型应用能力评估模型》(FLMM)。
FLMM评估模型摒弃了单一的性能跑分,构建了涵盖3个能力域、21个能力子域、54个能力项的立体化标准:
针对大模型应用成效,FLMM模型确立了以客观定量计算为主的效能评估方法,超过80%的调研机构建议根据“通用场景”与“特色场景”设定差异化评价指标。以下为指导决策的三个核心业务量化公式:
(应用大模型后的自动化任务数量 - 应用大模型前的自动化任务数量)/(应用大模型前的自动化任务数量)× 100%。实际使用的资源量 / 分配的资源总量 × 100%。Q = MTBF = 1/N * ΣTi(N次故障修复后继续投入使用的总工作时间均值)。此外,通过(应用后业务指标 - 应用前业务指标)/ 应用前业务指标 × 100%得出业务贡献度,直接评估AI部署与预期业务目标的匹配程度。
根据深度调研,当前金融机构落地大模型采用“全心投入、先内后外、从易到难”的渐进式路径。目前,机构投入超过千万的占比超过40%,人员投入超过50人的超过35%;且已有三分之一的机构把大模型集成到核心业务流程中。
客户联合实践验证:
中国信通院联合中国银行业协会、工商银行、农业银行、邮储银行、交通银行、国泰君安证券、中信建投证券、人保财险等40余家头部金融机构及科技企业,共同启动了FLMM首批评估工作。
通过实施“灯塔计划”,专项突破智能营销、风控合规、智能运营、智能投顾、智能代码、数据处理及产品创新七大核心场景。依据实践成效,FLMM将应用能力成熟度划分为1-5级,达到5级(卓越级)的机构,其大模型能够在所有评价维度上达到行业领先水平,创新推动业务模式变革,具备显著的核心竞争力。
大模型的深度应用离不开底层算力生态与合规技术架构的支撑。通过产学研用信息共享平台的推动,当前大模型建设正加速融入金融信创体系:
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。