前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >揭秘腾讯混元大模型:400+场景落地,协作SaaS产品全面接入

揭秘腾讯混元大模型:400+场景落地,协作SaaS产品全面接入

作者头像
量子位
发布于 2024-04-26 05:55:47
发布于 2024-04-26 05:55:47
1.2K0
举报
文章被收录于专栏:量子位量子位
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI

进入2024,大模型的风向变了。

当初“百模大战”时,只要简单粗暴拿个Demo搞MaaS(模型即服务),也就是让用户直接和大模型交互就足以上牌桌。

但现在,精耕细作搞应用,无论是原生AI应用,还是在已有产品上整合AI功能,成了最新潮流趋势。

就连一向低调神秘的腾讯混元大模型团队,也对外公布了应用落地进展:

腾讯混元大模型已经支持内部超过400个业务和场景接入,并通过腾讯云,面向企业和个人开发者全面开放。

这里面有很多为人熟知的“国民级”App,如企业微信、腾讯文档腾讯会议,都已经被AI全副武装。

还有更多腾讯云SaaS产品,如企业知识学习平台腾讯乐享、电子合同管理工具腾讯电子签等,也都有了AI加持。

腾讯混元大模型去年9月才首次亮相,是否有意在加速赶进度?

面对这个问题,腾讯混元大模型应用负责人张锋的回答就有点“凡尔赛”了:

我们只是按照正常的节奏,而且不光是接入大模型这么简单,已经进入打磨用户体验阶段。

在国内大模型厂商中,腾讯为何走出这样一条独特的路线?我们与张锋深入聊了聊。

腾讯AI产品,已经在打磨用户体验了

腾讯这么多年来一直以产品见长,AI时代也延续了这种风格。

就拿大模型的门面腾讯混元助手来说,“已经在打磨用户体验了”还真不是一句空话。

比如让它做一道简单的数学题,就可以发现AI在分析思路时非常流畅,还判断出题目中缺少条件,但最后给出结果前却稍有停顿

这并不符合大模型预测下一个token的运作原理,反倒像是真的在计算。

张锋揭秘,背后其实是AI先写了一段代码,在后端执行再返回结果

不得不说,这是一种解决大模型计算不准确问题的巧妙思路。但为什么不像GPT-4代码解释器版一样,把代码在前台显示出来?

腾讯混元助手一个重要场景是在微信小程序里使用,移动端展示代码就会显得特别长。张锋认为,现在的策略更符合用户体验习惯。

产品策略有了,但实现起来并不是一件简单的事。首先需要大模型明白当前用户需求需要精准计算,接着要生成合适的代码,最后还要成功通过函数调用来执行代码。

像这样从细节出发,打磨用户体验的例子还有很多。

比如大家很熟悉的腾讯会议,比起简单的AI语音转写和会议纪要总结,也做了不少差异化功能。

人的口头表达免不了停顿磕绊,腾讯会议AI在转写时把“嗯嗯啊啊”这样的部分智能规整,让会后文字记录看起来更整洁。

腾讯会议正在思考的另一个问题是,AI 生成的会议总结格式应该根据会议类型做出适当调整。

有明确主题和议程的会议,与大家畅所欲言的头脑风暴会议,需要的总结的格式就截然不同。因此,除了按时间分章节生成会议纪要外,腾讯会议也将推出按发言人/主题生成会议纪要的功能。

腾讯乐享,作为企业知识协作平台,在AI问答功能中就做到了识别提问者身份,做到回答千人千面。

如果是企业HR问AI有关薪酬结构的问题,就可以得到正面回答,其他岗位问同样的问题AI会拒绝提供。做到在便利的同时还非常安全。

湖南的律师事务所旷真接入了乐享助手去做AI知识库, 员工调研显示,对典型问题的AI回答满意度高达93分,端到端问题准确率达91%。

腾讯电子签,利用AI智能文件审查系统,识别合同风险条款,便于企业把控合同风险。企业对合同的风险控制需求各不相同。腾讯电子签还利用大模型和few-shot技术训练适合客户行业的垂类小模型,实现低成本运行。同时,通过混合云的模式,支持数据、模型的私有化部署,解决效率问题的同时保证合规。

总计400+的应用场景中,像这样的例子还比比皆是,这里不再赘述。

值得探讨的下一个问题是,腾讯如何做到在短时间内把AI产品打磨成熟的。

应用落地完整流程已跑通

在腾讯,大模型研发和业务应用是“双向奔赴”的。

根据张锋介绍,腾讯混元大模型研发过程中迭代速度很快,基本一个月就有四到五个版本。

这种速度就来自于和业务应用团队的高效合作,业务团队提出需求并贡献微调数据,研发团队就能有针对性的加强大模型的能力。上线测试过程中不断发现Bad case,也能迅速为大模型补齐短板。

在这种研发时就考虑到实际应用需求的模式下,腾讯混元大模型定位成了“实用级通用大模型”。

在国内大模型中,腾讯混元率先完成MoE(Mix of Experts,专家混合)架构升级,也就是从单个稠密模型升级到多个专家组成的稀疏模型。

MoE架构在激活参数不变情况下,总参数量加大,可以吞吐更多的token,同时,得益于较小的实际激活量,可显著降低训推成本。

这种路线的快速转型,也得益于与早期就了解了业务应用一方需求。

在与业务应用相互打磨的过程中,腾讯混元着重提升了通用模型的三个能力:

指令跟随能力,提出各种各样复杂的结构化长指令,腾讯混元都能按要求执行。

网页及文档理解能力,满足用户经常需要AI来总结长文本内容、减轻认知负的需求。

函数调用能力,也是腾讯混元团队判断大模型下一阶段的趋势之一。

通用大模型只是一个开始。

张锋介绍,在实际应用中,除了MoE主模型,如果调用量很大,从性价比的角度,各业务可以考虑使用不同尺寸的小模型,或者采用根据业务数据微调后的垂直小模型

微调(Fine-Tuning)是学术界通用叫法,在腾讯内部更愿意用“精调”

数据管理到自研AngelPTM训练框架、AngelHCF推理框架,再到模型评测、部署都有一股精耕细作的劲儿。

那么,面对如今 400+场景,以及未来更多业务都要上大模型的情况,研发团队显然无法分出精力逐个精调,如何解决这个问题呢?

答案是通过混元一站式平台,许多需求业务团队自己就能轻松搞定。

混元一站式平台不仅支持通过API接口直接调用混元大模型服务,还把大模型从训练到部署的很多流程都做到可视化,不用写代码只需鼠标点点就能快速完成。

有了混元一站式平台很多AI工程师都不怎么去折腾代码了,而不精通机器学习的业务工程师也能轻松上手操作。

接下来根据一个完整的模型精调到上线的过程,来了解混元一站式平台的能力。

首先是模型方面,平台提供了各种尺寸的基座模型矩阵。又分为通用模型、针对典型场景的优化模型、针对更垂直领域任务的子模型三个层次。

通用模型前面已经介绍过,场景优化模型可以举两个例子:开发Agent类应用,就可以用到强化了函数调用能力的模型来做;在知识密度高的场景,则可以选择优化摘要能力的模型。

如果不光有垂直的应用场景,还有垂直的数据集,混元一站式平台上就可以完成针对私有数据集的二次训练,让垂直子模型不仅有很好的通用理解能力,也很擅长专业领域的知识也很擅长。

接下来便要说到靠混元一站式平台的数据处理能力。

对于来自不同来源、质量参差的数据,从数据清洗流程如质检、去重,到统计调配不同主题数据的比例,再到更困难的数据价值观对齐,去除其中包含的偏见,都能靠自动化手段高效完成。

即使模型上线之后,再发现由于某类数据缺失造成模型某方面能力不强,也能迅速把补充数据投入到持续训练,支持模型的快速迭代。

有了基座模型和数据,就能通过精调来按需求打造专属模型。无论是速度快成本低的Lora精调,还是全参数深度精调都能在混元一站式平台完成。

精调后模型的评测、部署上线也都做到了自动化,特别是部署可以做到一键发布,是混元一站式平台的核心技术之一。

总结来看,相较于传统的机器学习平台,混元一站式平台的最大特点在于:提供预训练好的基座模型、自动化优化数据处理流程,以及精简高效的模型精调和应用集成工作流。该平台通过自动化和智能工具应对海量训练数据、模型定制和部署等挑战,极大地降低了业务接入大模型的门槛,实现了速度快、效果好、接入方式多样的目标。

一言以蔽之:已跑通从模型研发到应用落地的完整流程。

内部流程彻底跑通、并经过400+场景验证,外部开发者和企业可以通过腾讯云上API直接调用腾讯混元能力,接下来就要在助力合作伙伴业务智能化升级上发力了。

One More Thing

在这次交流的最后,量子位把在测试腾讯混元助手过程中发现的,模型仍无法很好解决的问题提交给了团队。

结束后已经是北京时间晚上6点多,比原定的结束时间推迟了近2个小时。

腾讯混元团队大部分成员都准备动身去往机场,要赶回深圳研发总部。

张锋没有与大家一同离开会议室。

简单告别后,他又一屁股坐回沙发上,一心沉醉到琢磨怎么改进Bad case的世界里了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
腾讯旗下协作SaaS产品全面接入混元大模型,实现智能化升级
4月22日,腾讯宣布旗下协作SaaS产品全面接入腾讯混元大模型,除企业微信、腾讯会议、腾讯文档等“一门三杰”产品,腾讯乐享、腾讯电子签、腾讯问卷、腾讯云AI代码助手等协作SaaS产品也都已实现智能化升级。
混元
2024/06/26
2200
腾讯协作SaaS全部接入腾讯混元!
企业微信、腾讯会议、腾讯文档、腾讯乐享、腾讯电子签、腾讯问卷、TAPD、腾讯云AI代码助手等腾讯协作SaaS产品,已全部接入腾讯混元大模型。
小腾资讯君
2024/04/23
3260
腾讯协作SaaS全部接入腾讯混元!
腾讯全面拥抱大模型,腾讯混元正式亮相
9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。
混元
2023/09/07
1950
对标GPT-4o,腾讯混元再升级,大模型加速落地!
9月5日,腾讯宣布推出新一代大模型“腾讯混元Turbo”,相比前代模型,腾讯混元Turbo性能显著提升,训练效率提升108%,推理效率提升100%,推理成本降低 50%,效果在多个基准测试上对标GPT-4o,且第三方测评居国内第一。
腾讯云AI
2024/09/06
1690
对标GPT-4o,腾讯混元再升级,大模型加速落地!
腾讯全面拥抱大模型,腾讯混元刚刚正式亮相
9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。
腾讯技术工程官方号
2023/09/09
5680
腾讯全面拥抱大模型,腾讯混元刚刚正式亮相
腾讯财报:400+业务场景接入,大模型应用加速!
国内首款一站式边缘平台EdgeOne,防护DDoS攻击峰值2.04Tbps,全球加速性能提高60%;
小腾资讯君
2024/03/20
1950
腾讯财报:400+业务场景接入,大模型应用加速!
来了!腾讯正式发布自研大模型混元!
在 2023 年 9 月 7 日举办的 2023 全球数字生态大会上,腾讯正式发布自研通用大语言模型——混元,并宣布通过腾讯云对外开放。本文将主要介绍混元的相关信息与腾讯发展大模型的态度与打法。腾讯云开发者公众号后续还将对话混元大模型技术团队,带来更为深度的技术解读,点个关注不迷路!
腾讯云开发者
2023/09/07
2.9K3
来了!腾讯正式发布自研大模型混元!
腾讯混元大模型,向你问好!
Prompt:请帮我写一篇专利,专利的主要内容是:本发明涉及农业种植技术领域,具体是一种农业种植用种子筛选装置,…,筛选机构与除尘机构之间设置有震动机构,本发明,通过设置除尘机构,一方面,第一风机可以将种子中含有的细小杂质吹起,另一方面,…,可以实现除尘箱和放置框的上下震动,使筛分更加快速有效的进行。不少于4k字
腾讯云AI
2023/09/09
4900
腾讯混元大模型,向你问好!
腾讯云副总裁吴运声:面向场景创造价值才是大模型发展的意义
9月5日,在2024腾讯全球数字生态大会云上智能峰会上,腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声分享了腾讯云在智能领域的最新进展,并探讨了大模型在产业中的应用和未来发展。
腾讯云AI
2024/09/06
2130
腾讯云副总裁吴运声:面向场景创造价值才是大模型发展的意义
扒一扒腾讯混元大模型“老底”
模型亮相的同时,腾讯还宣布几大腾讯业务就已经直接用上了:腾讯文档、腾讯会议、腾讯广告等均已接入。
量子位
2023/09/19
5440
扒一扒腾讯混元大模型“老底”
首批通过备案!腾讯混元大模型将陆续对公众开放
腾讯混元大模型是由腾讯全链路自研的实用级大模型,拥有超千亿参数规模、预训练语料超2万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
腾讯云AI
2023/09/21
4450
首批通过备案!腾讯混元大模型将陆续对公众开放
腾讯云发布三大AI大模型引擎,5分钟开发一款企业级知识应用
2024年5月17日,腾讯云生成式AI产业应用峰会在北京召开,公布大模型研发、应用产品的系列进展。
腾讯云AI
2024/05/20
1.5K0
腾讯云发布三大AI大模型引擎,5分钟开发一款企业级知识应用
走入商业化拐点,大模型“开箱即用”或突破行业困局
一方面,传统企业不知道怎么将AI融入原始业务,另一方面,AI企业难以找到合适的商业化路径。
科技云报道
2024/04/26
2350
走入商业化拐点,大模型“开箱即用”或突破行业困局
腾讯混元大模型升级:新增“文生图”,代码能力大幅提升
10月26日,腾讯宣布,腾讯混元大模型迎来全新升级,并正式对外开放“文生图”功能,展示了其在图像自动生成领域的领先能力。升级后的腾讯混元中文能力整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。
混元
2023/10/26
1670
腾讯混元宣布大语言模型和3D模型正式开源!
11月5日,腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源,支持企业及开发者精调、部署等不同场景的使用需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。
腾讯开源
2025/02/05
4900
腾讯混元宣布大语言模型和3D模型正式开源!
腾讯混元训练营开营,共创50多个大模型应用场景
由腾讯云、腾讯混元联合发起,腾讯学堂联合筹办的首期“腾讯混元训练营”正式开营。来自教育、医疗、金融等十多个行业的50家生态伙伴企业学员,通过组队分析场景痛点、拆解场景需求、匹配共建能力的方式,摸排共创出50余个大模型可应用行业的场景,并计划以此为基础共同研发相关的大模型应用。
腾讯开源
2025/04/02
1470
腾讯混元训练营开营,共创50多个大模型应用场景
腾讯大模型最新发布:主打一个实用
大模型不止可以跟你「通用性」地对话,也可以是微信读书的「AI问书」,随时给你讲解难点。也可以是腾讯会议的「AI小助手」,随时给你总结会议重点。
小腾资讯君
2024/05/17
4600
腾讯大模型最新发布:主打一个实用
腾讯混元大模型在研发安全漏洞修复的实践
利用传统方法做漏洞修复提效,只适用于比较简单的场景,比如根据版本号判断使用的开源组件是否存在漏洞,更多高危险的如导致数据泄露的注入类漏洞/账密类等,该方案难以通用。主要原因总结如下:
腾讯技术工程官方号
2024/03/06
1.7K0
腾讯混元大模型在研发安全漏洞修复的实践
后发而先至的腾讯混元大模型,到底有哪些技术亮点?
2023年的夏天已经结束了,但是,围绕AIGC大模型的关注热度,却丝毫没有衰退的意思。
鲜枣课堂
2023/10/20
1.2K0
后发而先至的腾讯混元大模型,到底有哪些技术亮点?
推动AI“产业实用”的腾讯云,不可小视
AI大模型技术俨然已经成为腾讯云业绩增长和未来发展中不可忽视的力量。 根据腾讯2024第一季度财报中显示,增长最快广告业务板块(同比增长26%至265亿元)的主要动力来源于升级了广告技术平台,除了精准营销外,为所有广告主推出的生产式AI驱动的广告素材创意工具也成为重要增长手段。
ToB行业头条
2024/06/03
1620
推动AI“产业实用”的腾讯云,不可小视
推荐阅读
相关推荐
腾讯旗下协作SaaS产品全面接入混元大模型,实现智能化升级
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档