部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >比 R1 快 8 倍、价格仅 3%,智谱新推理模型来袭,能让免费智能体自己赚钱!张鹏:Agent 也有 Scaling Law

比 R1 快 8 倍、价格仅 3%,智谱新推理模型来袭,能让免费智能体自己赚钱!张鹏:Agent 也有 Scaling Law

作者头像
深度学习与Python
发布于 2025-04-05 06:26:48
发布于 2025-04-05 06:26:48
1510
举报
作者 | 华卫、褚杏娟

3 月获了两笔上亿巨额融资的智谱, 现在来“交作业”了。

刚刚,智谱推出最新的 AutoGLM 沉思模型,不仅具备深度研究能力(Deep Research),还能实现实际操作(Operator)。并且,这个会“边想边干”的智能体还能自己接单赚到钱。

据介绍,14 天前,智谱针对 AutoGLM 沉思小范围开展了一项秘密测试。其注册了一个专注于做生活知识科普的小红书账号,用该智能体去不断生成笔记内容,比如选取咖啡壶、化妆品成分对比等,最终在两周时间里收获了 5000 个粉丝,还接到很多商单的邀请,并在昨天成功发出第一条商单,赚到 500 块钱。

在现场的 live demo 环节,AutoGLM 又通过一个“用你最擅长的方式,帮我赚 100 块钱”的 Prompt,展示了自己的“赚钱”能力。在回答过程中,该智能体对自己进行了多轮的“灵魂拷问”,并自主打开知乎 / 小红书输入要搜索的信息、自己选择好筛选条件,一页页浏览网页内容和图片,通过不断的思考、反思、纠错,最终确定了写作、调查问卷等擅长的方式。

目前,AutoGLM 沉思已在智谱清言 PC 客户端上线,用户可免费体验其研究能力和操作能力。沉思功能也已经正式上线智谱清言网页端、PC 端和手机 App,免费、不限量地开放。此次发布的为 preview 版本,核心支持 research 场景。

官网体验链接:https://autoglm-research.zhipuai.cn/?channel=331#get_started

智谱表示,未来两周,他们将进一步扩展更多智能体执行能力,包括推出“虚拟机”版本。此外,智谱还将于 4 月 14 日开源 AutoGLM 沉思核心链路的模型和技术。据智谱 CEO 张鹏称,AutoGLM 背后有一系列的模型能力,Agent 也同大模型一样存在类似的 Scaling Law。

AutoGLM 沉思背后的核心模型

“让机器不仅能够思考,还能主动行动。”智谱表示,这是他们对 AI Agent 的核心理解,目前已经探索到 L3-Agentic LLM 阶段。

据介绍,与 OpenAI 的 Deep Research 不同,AutoGLM 沉思不仅能深入研究,还能真正执行任务,推动 AI Agent 从单纯的思考者,进化为能交付结果的智能执行者。它是首个集深度研究能力和网页操作能力于一体的 Agent。

智谱研究员刘潇表示,AutoGLM 沉思的能力实现依赖于三个关键特性:

  • 深度思考:能够模拟人类在面对复杂问题时的推理与决策过程。其基于智谱的 Z1 推理模型强化学习训练,与 Deep Research 基于 o3 模型的训练过程相似,模型可以根据不同任务目标自主规划和动态决策,从而不断地根据反馈调整计划,而不需要提前设计的工作流。
  • 感知世界:能够像人一样获取并理解环境信息。该模型具备 GUI 阅读能力,不仅依靠调用 API,还能像人类一样打开并浏览网页,找全想要的信息。
  • 工具使用:能够像人一样调用和操作工具,完成复杂任务。其整合了智谱自研的 AutoGLM 设备操作能力,例如能在报告完成后根据结果进一步的发送邮件。

据悉,智谱很早便布局 AI Agent,并率先提出 Phone use(AutoGLM),几乎与 Anthropic 在同一时间发布了 Computer use。

张鹏表示,AutoGLM 也不是一蹴而就的,它的动脑、动手、能看见,背后是一系列的模型能力。AutoGLM 沉思的技术演进路径包括:GLM-4 基座模型 → GLM-Z1 推理模型 → GLM-Z1-Rumination 沉思模型 → AutoGLM 模型。

具体来说,智谱在 GLM-4-Air 基座模型的基础上,训练出推理模型 GLM-Z1-Air,基于 Z1 模型,结合工具使用和完成长程推理能力,训练出沉思模型,来作为 AutoGLM 沉思的大脑,最后集成了智谱自研的智能体技术 AutoGLM,成为 AutoGLM 沉思的“手脚”。

张鹏介绍,之所以叫 AutoGLM 沉思,就是因为在 AutoGLM 沉思背后的模型,是其全新推出的 Agent 大脑——沉思模型,即通过强化学习,让模型学会自我批评、反思、甚至沉思,并通过更长的深度思考时间换取更优的效果。沉思突破了实时联网搜索、动态工具调用、深度分析和自我验证,实现真正的长程推理和任务执行。

全新推理模型:R1 的 8 倍速度、1/30 价格

在发布 AutoGLM 沉思的同时,智谱发布并开源了其最新的推理模型 GLM-Z1-Air(32B)。

据介绍,GLM-Z1-Air(32B)拥有比肩 DeepSeek R1 的推理性能,在推理速度上,极速版 GLM-Z1-Air 最高生成速度可达每秒 200Tokens ,是 R1 的 8 倍,而价格仅需 R1 的 1/30。“不要每个月 200 美元”张鹏调侃道。

此外,GLM-Z1-Air 可在消费级显卡上运行,更进一步解放开发者在硬件方面的限制。

基于 GLM-Z1-Air 的基座模型,智谱重新训练了一个 320 亿参数的基模 GLM-4-Air。在 GLM-4-Air 的预训练阶段,加入了更多的代码类、推理类数据,并在对齐阶段,针对 Agent 能力进行了对齐,使其更擅长工具调用、联网搜索等 Agent 任务。

据称,GLM-4-Air-0414 以 32B 参数量比肩更大参数量的国内外主流模型,且在适配智能体任务方面特别有效。这是因为智能体任务往往涉及多轮复杂交互,32B 的参数量使得 GLM-4-Air-0414 能快速执行复杂任务。

此外,智谱也在 MaaS 平台上将免费模型 GLM-4-Flash 的基座版本更新至 GLM-4-Flash-0414,并推出了对应的推理版本 GLM-Z1-Flash,在保留大部分效果的情况下更轻量级、更高速,完全免费调用,以适用于更广泛的应用场景。

基于 GLM-Z1,智谱通过扩展强化学习训练,提升了模型结合工具使用完成长程推理能力,训练出沉思模型 GLM-Z1-Rumination。据智谱介绍,该模型突破了传统 AI 单纯依赖内部知识推理的局限,创新性地结合实时联网搜索、动态工具调用、深度分析和自我验证,形成完整的自主研究流程:

  • 实时搜索:主动获取最新信息,突破信息孤岛。
  • 深度分析:进行多角度逻辑推理,避免单一思维路径。
  • 动态验证:不断修正假设,提高研究的准确性与逻辑性。

GLM-Z1-Rumination 能够主动理解用户需求,在复杂任务中不断优化推理、反复验证与修正假设,使研究成果更具可靠性与实用性。智谱表示,相比于传统的推理模型,沉思模型可引领 AI 助手进入一个“高智商”到“高智商 + 高自主”的阶段,自主完成更复杂、更深入的研究任务。

“Agent 界也有 Scaling Law”

AutoGLM 是智谱去年 10 月在 CNCC 上发布,作为全球首个能够在手机上执行长达 50 多步 action 的大模型智能体。AutoGLM 的出现也意味着大模型首次跳出了 Chatbot 的框架,初步具备了与现实世界互动的能力。

最新发布的 AutoGLM 沉思版,其背后的 AutoGLM 能力也随之演进。

“大家都知道,大模型的预训练和后训练存在 Scaling Law。然而,不只是大模型推理满足这一规律,我们发现 Agent 也存在类似的 Scaling Law。”张鹏说道,“通过扩展训练时的 inference compute,我们观察到 Agent 展现出了更强的性能。”

张鹏表示,这一 Agent Scaling Law 的背后,是智谱的自进化在线课程强化学习算法框架,WebRL。智谱通过设计由易到难的任务序列,逐步引导模型从简单场景向复杂场景过渡学习,从而提升训练效率和最终性能。这种方法模拟人类学习过程,通过动态调整任务难度,帮助模型积累基础能力后再挑战高难度任务,有效避免直接处理复杂问题时的训练不稳定现象。

在 Agent Scaling Law 的基础上,智谱进一步发现了 Agent 存在的能力涌现。比如,团队在训练过程中从未教给 AutoGLM 沉思访问过巨潮资讯网,然而当发送指令“帮我收集昨天关于具身智能的相关研报”时, AutoGLM 沉思能够规划出通过访问巨潮资讯解决问题的方案,并顺利操作了网站。

“AutoGLM 的动手能力目前在行业内处于 Sota,包括浏览器、手机和电脑在内的使用工具能力,全面领先。张鹏说道。

在斯坦福大模型中心《AI 指数 2024》选定的智能体基准评测 AgentBench 上,AutoGLM 系列模型在 5 个测试环境中也取得了 SOTA 的成绩。其中,在 Phone Use 基准(AndroidLab & AndroidWorld)中,AutoGLM-Phone 的任务成功率较此前最佳成绩提升超过 20%;在 Browser Use 基准上,AutoGLM-Web 也全面超越 OpenAI GPT-4o 和 Anthropic Claude-3.5-Sonnet,展现了在网页交互场景中的领先能力。

在 GUI 智能体领域,智谱自研模型 GLM-PC(CogAgent)在多个权威评测榜单上取得 SOTA 成绩。凭借仅 9B 的参数,CogAgent 超越了包括 GPT-4o + UGround、Claude Computer Use 等更大规模的同类模型或商用 API。

据悉,上述模型将于 4 月 14 日开源。并将在未来两周内陆续上线 MaaS 平台(bigmodel.cn)。

结束语

张鹏表示,智谱始终专注于 AGI 基座模型的研发,目前已经探索到 L3-Agentic LLM 阶段,我们将 GLM 一系列 Agent 能力,统称为 Agentic GLM。未来很长一段时间内,智谱将聚焦 Agentic GLM 的研发。

基座模型方面,智谱表示,将依托自主大模型技术,极致、专注地探索智能水平的上线,同时推动从基座模型、到 Agent 基座模型、到 Agent 统一协议与平台、再到 Agent 应用与生态的等 Agent 相关技术的建设。

“2025 年将会是 Agent 应用的元年,智谱也将深度参与这一场浪潮。”张鹏说道。

声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 InfoQ 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
我们来看一个非常经典的案例:只需要输出你想讨论的话题,AI 就能自动去小红书、知乎等平台上深度查询、总结完整报告,并转化为面向大众的传播内容。短短 14 天里,AI 孵化出了一个 5000 多个粉丝的小红书账号,还接到了商单。
机器之心
2025/04/01
2620
第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
看过智谱现场演示,我觉得AI要开始卷“动手能力”了
仅仅是几个KOL的评测文章,Manus就被捧上了神坛,邀请码被炒到上万元,淋漓尽致的诠释了用户对AI Agent的热忱。
Alter聊科技
2025/03/31
1170
智谱 GLM 新成员开源:高性能、推理快,体验入口“z.ai”免费开放
继智谱在上个月发布了他们的AutoGLM沉思全新智能体,在AI圈子引起广泛的反向,很多人纷纷使用AutoGLM沉思去完成自己工作中的一些任务,如写研究报告、行业调研等等。
AIGC新知
2025/04/16
3010
智谱 GLM 新成员开源:高性能、推理快,体验入口“z.ai”免费开放
AutoGLM沉思:像人一样的深度思考+动手执行,让复杂问题迎刃而解,而且全免费
如果你是一个自媒体博主,你是否遇到这样的情况,因为白天上班工作忙,晚上下班还要勤勤恳恳的去运营自己的账号,一天的劳累已经让你冒火星子?
AIGC新知
2025/04/01
4010
AutoGLM沉思:像人一样的深度思考+动手执行,让复杂问题迎刃而解,而且全免费
智谱发布AutoGLM沉思版,国产DeepResearch来了,人人皆免费。
说真的,即使玩过了这么多的DeepResearch产品,我也没想到,他们能扔出个这么个有趣的玩意。
数字生命卡兹克
2025/04/14
3780
智谱发布AutoGLM沉思版,国产DeepResearch来了,人人皆免费。
又一AI利器!智谱发布全新推理大模型,速度快8倍,价格比DeepSeek-R1更低~
现在的大模型多如牛毛,LLaMA、Qwen、Bert等等,根本学不过来,甚至有的卷王还看Transform源码,这对于一般人来说学习曲线太长了。
派大星的数据屋
2025/04/18
1210
又一AI利器!智谱发布全新推理大模型,速度快8倍,价格比DeepSeek-R1更低~
考研数学得126分、还能编写小游戏,智谱首个推理模型来了,人人免费用
2024 年的最后一天,智谱 GLM 模型家族迎来了一位新成员——GLM-Zero 的初代版本 GLM-Zero-Preview,主打深度思考与推理。
机器之心
2025/02/03
1430
考研数学得126分、还能编写小游戏,智谱首个推理模型来了,人人免费用
GLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级
今天上午,在 AI 开放日上,备受关注的大模型公司智谱 AI 公布了一系列行业落地数字:
机器之心
2024/06/17
1.2K0
GLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级
AI现场发了2万红包,打开了大模型Act时代
最近一段时间,大模型领域正在经历智能体(AI Agent)引发的革命。Anthropic 推出的升级版 Claude 3.5 Sonnet,一经推出即引爆了 AI 圈。
机器之心
2025/02/14
1040
AI现场发了2万红包,打开了大模型Act时代
智谱Agent抢跑OpenAI,GLM-PC一句话搞定一切!网友:有AGI那味了
想象这样一个场景:微信上给xxx发送祝福语,再给他发送一个新春图片和一个新春祝贺视频。
新智元
2025/02/15
990
智谱Agent抢跑OpenAI,GLM-PC一句话搞定一切!网友:有AGI那味了
跟大厂拼价格到底!智谱 AI 宣布模型全面降价,刘慈欣、AI 老罗线上“整活儿
“大模型的 Scaling Law 并未失效,AI 技术的增长进入了一个全新的阶段。也就是说大模型技术的创新依旧是突飞猛进的进行时,甚至还有速度越来越快的迹象。”智谱 AI CEO 张鹏在 6 月 5 日的 Open Day 上说道。
深度学习与Python
2024/06/17
2300
跟大厂拼价格到底!智谱 AI 宣布模型全面降价,刘慈欣、AI 老罗线上“整活儿
智谱AI:国产全自研大模型商业化落地新解法
放眼当下的科技浪潮,AI大模型无疑是一年多来持续引人注目的焦点。基于大模型的算法推理,30秒即可生成完美可用的Word、PPT文档,工作时长不必再以小时计算;真人对话一般输入简短文字,就能在30秒内得到想要的图画、代码、文本、视频……大模型让科幻小说中的场景,走进了千行百业、千家万户的现实生活。
大数据文摘
2024/03/21
9240
智谱AI:国产全自研大模型商业化落地新解法
用行动回应“实体清单”,智谱发布了一系列新模型
1月15日晚间,美国商务部工业和安全局(BIS)修订了《出口管制条例》(EAR),以安全为由在实体清单中分两批增加了25个中国实体。
Alter聊科技
2025/01/16
1710
用行动回应“实体清单”,智谱发布了一系列新模型
国产GPTs来了,基于智谱第4代大模型!模型性能均达GPT-4九成以上
按官方说法,GLM-4性能相比GLM-3提升60%,逼近GPT-4(11月6日最新版本效果)。
量子位
2024/01/17
2100
国产GPTs来了,基于智谱第4代大模型!模型性能均达GPT-4九成以上
智谱 AI 狂飙:与商业化博弈的一年
2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时,张帆如是说。
AI科技评论
2024/03/18
5200
智谱 AI 狂飙:与商业化博弈的一年
最接近GPT-4的国产大模型诞生了
在 1 月 16 日举办的 2024 智谱 AI 技术开放日 Zhipu DevDay 上,智谱 AI 正式发布新一代基座大模型「GLM-4」。
机器之心
2024/01/17
3710
最接近GPT-4的国产大模型诞生了
智谱AI再放“大招”,30秒将任意文字生成视频
7月26日的智谱Open Day上,在大模型赛道上动作频频的智谱AI,正式推出视频生成模型CogVideoX,并放出了两个“大招”:
Alter聊科技
2024/07/26
1890
智谱AI再放“大招”,30秒将任意文字生成视频
推理模型的“年终考试”,谁是国内目前最好的“o1”?
思考是文明存在的根本,是人类探索未知的永恒追求,现在也成了大模型技术演进的一个重要方向。
Alter聊科技
2024/12/31
1730
72B世界基座模型启动,小鹏的端到端智驾正在验证Scaling Laws
作为公认的新范式,它可以让整个智能驾驶系统反应更快,更加拟人,能处理以往方法无法解决的大量 corner case,被认为是自动驾驶通向 L3、L4 的正确方向。
机器之心
2025/04/18
870
72B世界基座模型启动,小鹏的端到端智驾正在验证Scaling Laws
探索 Scaling Law 的边界与 AI 芯片的新竞争格局
在 AI 的快速发展中,Scaling Law 的瓶颈带来了新的竞争态势。AI 应用,尤其是深度学习、大规模并行计算、推理和训练等领域,要求计算能力以非线性、指数级的方式增长。为了应对这种需求,AI 芯片的设计必须超越传统的通用计算架构,融入更多专用硬件、异构计算和创新的架构设计。
深度学习与Python
2025/02/06
1230
探索 Scaling Law 的边界与 AI 芯片的新竞争格局
推荐阅读
第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
2620
看过智谱现场演示,我觉得AI要开始卷“动手能力”了
1170
智谱 GLM 新成员开源:高性能、推理快,体验入口“z.ai”免费开放
3010
AutoGLM沉思:像人一样的深度思考+动手执行,让复杂问题迎刃而解,而且全免费
4010
智谱发布AutoGLM沉思版,国产DeepResearch来了,人人皆免费。
3780
又一AI利器!智谱发布全新推理大模型,速度快8倍,价格比DeepSeek-R1更低~
1210
考研数学得126分、还能编写小游戏,智谱首个推理模型来了,人人免费用
1430
GLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级
1.2K0
AI现场发了2万红包,打开了大模型Act时代
1040
智谱Agent抢跑OpenAI,GLM-PC一句话搞定一切!网友:有AGI那味了
990
跟大厂拼价格到底!智谱 AI 宣布模型全面降价,刘慈欣、AI 老罗线上“整活儿
2300
智谱AI:国产全自研大模型商业化落地新解法
9240
用行动回应“实体清单”,智谱发布了一系列新模型
1710
国产GPTs来了,基于智谱第4代大模型!模型性能均达GPT-4九成以上
2100
智谱 AI 狂飙:与商业化博弈的一年
5200
最接近GPT-4的国产大模型诞生了
3710
智谱AI再放“大招”,30秒将任意文字生成视频
1890
推理模型的“年终考试”,谁是国内目前最好的“o1”?
1730
72B世界基座模型启动,小鹏的端到端智驾正在验证Scaling Laws
870
探索 Scaling Law 的边界与 AI 芯片的新竞争格局
1230
相关推荐
第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档