首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >性能超越SOTA模型90%!揭秘Claude多智能体系统的构建心法

性能超越SOTA模型90%!揭秘Claude多智能体系统的构建心法

作者头像
AIGC新知
发布于 2025-06-16 04:15:29
发布于 2025-06-16 04:15:29
2190
举报
文章被收录于专栏:AIGC新知AIGC新知
图片
图片

AIGC新知

分享AI实践,探讨人与AI如何协作 --〉智能体 | 工作流 | 大模型 | AI赋能。

292篇原创内容

我们最新推出的 Research 功能,赋予了 Claude 利用多个AI智能体(Agent)协同工作的能力,以更高效地探索复杂问题。

从一个原型到稳定的生产级系统,这段旅程充满了工程挑战,也让我们学到了关于系统架构、工具设计和提示词工程的宝贵经验。

本文将深入剖析我们构建这一复杂系统所遵循的核心原则。我们相信,这些经验对于任何想要构建自己的多智能体系统的开发者来说,都将极具价值。

本文是针对claude最新blog的解读。

一、为什么选择多智能体系统?

研究工作常常涉及开放式问题,其探索路径充满未知与动态变化。你无法为复杂课题预设一条固定的解决路线,因为真正的研究总是在不断发现新线索、调整方向的过程中前进。

图片
图片

这种不确定性,恰恰是AI智能体大显身手的舞台。

1. 模拟人类的集体智慧

多智能体系统的核心优势在于“分而治之”与“并行处理”。它就像一个高效的研究团队:一个“首席研究员”负责规划,然后将任务分解,交给多个“子研究员”(Subagent)去并行探索不同方面。

每个子智能体在自己的上下文中独立工作,深入挖掘信息,然后将最精华的洞见“压缩”并汇报给首席,从而实现高效的“情报压缩”。

正如人类社会近万年的发展证明,个体的智力提升是线性的,而群体的集体智慧和协作能力则带来了指数级的飞跃。AI智能体同样如此,单个智能体能力再强也有极限,而智能体集群能完成的任务则远超想象。

2. 惊人的性能提升

我们的内部评估显示,对于需要同时探索多个独立方向的“广度优先”类查询,多智能体系统表现尤为出色。

在一个内部研究评估中,由 Claude Opus 4 担任首席、Claude Sonnet 4 担任子智能体的多智能体系统,其性能比单兵作战的 Claude Opus 4 高出整整 90.2%。

例如,在“找出标普500信息技术板块所有公司的董事会成员”这一任务中,多智能体系统通过高效分解任务,成功找到了答案;而单个智能体则因缓慢的串行搜索而最终失败。

3. 成功的关键:足够的“思考量”

我们发现,性能差异的95%可由三个因素解释:模型选择、工具调用次数,以及最重要的——Token(代币)使用量。其中,Token使用量本身就解释了80%的性能方差。这验证了我们的架构设计:通过将工作分配给拥有独立上下文窗口的多个智能体,系统获得了更强大的并行推理能力,投入了足够的“思考量”来解决问题。

当然,凡事皆有代价。 多智能体系统消耗的Token数量非常可观。我们的数据显示,智能体交互的Token消耗约为普通聊天的4倍,而多智能体系统更是高达15倍。这意味着,它更适用于那些“结果价值远高于计算成本”的高价值任务。

每天解决一个日常生活的小痛点,今天,你想让我帮助你解决什么?

AIGC新知:畅所欲言,或许,你就是下一个拯救世界的人。

转发3赞1

问一问

二、系统架构概览:总指挥与执行者

Research系统采用“编排者-工作者”(Orchestrator-Worker)模式,即一个首席智能体(Lead Agent)协调整个流程,并将具体任务委派给并行的专业子智能体。

图片
图片

架构图

工作流程详解:

与传统的检索增强生成(RAG)静态地拉取信息块不同,我们的系统采用动态的多步研究过程。

图片
图片

原文解释:当用户提交查询时,系统会创建一个 LeadResearcher 代理,该代理将进入迭代研究流程。LeadResearcher 首先仔细考虑该方法并将其计划保存到 Memory 中以持久保存上下文,因为如果上下文窗口超过 200,000 个令牌,它将被截断,因此保留计划很重要。然后,它会创建具有特定研究任务的专用子代理(此处显示了两个,但可以是任意数量)。每个 Subagent 独立执行 Web 搜索,使用交错思维评估工具结果,并将结果返回给 LeadResearcher。LeadResearcher 综合这些结果并决定是否需要更多研究 — 如果需要,它可以创建额外的子代理或改进其策略。一旦收集到足够的信息,系统就会退出研究循环并将所有发现传递给 CitationAgent,后者会处理文档和研究报告以确定引用的特定位置。这可确保所有声明都正确归因于其来源。最终的研究结果(包括引文)将返回给用户。

1、启动与规划

用户提交查询后,系统创建一个首席研究员(LeadResearcher)智能体。

它首先会思考并制定一个详细的研究计划,并将其保存到外部记忆(Memory)中,以防在长流程中因上下文窗口限制而丢失关键计划。

图片
图片

如图所示

2、任务分解与并行执行

首席研究员根据计划,创建出多个子智能体(Subagent),并为每个分配明确的研究任务(例如,图中的子智能体分别负责搜集不同AI公司的信息)。

图片
图片

如图进行了标注

3、独立研究与评估

每个子智能体独立进行网页搜索,并利用“交错思考”(interleaved thinking)技术来评估工具返回结果的质量,然后将发现的关键信息返回给首席研究员

图片
图片

如图所示

4、综合与迭代

首席研究员综合所有子智能体的发现,判断信息是否充足。如果需要,它可以启动新一轮的研究,或创建更多的子智能体。

5、引用与生成

一旦信息收集完毕,系统会将所有原始文档和研究报告交给一个专门的引文智能体(CitationAgent)。它负责精确定位文中每个论断的来源,并添加引用,确保所有信息的准确性和可追溯性。

图片
图片

图 引文智能体(CitationAgent)进行溯源论断

6、交付结果

最终,一份附有完整引用的高质量研究报告将呈现给用户。

图片
图片
三、构建高效智能体的八大提示词工程心法

多智能体系统的复杂性源于其“协同”过程。我们早期的智能体常常犯错,比如为简单问题创建50个子智能体,或因为彼此干扰而陷入混乱。

以下是通过提示词工程解决这些问题的核心原则:

图片
图片

1、换位思考,理解智能体

要优化提示词,你必须先理解智能体的“心智模型”。

我们通过模拟器,一步步观察智能体的行为,这让我们能立即发现失败模式,例如在已有足够信息时仍不停止搜索,或选择错误的工具。

2、教会“总指挥”如何分配任务

首席智能体必须向下属下达清晰的指令,包括:明确的目标、输出格式、推荐使用的工具和信源,以及清晰的任务边界。模糊的指令(如“研究半导体短缺”)会导致子智能体工作重叠或偏离方向。

3、根据任务复杂性伸缩投入

我们在提示词中嵌入了资源分配规则。

例如:简单事实查找只需1个智能体调用3-10次工具;复杂的比较分析可能需要2-4个子智能体,每个调用10-15次。这能有效防止在简单问题上“用力过猛”。

4、精心设计和选择工具

工具的API描述至关重要。一个糟糕的描述会把智能体引向歧途。我们为智能体设定了明确的启发式规则:先检查所有可用工具,优先选择专用工具而非通用工具。

5、让智能体自我改进

Claude 4模型本身就是出色的提示词工程师。我们创建了一个“工具测试智能体”,当给它一个有缺陷的工具时,它会尝试使用并重写工具描述以避免未来的失败。通过这个过程,未来智能体使用新描述完成任务的时间减少了40%

6、先广泛探索,再深入钻研

智能体倾向于使用过长、过具体的查询,导致结果很少。我们通过提示词引导它们:先用简短、宽泛的查询了解概况,再逐步缩小范围

7、引导思考过程

利用扩展思考模式(Extended thinking mode)作为智能体的“草稿纸”。首席智能体用它来规划,子智能体用它来评估搜索结果、发现不足并规划下一步行动,这大大提升了它们的适应性和效率。

8、并行工具调用,实现速度革命

引入了两种并行化:

1)首席智能体并行启动3-5个子智能体;

2) 子智能体并行调用3个以上的工具

这一改变,将复杂查询的研究时间缩短了高达90%,让过去需要数小时的工作在几分钟内完成。

每天解决一个日常生活的小痛点,今天,你想让我帮助你解决什么?

AIGC新知:畅所欲言,或许,你就是下一个拯救世界的人。

转发3赞1

问一问

四、如何有效评估智能体?三大支柱

评估多智能体系统极具挑战,因为它们是非确定性的——两次运行可能走上完全不同但都有效的路径。我们不能只看过程,更要看结果。

图片
图片

支柱一:立即开始,小样本评估

在开发早期,一个小的提示词调整可能带来巨大的性能提升(例如成功率从30%跃升到80%)。我们从大约20个代表性查询开始,这足以让我们快速验证改动的效果。不要等到能建立大型评估集时再行动。

支柱二:利用大语言模型LLM)进行规模化评估

我们使用一个“LLM评委”,根据一份详细的评分标准(如事实准确性、引文准确性、完整性、信源质量、工具效率等)来给研究结果打分。这种方法让我们能够规模化地评估成百上千份输出。

支柱三:人工评估不可或缺

自动化评估会错过很多边缘案例。例如,我们的人工测试员发现,早期智能体偏爱SEO优化的内容农场,而非权威的学术PDF或个人博客。正是基于这些反馈,我们才在提示词中加入了信源质量的启发式规则。

每天解决一个日常生活的小痛点,今天,你想让我帮助你解决什么?

AIGC新知:畅所欲言,或许,你就是下一个拯救世界的人。

转发3赞1

问一问

五、从原型到生产:我们遇到的工程挑战

图片
图片
1、状态与错误累积
智能体是长时间运行的,一个微小的错误就可能累积并导致整个任务失败。我们建立了从故障点恢复的机制,而不是从头开始,并让智能体学会智能地处理工具故障。
2、调试困难
由于非确定性,复现问题变得异常困难。我们建立了完整的生产环境追踪系统,在高层级上监控智能体的决策模式和交互结构,以诊断根本原因。
3、部署协调
智能体系统是高度状态化的。我们采用“彩虹部署”(Rainbow Deployments),让新旧版本的系统并行运行,逐步迁移流量,从而避免破坏正在运行中的任务。
4、同步执行的瓶颈
目前,首席智能体需要等待所有子智能体完成后才能继续,这造成了瓶颈。未来,异步执行将是我们的探索方向,尽管它会带来更高的协调复杂性。
六、结语

构建AI智能体,“最后一公里”往往占据了整个旅程的大部分。从能在开发者电脑上运行的原型,到一个可靠的生产级系统,中间的鸿沟远比想象的要宽。

尽管挑战重重,多智能体系统已经证明了其在开放式研究任务中的巨大价值。用户反馈Claude帮助他们发现了未曾考虑过的商业机会,解决了棘手的技术难题,节省了数天的工作量。

图片
图片

如上这张图,显示当今人们使用 Research 功能的最常见方式的 Clio 嵌入图。

主要用例类别是跨专业领域开发软件系统 (10%)、开发和优化专业和技术内容 (8%)、制定业务增长和创收战略 (8%)、协助学术研究和教育材料开发 (7%),以及研究和验证有关人员、地点或组织的信息 (5%)。

另外,我们发起了一个问一问调研,感兴趣的可以留言一下。

每天解决一个日常生活的小痛点,今天,你想让我帮助你解决什么?

AIGC新知:畅所欲言,或许,你就是下一个拯救世界的人。

转发3赞1

问一问

我们相信,通过精心的工程设计、全面的测试、细致的提示词与工具打磨,以及跨团队的紧密协作,多智能体系统将持续改变我们解决复杂问题的方式。

原文:https://www.anthropic.com/engineering/built-multi-agent-research-system

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-06-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AIGC新知 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
博客SEO优化全攻略:提升搜索排名的实用技巧
在正式学习SEO优化技巧之前,我们需要了解SEO的基本概念和搜索引擎的工作原理。SEO(Search Engine Optimization,搜索引擎优化)是指通过优化网站内容和结构,使其更符合搜索引擎排名规则,从而提高网站在自然搜索结果中的排名,获取更多流量的一系列技术和过程。相比付费推广,SEO能够带来成本低廉且持续的免费流量,对于大学生运营博客而言是非常有价值的流量来源。
大熊计算机
2025/07/14
1420
如何创作SEO优质文章内容?高质量文章怎么写?
当一个网站做好之后,那么就要完善内容,其中就要涉及到文章内容的创作,那么文章内容要怎么写呢?写文章时不必太在意内容的多少,关键是要注意长尾关键词的布局。写作时不一定要追求高大尚,也不一定要长篇大论,我们只要围绕标题把内容清晰的表达出来即可,让用户可以明白就好。
雾海梦曦
2022/11/14
6470
如何创作SEO优质文章内容?高质量文章怎么写?
网站SEO优化步骤超详细完整版教程
一、准备 1、心态 长时间,不断学习。学习建站、基础代码、SEO全过程、实际操作并成功。
宜轩
2022/12/29
2.1K0
网络编辑应该熟知的7个基本SEO技巧
  网络编辑和报纸、杂志编辑最大的不同是我们需要大量网络技术知识,还需要为我们所发布的新闻的点击量负责。一个好的网编,绝对不仅仅是ctrl+c、 ctrl+v,不仅要求我们有很强的新闻敏感性,在大事件来临或者将来临的时候就有所察觉并在发布新闻的时候有所动作甚至提前布局,也要求我们懂基本的网 络新闻传播规律以及SEO基础。只有这样,我们才能在竞争激烈的网络新闻传播中争得主动权,从百度和google获取更多的流量。
大葡萄
2019/04/09
4270
网络编辑应该熟知的7个基本SEO技巧
如何做好SEO(搜索引擎优化)
随着互联网的迅速发展,更多的企业开始关注SEO(Search Engine Optimization,搜索引擎优化)。SEO是通过改进网站的结构和内容,提高网站在搜索引擎结果页面的排名,从而吸引更多的有目的性的访问者。本文将深入探讨如何做好SEO并提供详细的指导。
老K博客
2023/12/18
1K0
出现这些情况说明是网站过度优化
可能昨天你网站很多关键词都有一定排名,第二天突然排名下降很厉害,甚至没有排名情况,这个时候就需要特别注意了。
小唐同学.
2022/02/23
1.2K0
要想网站长尾关键词排名多,文章优化少不了!
  导读:经常有客户问起这个问题“网站是更新原创文章,网站优化还是不见起色”,对于这个问题,虽然说百度调整了算法,越来越重视网站内容建设,喜欢高质量并且原创的文章,于是许多企业找专门的写手撰写高质量文
深度网
2021/06/24
3460
要想网站长尾关键词排名多,文章优化少不了!
不是所有网站都要高质量内容
高质量内容,为什么不是所有网站都需要?简单地讲,网站内容涉及文字,图片,视频,音频,动画效果等等组成。最原始的搜索引擎只收录文字,即使你试图优化图像和视频,那些被索引的图像和视频只是收录相关文字。这是一个不得不面对的事实,搜索引擎天生喜欢文字,通过网站文字分析,以此为基础对网站评估,除了文字之外其它任何内容都会让搜索引擎变得很复杂。站长拥有一个非常好的网站,就是没有太多文字,但在搜索引擎排名处于劣势,反而不是那些内容较多的不太有用的网站。
林雍岷
2019/07/03
1.1K0
「技巧」5个SEO基础技巧知识
献给未来的我 每天的坚持 只有经历地狱般的磨难, 才能炼出创造天堂的力量; 只有流过血的手指, 才能弹奏出世间的绝唱。 SEO的发展随着时间不断的普及,很多SEO知识、技巧越来越多的人知道,可以说SEOer的技能已经快到瓶颈了,你知道的或不知道的,别人都有可能知道。 今天,给大家分享5个SEO技巧内容,这些技巧都源于基础,希望能够对各位同学有所帮助。 — — 及时当勉励,岁月不待人。 SEO基础技巧 时本文总计约1500个字左右,需要花 5 分钟以上仔细阅读。 来看最近的一些数据: 93%的在线体验是从搜
黄伟SEO
2018/05/17
7630
撰写高质量技术文章的实践指南【从选题到读者互动的全流程经验分享】
撰写技术文章不仅是分享知识的重要方式,也是个人技术提升和职业发展的有力工具。以下是我在撰写技术文章过程中的一些经验和心得,希望能对你有所帮助。
一键难忘
2024/07/21
1.2K2
百度 SEO:不是玄学,是科学与艺术的 “恋爱”
恩爸编程
2024/12/12
920
百度 SEO:不是玄学,是科学与艺术的 “恋爱”
6种高质量外链的内容类型推荐
做网站SEO项目的运营人员,为得到高质量的外链往往会费尽心思。而高质量外链往往会依托于优良的内容,项目的类型不同,需要的内容承载也不同。如果内容比较单一,那么指挥让你在某一个领域获得一种稳定的链接,但是通常情况下,SEO的外链建设讲究多元化。
安邦运维ruangseo
2019/08/02
9910
SEO技巧汇集
每个人都喜欢好用的技巧,对吗?这里有55个用于搜索引擎优化的小技巧,甚至你的老妈用起来都易如反掌。哦,不是我的老妈,但你明白我的意思。这意味着网页设计师和SEO新手中大部分人都能迅速上手,没有任何困难。
全栈程序员站长
2022/07/15
4120
【SEO的优化技巧和方法】——让你的文章在搜索引擎中脱颖而出!
🔍搜索引擎优化(SEO)是一种提高网站在搜索结果中排名的技术,对于自媒体平台来说,拥有高质量的内容是吸引用户的关键。那么,如何让你的自媒体文章在众多内容中脱颖而出呢?本文将为你介绍一些实用的SEO优化技巧和方法,让你的文章更容易被搜索引擎发现!
用户10637139
2024/04/27
2430
「SEO」页面搜索引擎优化详细解说
做个内心阳光的人,不忧伤,不心急,坚强,向上,靠近阳光,成为更好的自己。你不需要别人过多的称赞,因为你自己知道自己有多好。内心的强大,永远胜过外表的浮华。 今天给大家讲解下一个页面该如何进行SEO优化,一个页面优化该注意哪些细节,以及有什么样的操作手法。 — — 及时当勉励,岁月不待人。 页面搜索引擎优化 时本文总计约 2200 个字左右,需要花 6 分钟以上仔细阅读。 1 使用搜索引擎友好的URL 对于谷歌优化来说,谷歌已经表示,网址中的前3-5个字是更重要的。那么对应中文搜索引擎来说,百度、好搜等等搜
黄伟SEO
2018/05/17
1.1K0
怎样写好一篇高质量的技术文章?
原则一:一个人的影响力不是由他的财富决定,也不是由他的智力决定,而是由他能帮助多少人决定。
一个会写诗的程序员
2020/05/08
1.4K0
网站SEO提高百度谷歌收录和排名
SEO并不深奥,SEO最重要的是要有耐心、恒心。不少新手建站时都会遇到网站SEO问题,如何提高百度、Google等搜索引擎的收录和排名,是一件很头疼的事。本文将从域名、链接、标题、关键词、外链等多个方面谈谈网站SEO的方法,希望对建站新手有所帮助。
星哥玩云
2022/08/13
9850
Google网站排名多久能到首页?
每一个企业都希望自己的外贸网站排名可以在短时间内排上Google首页,那Google网站排名多久能到首页呢?一尘SEO可以告诉大家的是,Google排名需要一定的时间和周期去判定,SEO是一个持续积累的过程,并不像SEM一样立竿见影。影响Google排名的因素非常多,例如:
一尘SEO
2020/09/02
2.4K0
Google网站排名多久能到首页?
Web前端如何进行SEO结构优化
做前端的肯定离不开SEO,无论您是专职的SEOer还是其他什么别的,只要设计到前端就避不开SEO,大大小小做了几十个企业网站和个人博客网站建设的我,对与SEO仍然出于小白阶段,虽说前段时间博客也终于达到了2+,但是最近又回到了1。。。挺惨的哈,结合百度资料、CSDN等权威信息,介绍一下关于网页前端SEO结构性优化的文章,供参考,并共勉!
李洋博客
2021/06/15
1.1K0
7.ChatGPT与SEO - 优化内容策略【7/10】
在当今的数字化时代,搜索引擎优化(SEO)已成为数字营销中不可或缺的一部分。它不仅帮助企业提高在线可见性,还直接影响着网站的流量、品牌知名度和最终的销售转化。SEO通过优化网站内容和结构,使其在搜索引擎结果页(SERP)上获得更高的排名,从而吸引更多的潜在客户。
正在走向自律
2024/12/18
2430
7.ChatGPT与SEO - 优化内容策略【7/10】
推荐阅读
相关推荐
博客SEO优化全攻略:提升搜索排名的实用技巧
更多 >
LV.0
这个人很懒,什么都没有留下~
目录
  • 三、构建高效智能体的八大提示词工程心法
  • 1、状态与错误累积
  • 智能体是长时间运行的,一个微小的错误就可能累积并导致整个任务失败。我们建立了从故障点恢复的机制,而不是从头开始,并让智能体学会智能地处理工具故障。
  • 2、调试困难
  • 由于非确定性,复现问题变得异常困难。我们建立了完整的生产环境追踪系统,在高层级上监控智能体的决策模式和交互结构,以诊断根本原因。
  • 3、部署协调
  • 智能体系统是高度状态化的。我们采用“彩虹部署”(Rainbow Deployments),让新旧版本的系统并行运行,逐步迁移流量,从而避免破坏正在运行中的任务。
  • 4、同步执行的瓶颈
  • 目前,首席智能体需要等待所有子智能体完成后才能继续,这造成了瓶颈。未来,异步执行将是我们的探索方向,尽管它会带来更高的协调复杂性。
  • 六、结语
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档