作者|Barry Zhang, Anthropic
地址|https://www.youtube.com/watch?v=D7_ipDqhtwk
出品|码个蛋(ID:codeegg)
整理|陈宇明
最近看到了 Anthropic 那篇著名的《Building effective agents》作者之一 Barry Zhang 在 2 月底的演讲《How We Build Effective Agents》,看完之后非常有收获,在这里分享给大家。
三个核心观点:
几年前大家刚开始玩AI时,做的都是基础功能——比如总结、分类、提取信息,这些当时觉得超神奇,现在已成标配。后来产品成熟了,我们开始搞更复杂的操作:一个模型搞不定?那就串连多个模型按固定流程跑(这叫"工作流"),用更多计算换更好效果。这算是智能体的雏形。
现在模型更强了,各种专用智能体开始落地。和工作流不同,智能体能自己决定下一步干啥,根据环境反馈自主行动——这也是今天讨论的重点。至于未来?可能智能体会更全能,或者多个智能体协作干活。总之它们越自主,就越有用,但成本、延迟和出错风险也越高。
第一点:别啥都用智能体智能体适合处理复杂高价值的任务,不是万能升级方案。啥时候该用智能体?看这 checklist:
举个正面例子——写代码为什么适合智能体?
第二点:越简单越好智能体本质就三部分:
别一开始搞太复杂!先搭好这三大件快速迭代,行为稳定了再优化。比如:
第三点:像智能体一样思考我们常以人类视角设计智能体,结果被它的"迷惑行为"整懵。其实智能体每一步只能看到有限的上下文(那1-2万token),试着把自己代入:
想象你是电脑操作智能体,每次只能看到一张截图+简陋描述(比如:"你是电脑助手,现在要完成XX任务")。
你闭着眼点鼠标,等3-5秒才能看新截图——可能点对了,也可能把电脑关机了!这种"操作盲区"会循环发生。
通过这种代入,你会发现智能体真正需要什么:
小技巧:直接问模型!
把提示词/工具描述丢给Claude问:"这指令清楚吗?你能执行吗?" 甚至把整个操作记录给它分析:"我当时为啥这么决策?怎样能更好?"
个人脑洞时间:
总结:AI智能体要用对场景、简单起步、理解它的局限。