还记得我们以前搜索信息的方式吗?输入关键词,浏览大量结果,筛选有用内容,再整合成我们需要的答案。这个过程不仅耗时,还常常让人感到疲惫。
如今,智能Agent的出现正在彻底改变这一切。想象一下,你只需提出一个问题:"北京今年什么时候入秋,哪里是赏秋的最佳去处?什么时候去最合适?", AI就能直接给你一个完整、准确的答案,甚至还能根据你的后续问题深入解释 。这就是Agent赋能工作流的魅力所在。
本文将用通俗易懂的语言,带你了解智能Agent如何改造传统工作流,让AI真正成为你的得力助手。
简单来说,Agent就是一个能够理解你的需求,并自主调用各种工具来完成任务的AI助手。它不仅能理解你的问题,还能规划解决方案,调用合适的工具,最后整合结果呈现给你。
传统AI只能回答问题,而Agent则可以"行动" ——它能搜索网络、生成图片、编写代码、分析数据,就像一个全能助理。
Agent工作原理示意图
当你向Agent提问时,它会经历以下几个步骤:
比如当你问"北京今年什么时候入秋"时,Agent会识别出这是一个天气查询任务,需要调用网络搜索工具,并将"北京"、"2024"、"入秋时间"作为关键参数。
传统搜索引擎只能返回相关网页列表,你需要自己浏览、筛选和整合信息。比如搜索问题【北京今年什么时候入秋,哪里是赏秋的最佳去处?什么时候去最合适】结果如下:
你会得到多个网页链接,需要自己点击进入,找到相关信息,再整合答案。这个过程耗时且效率低下。
简单的AI搜索能够总结网页内容,但缺乏深度思考和规划能力。让 AI搜索 回答【北京今年什么时候入秋,哪里是赏秋的最佳去处?什么时候去最合适】以智谱官方给出的的AI搜索结果为例:
简单AI搜索结果
挺不错,问题基本都回答了,但逻辑有点凌乱,不够清晰,但是最关键的是: 搜索时间错误了!!! LLM只是为了搜索问题而搜索忽视了“ 今年 ”这个关键词,而且并没有把得到的【北京的秋天时间】、【北京赏秋去处】两部分信息很好的联系起来
上面是智谱官方的AI搜索,通用系统提示词和思维链等方面优化做的还是很好,所以缺陷的对比效果不明显,来看一下依据这个逻辑用Coze搭建的AI智能助手,也集成了web_search的能力。同样的问题,让 AI搜索 回答【北京今年什么时候入秋,哪里是赏秋的最佳去处?什么时候去最合适】效果如下:
简单AI搜索结果coze
我是初步实践做的这个AI智能助手,因为没有给他配置工作流和思维链的方式,所以他也只能是根据coze的function call的能力分开两次调用web_search来检索 【北京的秋天时间】、【北京赏秋去处】。然后coze的LLM 简单拼接了两个搜索信息的回答。所以说自己搭建的助手还有很大的优化空间。
这里就明显暴露了第二代AI搜索的核心问题:缺乏上下文理解和推理能力,无法真正理解用户意图的深层次含义 。从技术角度看,这是因为简单的RAG(检索增强生成)系统虽然能够获取外部信息,但缺乏对信息的深度处理和整合能力。
所以Agent可以作为载体与外部世界进行交互处理问题,但是对于复杂情况 / 高精度解决方案还是要依靠完善的Agent工作流 / 思维链(类似O1模型范式)来助力AI能力的落地
工作流增强的Agent不仅能搜索信息,还能规划解决方案,分步骤执行任务,并整合结果。智谱官方的AI搜索+深度推理回答【北京今年什么时候入秋,哪里是赏秋的最佳去处?什么时候去最合适】效果如下
工作流增强的Agent结果
在官方的AI搜索智能体中,时间正确,抓住用户和核心诉求回答问题,并且逻辑清晰地呈现结果。这里能够更加智能准确的回答,深度推理、思维链的能力功不可没。
分析一下这里agent的工作流和逻辑。首先都是一样的,将问题进行了拆解:
最后综合两部分搜索得到的结果进行总结回答,并且完全按照问题拆解的步骤进行回答,逻辑清晰。通过思维链的方式让AI搜索在解决LLM幻觉问题的同时也能变得更加聪明。
同时智谱的Agent也可以调用包括绘画、代码在内的各种工具,从而解决了传统搜索引擎和常规 AI 不能解决的难题,表现得更像 “人”了。
Coze是一个让普通用户也能轻松创建Agent的平台。下面是我用Coze搭建的一个简单Agent示例,首先给智能体中的LLM加人设与回复逻辑的系统提示词,让他有相应主题的问答及语义理解的能力;
然后给Agent加上各种能力插件,比如getToutiaoNews、LinkReaderPlugin、bingWebSearch、kimiAI、CodeRunner等等,使其能够处理特殊任务,效果如下图所示:
Coze搭建的Agent
这个Agent能够:
我的提问【什么是agent】会触发Doubao-pro的functionCall 能力,分析问题语义并调用相应的工具,比如bingSearch来找相关的介绍资料来回答问题
再比如,添加AiPPT插件就可以借助AI搜索【请搜索两个最新的AI开源项目并制作简单的ppt来简要介绍内容】到的资料直接转换为ppt进行展示出来。它会自动:
coze智能体执行工作流过程
Agent生成的PPT
可以看到Doubao-pro很清楚的理解了语义并规划了相应的工具调用过程,先使用bingSearch查找开源项目,然后LLM将学习总结的内容转换为ppt展示出来。 除了AI搜索,还可以对搜索到的链接中的信息进行进一步追问,这时Agent会调用LinkReaderPlugin工具来进一步获取搜索到的链接里面的内容来展开回答问题
coze智能体使用读取链接补充信息
总的来说,用coze搭建一个优秀的agent主要可以分为以下步骤:
img
coze本地部署AI搜索agent的代码通过本地部署可视化Agent的输出效果如下:
coze本地部署AI搜索agent效果图
可以在本地就实现agent的web搜索功能、textToimage功能等等
利用coze的api在本地部署agent时遇到的难点:
其次我也尝试了使用langchain的框架来搭建AI搜索的Agent
langchain本地部署AI搜索agent
利用langchain在本地用纯代码方法部署agent目前遇到的难点:
想要开始使用Agent改造你的工作流,可以从以下几个简单步骤开始:
对于普通用户,我推荐直接使用Coze这类平台,它们提供了友好的界面,无需编程知识就能创建功能强大的Agent。
想知道你的工作是否适合用Agent改造?回答以下问题,评估一下吧!
评分标准:
回答: Agent比普通AI助手多了"行动"能力。普通AI助手只能基于已有知识回答问题,而Agent可以主动调用外部工具(如搜索引擎、代码执行器、数据分析工具等)来获取信息并执行任务。简单说,普通AI是"知道",Agent是"知道+做到"。
回答: 完全可以!现在有很多低代码或无代码平台(如Coze、Dify等)让普通用户也能轻松创建和使用Agent。这些平台提供了友好的图形界面,你只需通过简单的拖拽和配置就能创建功能强大的Agent。
回答: 这取决于你使用的平台和配置。大多数正规Agent平台都有严格的隐私政策,但建议:
回答: 成本因平台而异:
回答: 改进Agent性能的几个关键方法:
所以,你准备好让Agent改造你的工作流了吗?