
搭建智能体时,很多人会先关注模型、Prompt、知识库、数据库和工作流。
但真正测试时,经常会遇到一个问题:用户明明是在接着上一句话问,智能体却像没听懂一样,重新回答。
比如用户先问:
“员工年假怎么申请?”
智能体回答后,用户继续问:
“那试用期员工也可以申请吗?”
如果没有会话记忆,智能体可能不知道“那”指的是年假申请,还要重新判断问题范围。
这就是会话记忆要解决的事:让智能体在一段连续对话里,不要聊着聊着就“断片”。
会话记忆,说简单点,就是让智能体在回答当前问题时,可以参考前面几轮对话。
它不是永久记忆,也不是用户画像,而是当前对话里的短期记忆。
比如上一轮聊的是“年假申请”,下一轮用户问“试用期员工能不能申请”,智能体就能知道用户还在问年假,而不是重新开始理解一个新问题。

ZGi平台会话上下文展示
ZGi 平台里可以开启“会话上下文”,也可以设置“会话轮数”。也就是说,开发者可以控制智能体参考最近几轮对话,不需要自己写复杂的上下文管理逻辑。
但要注意:会话记忆不是开得越多越好。
记得太少,智能体接不上话;
记得太多,又容易把旧内容带到新问题里,出现上下文“粘连”。
真实用户提问时,很少每句话都说完整。
他们往往是先问一个问题,后面直接追问:
“员工年假怎么申请?”
“那试用期员工能用吗?”
“需要提前几天提交?”
这些话单独看可能不完整,但放在同一段对话里就很清楚。
如果没有会话记忆,智能体每一轮都像新对话,用户就要反复解释背景,体验会很差。
打开会话记忆后,智能体可以接住用户的连续追问,也能理解“那”“这个”“刚才那个”到底指什么。
所以,会话记忆提升的不是某一个节点,而是整个智能体的对话体验。

会话记忆有用,但不是所有智能体都适合默认打开。关键要看这个智能体主要做什么。

会话记忆不能只看“它能不能记住”,更要看“它有没有记错”。
实际测试时,可以重点看以下两种情况。

比如用户先问
“员工年假怎么申请”,
再问“试用期员工能不能申请”,
智能体应该知道后面还在问年假相关内容。

要注意“上下文粘连”。
所谓粘连,就是智能体把上一轮内容错误带到了下一轮里。
比如上一轮用户问的是“阳光公司的物业费是多少”,
下一轮已经换成“银河大厦解约怎么赔付”,
但智能体还在围绕阳光公司回答,这就是粘连。
所以,配置会话记忆时不要一上来就把轮数调得很大。一般可以先从 3 轮左右开始测试,再根据实际效果调整。
会话记忆是智能体体验里很关键的一项配置。
不开,智能体容易每轮都像新对话;开太多,又容易出现上下文粘连。
所以,搭建智能体时不要只问“要不要开记忆”,而要先看任务类型。
问答、咨询、培训类智能体,可以打开;文件解析、固定格式输出、数据写入类智能体,要谨慎打开。
真正好用的智能体,不是记得越多越好,而是知道什么时候该记,什么时候该忘。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。