AgentVerse 是由清华大学、北邮等高校研究团队发布的一套AI多智能体协作模拟框架。它可以很容易的模拟多种社会实验场景,例如:NLP课堂、囚徒困境、软件设计、数据库诊断、Pokeman等。
在这个多智能体世界里,我们会将问题的解决过程分为四个阶段:
1. 专家招募:选择最合适的AI智能体专家参与任务。
2. 协作决策:专家共同讨论,提出解决问题的解决方案。
3. 行动执行:采取具体的行动。
4. 评估:评估当前结果和目标之间的差距。
NLP课堂模拟
NLP课堂上,教授与学生进行互动交流。当学生有问题时,他们纷纷举手,耐心等待教授点名。只有在教授点名后,学生才能发言并提出问题。
囚徒困境模拟
囚徒困境是一种思想实验,它向两个完全理性的代理人提出两难的挑战:他们可以与伴侣合作以实现互惠互利,也可以背叛他们的伴侣(“缺陷”)以获得个人奖励。
软件设计模拟
在软件设计示例中,程序员、测试和代码审查员协作解决代码生成问题。给定一个问题,程序员首先编写代码实现。测试人员运行单元测试并提供反馈。然后代码审查员会生成评论。在收集测试反馈和审查后,程序员迭代地完善代码。
数据库诊断模拟
在数据库诊断场景中,首席DBA监控数据库系统是否存在异常。如果检测到异常,内存和 CPU 智能体会收到警报,分析根本原因并提出优化解决方案。然后,首席 DBA 向用户提供总结性诊断,用户也可以通过提供说明或评估解决方案的有效性来互动。
文本生成质量评估
在 AgentVerse 上建立了一个多智能体裁判团队来评估不同模型生成的文本的质量。当给定两段不同的文本时,各个智能体可以利用分配给他们的角色,自主地辩论生成文本的差别,并给出对生成质量的判断。
Pokeman游戏模拟
在游戏中,智能体可以参观商店,在健身房训练他们的神奇宝贝,并相互互动。作为玩家,可以扮演其中智能体的角色,随时与其他智能体互动。其中包含 6 个出现在《Pokemon Emerald》中的角色:May、Birch 教授、Steven Stone、Maxie、Archie 和 Joseph。
项目地址:github.com/OpenBMB/AgentVerse
论文:AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors in Agents
论文地址:arxiv.org/abs/2308.10848
领取专属 10元无门槛券
私享最新 技术干货