使用谷歌A2A协议构建自主AI代理指南

原创

用户11764306

发布于 2025-09-06 09:20:31

2010

为什么需要自主AI代理？

想象一下：凌晨3点，地球另一端的客户急需账户帮助。传统聊天机器人会通过升级流程唤醒支持团队。但如果AI代理能够自主、安全且正确地处理请求呢？这就是理想场景。

现实是，当今大多数AI代理就像持学习驾照的青少年，需要持续监督。它们可能意外承诺客户大额退款（糟糕！），或落入巧妙的提示注入陷阱导致泄露公司机密或客户敏感数据。这显然不理想。

双重验证（Double Validation）正是为此而生。它就像为AI代理配备入口保安（输入验证）和出口质检员（输出验证）。有了这些最低限度的保障措施，代理可以自主运行而不会引发公关危机。

双重验证概念的诞生

当前关于AI代理的讨论很多。我们自问："阻碍AI代理广泛采用的最大挑战是什么？"结论是可信自治。当AI代理可信时，更容易扩展和采用。反之，如果代理自治有限，就需要增加人力投入，成本高昂且抑制采用。

接下来考虑AI代理实现自治的最低要求。结论是自主AI代理至少需要两个组件：

输入验证——净化输入，防护越狱、数据投毒和有害内容
输出验证——净化输出，确保品牌一致性并减少幻觉

这就是双重验证系统。

基于这些见解，我们构建了概念验证项目来研究双重验证概念。本文将探讨如何通过谷歌A2A协议、谷歌代理开发工具包（ADK）、Llama Prompt Guard 2、Gemma 3和Gemini 2.0 Flash构建多代理系统来实现双重验证，并优化生产环境部署，特别是在谷歌Vertex AI上的部署。

选择Llama Prompt Guard 2进行输入验证，是因为相关文章正好在完美时机到达。选择该模型是因为它专门设计用于防护提示注入和越狱攻击。它也非常小巧；最大变体Llama Prompt Guard 2 86M仅含8600万参数，可以下载并包含在Docker镜像中用于云部署，从而改善延迟。这正是后续实施的方式。

项目完整代码可在github.com/alexey-tyurin/a2a-double-validation获取。

如何构建？

架构使用四个通过谷歌A2A协议通信的专用代理，每个都有特定角色：

管理器代理：协调代理间流程的指挥者

防护代理：使用Llama Prompt Guard 2检查提示注入的守卫

处理器代理：使用Gemma 3处理合法查询的工作蜂

评论家代理：使用Gemini 2.0 Flash评估响应完整性和有效性的编辑

选择Gemma 3作为处理器代理，因为它小巧、快速，且可根据需要微调——是生产的理想选择。某中心当前支持九种不同的Gemma微调框架或方法。

选择Gemini 2.0 Flash作为评论家代理，因为它足够智能担任评论角色，同时比更大的Gemini 2.5 Pro Preview模型显著更快更便宜。模型选择取决于需求；在测试中，Gemini 2.0 Flash表现良好。

故意为处理器和评论家代理使用不同模型以避免偏差——LLM可能对自己输出的判断与对其他模型输出的判断不同。

行动计划

工作流遵循清晰的生产就绪模式：

用户发送查询 → 管理器代理接收

安全检查 → 管理器将查询转发给防护代理

漏洞评估 → Llama Prompt Guard 2分析输入

处理 → 如果输入安全，处理器代理使用Gemma 3处理查询

质量控制 → 评论家代理评估响应

交付 → 管理器代理将验证后的响应返回用户

实施时间

准备好动手了吗？以下是生产就绪的路线图：

本地部署

环境设置
配置API密钥
下载Llama Prompt Guard 2

这是巧妙的部分——我们首次启动Agent Critic时一次性下载模型，并将其打包到Docker镜像中用于云部署。

关于Llama Prompt Guard 2的重要说明：要使用该模型，必须：

填写"LLAMA 4社区许可协议"
获得某机构对此存储库的访问批准只有在批准后才能下载和使用此模型
本地测试

生产部署

通过将Llama模型包含在Docker镜像中来优化生产：

在Cloud Shell终端中设置云项目访问某中心云控制台打开Cloud Shell 使用某中心云进行身份验证创建或选择项目启用所需API
设置Vertex AI权限为账户授予Vertex AI及相关服务的必要权限
创建和设置VM实例 Cloud Shell不适用于此项目，因为其磁盘空间限制为5GB。本项目需要超过30GB磁盘空间来构建Docker镜像、获取所有依赖项并本地下载Llama Prompt Guard 2模型。因此需要使用专用VM而非Cloud Shell。
连接VM
克隆存储库
部署步骤
测试

替代方案

老实说——还有其他解决方法：

单一模型方法：使用大型LLM如GPT-4并谨慎设计系统提示

更简单但专业性较低
提示注入风险更高
使用相同LLM进行答案生成和自我批评存在LLM偏差风险

单体方法：在单个代理中实现所有流程

延迟更好
无法独立扩展和发展输入验证和输出验证
代码更复杂，全部捆绑在一起

基于规则的过滤：传统正则表达式和关键词过滤

更快但智能程度较低
误报率高

商业解决方案：如某机构内容审核器或某中心模型装甲等服务

更易实现但自定义性较差
相反，Llama Prompt Guard 2模型可以使用客户数据微调
持续订阅成本

开源替代方案：Guardrails AI或NeMo Guardrails

良好框架但需要更多设置
对提示注入的专业性较低

经验教训

Llama Prompt Guard 2 86M存在盲点。测试期间，某些越狱提示未被标记为恶意。考虑使用领域特定示例微调模型，以提高对重要攻击模式的召回率。
Gemini Flash模型选择很重要。评论家代理最初使用gemini1.5flash，经常将完全正确的答案评为4/5分。切换到gemini2.0flash后，相同答案 consistently被评为5/5分。
Cloud Shell存储是瓶颈。某中心Cloud Shell仅提供5GB磁盘空间——远不足以构建本项目所需的Docker镜像、获取所有依赖项并本地下载Llama Prompt Guard 2模型以部署到Google Vertex AI。请配置至少30GB的专用VM。