Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >Google ADK,知多少?

Google ADK,知多少?

作者头像
Luga Lee
发布于 2025-04-13 09:14:48
发布于 2025-04-13 09:14:48
38801
代码可运行
举报
文章被收录于专栏:架构驿站架构驿站
运行总次数:1
代码可运行

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的开源代码利器——Google ADK。

在人工智能领域风起云涌的 2025 年,Google 再次以创新之姿震撼业界,推出了备受瞩目的 Agent Development Kit(ADK)——一个开放源代码的利器,旨在重塑多智能体系统的开发格局!

从 Google 自身的 Agentspace 到 Customer Engagement Suite,这款工具不仅驱动了 Google 的内部 AI 革命,更通过开源的方式,将强大的开发能力交到了你我手中。你是否好奇 ADK 究竟能带来怎样的技术飞跃?它如何简化复杂任务的构建?又将如何改变 AI 开发的未来?

本文将带你深入探索 Google ADK 的奥秘,揭开它的核心功能与无限潜力,一起解锁这场 AI 技术的全新篇章!

01

什么是 Google ADK ?

纵观相较去年的焦点集中在生成式 AI(GenAI,如聊天机器人)以及 Vertex AI 平台,今年的主题异常明确——代理(Agents)、代理,还是代理!从 Agent Development Kit(ADK)、Agent to Agent(A2A)协议,到 AgentSpace 平台,再到 Google 旗舰级大型语言模型 Gemini 2.5 Pro 的预览版,这一连串的发布无疑为 AI 开发领域注入了一剂强心针。

Google 的 Agent Development Kit(ADK)是一款灵活且模块化的开发框架,专为设计、构建和部署人工智能代理而打造。这一框架不仅提供了强大的技术支持,还以其高度的适应性和扩展性,成为开发者实现智能系统创新的利器。

在实际的业务场景中,ADK 能够无缝集成流行的超大型语言模型(LLMs)以及开放源代码的生成式 AI 工具,特别注重与 Google 生态系统以及 Gemini 模型的紧密协作。通过这种设计,ADK 不仅增强了开发者在 Google Cloud、Google Workspace 等平台上的开发效率,还充分利用了 Gemini 系列模型在自然语言处理和多模态任务中的卓越性能,为构建智能、适应性强的 AI 代理提供了坚实基础。

那么,从技术层面来讲,ADK 中的代理究竟是什么?

在 ADK 框架中,代理(Agent) 被定义为一个自主且自包含的执行单元,旨在实现特定的目标。这些代理如同智能化的“任务执行者”,具备多方面的能力,能够:

1、执行任务:独立完成预定义的目标,如回答问题或生成报告,展现出高效的自动化能力。

2、与用户交互:通过自然语言对话或界面操作,与人类用户无缝沟通,模拟真实对话体验。

3、利用外部工具:调用 API数据库或第三方服务,扩展功能边界,解决复杂问题。

4、与其他代理协作:通过多代理编排,共同完成复杂的业务流程,如法律案件分析或多语言翻译任务。

这些代理的灵活性与协作性,使 ADK 成为构建智能工作流的核心组件,特别是在需要高度自动化和协同的场景中表现卓越。想象它们像一个“高效团队”,每个成员各司其职,又能紧密合作,共同完成从简单到复杂的“智能使命”!

因此,从某种意义上而言,无论是对于初次涉足 AI 开发的程序员,还是希望优化现有系统的资深工程师,ADK 都将为我们开启一扇通向未来智能技术的大门!

02

Google ADK 都具有哪些核心特性 ?

Agent Development Kit(ADK)以其强大的功能和灵活性,成为 Google Cloud NEXT 2025 备受瞩目的亮点,赋能开发者构建智能化 AI 代理系统。以下是 ADK 的核心特性,结合其技术优势和应用场景,为大家呈现一个全面而专业的概述,适合初学者、技术开发人员以及企业架构师深入了解,具体可参考:

1、模块化架构

通常,ADK 采用模块化设计理念,允许开发者通过整合多个专业化的小型组件,轻松构建复杂的多代理系统。这一架构不仅简化了开发流程,还提供了高度的灵活性,使系统能够根据具体需求动态扩展。例如,我们可以从单一任务代理开始,逐步扩展到多层次协作网络,宛如“乐高积木”般拼凑出强大的智能生态。

2、代码优先开发效能

ADK 以代码为驱动,开发者可以使用 Python 语言精确定义代理行为,赋予其完全的程序化控制权。这种方法消除了传统配置的繁琐性,让大家能够通过脚本灵活调整逻辑、优化性能,并快速迭代,堪称“程序员的创意画布”。

3、丰富的工具生态链

ADK 内置了丰富的预建工具集,涵盖数据处理、API 调用等功能,同时支持开发者创建定制化能力。无论是调用外部服务,还是开发专属插件,这一生态都为代理功能扩展提供了坚实支持,像是“工具箱中的万能钥匙”。

4、灵活的部署选项

ADK 提供了多样化的部署选择,我们可以选择在本地环境进行开发调试,利用个人设备快速原型设计;或将其部署至 Google Cloud 的生产环境中,享受企业级的高可用性和扩展性。这种灵活性让开发者能够“从自家厨房试菜,到五星餐厅上桌”,随心所欲。

5、多模型支持

此外,ADK 也支持多种大型语言模型的集成,包括 Google 的 Gemini 系列、OpenAI 的 GPT 系列,以及其他兼容的 LLM(如 Anthropic Claude)。这一特性使得开发者能够根据任务需求选择最优模型,像是“调酒大师”根据口味挑选“最佳酒款”。

03

Google ADK 架构设计简要解析

要构建高效、智能的代理系统,深入理解 Agent Development Kit(ADK)的架构设计遍显得至关重要。

ADK 作为一个功能强大的开放源代码框架,为开发者提供了灵活的基础,其核心组件,包括但不限于代理架构、模型集成、工具生态以及运行环境等。

在 ADK 中,代理(Agent) 是处理输入并生成输出的核心实体,堪称智能系统的“灵魂”。其基本架构由以下几个关键组件构成,共同编织出代理的生命循环:

1、代理核心(Agent Core):作为指挥中枢,负责协调代理的整个生命周期,包括任务分配、状态管理和流程控制,类似于“乐队的指挥”。

2、输入/输出处理器(Input/Output Handlers):管理与用户或其他系统的通信渠道,确保信息的高效传递,像是“沟通桥梁”。

3、记忆模块(Memory):存储对话历史和上下文信息,支撑多轮交互的连贯性,宛如“智能大脑”的记忆库。

4、工具集(Tools):提供功能或集成能力,允许代理执行具体操作,如调用外部服务,类似于“多功能工具箱”。

5、模型(Models):由大型语言模型(LLMs)驱动,赋能代理的推理和生成能力,像是“语言引擎”。

此外,ADK 还支持层次化代理组成,允许“代理之代理”(Agent of Agents)模式,其中协调代理可以将任务分配给专业化子代理,形成复杂的协作网络,宛如“团队协作”完成大型项目!

模型集成:

ADK 提供对多种语言模型的集成支持,赋予开发者灵活选择的能力,具体模型,可涉及如下:

  • Gemini:Google 推荐的模型,与 ADK 深度整合,适合企业级应用。
  • OpenAI:支持 GPT-3.5 和 GPT-4 系列,涵盖广泛任务。
  • 开源模型:兼容多种开源 LLM(如 LLaMA 4),满足定制化需求。

以下是在 ADK 中配置模型的参考示例代码,具体:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from adk.models import GeminiModel

# 配置 Gemini 模型
model = GeminiModel(
    api_key="your_api_key_here",  # 替换为自己的 API 密钥
    model_name="gemini-1.5-pro",  # 指定模型名称
    temperature=0.7,              # 控制创造性,0.7 为平衡点
    max_tokens=1024               # 限制最大输出 token 数
)

工具生态:

工具是代理执行任务的“利器”,ADK 提供丰富的内置工具,并支持自定义开发,根据 ADK 工具文档,内置工具包括:

  • WebSearchTool:搜索互联网信息,实时获取最新数据。
  • CalculatorTool:执行数学计算,处理数值任务。
  • DatabaseTool:查询和操作数据库,支持数据管理
  • FileTool:读写文件,处理本地数据。
  • APITool:向外部服务发送 HTTP 请求,扩展功能。

以下是创建自定义工具的示例:

代码语言:javascript
代码运行次数:1
运行
AI代码解释
复制
from adk.tools import Tool, ToolParameter

class WeatherTool(Tool):
    name = "WeatherTool"  # 工具名称
    description = "获取指定地点的当前天气信息"  # 工具描述

    parameters = [
        ToolParameter(
            name="location",                  # 参数名称
            description="城市和国家/州",       # 参数描述
            type="string",                    # 参数类型
            required=True                     # 是否必填
        )
    ]

    async def execute(self, parameters):
        location = parameters.get("location")  # 获取位置参数

        # 实际实现中应调用天气 API,此处为演示返回模拟数据
        weather_data = {
            "location": location,
            "temperature": "72°F",
            "condition": "Partly Cloudy",
            "humidity": "45%",
            "wind": "8 mph NW"
        }
        return weather_data

运行环境

ADK 的运行环境决定了代理的运行方式和扩展能力,具体环境可参考如下所示:

  • 本地环境(Local Environment):适合开发和测试,使用个人设备快速原型设计,类似于“自家厨房”的试菜阶段。
  • Vertex AI 环境:基于 Google Cloud 部署,支持企业级生产需求,享受高可用性和扩展性,宛如“五星餐厅”的正式上菜。
  • 自定义环境(Custom Environments):针对特殊基础设施需求,提供个性化配置,像是“定制厨房”满足独特菜谱。
  • 每个环境均管理代理的生命周期、资源分配和扩展策略,灵活适配不同场景。
  • 专业亮点:Vertex AI 集成 Google Kubernetes Engine (GKE),支持 99.9% 可用性,自定义环境支持 Docker 容器化。
  • 可读性提示:像“多场景舞台”,ADK 让你从“家用厨房”练手,到“云端大厨”上菜,再到“定制厨房”创新!

04

Google ADK 工具 🔧类型解析

作为一个功能强大的开放源代码框架,Agent Development Kit(ADK)为开发者提供了多样化的工具类型支持,赋予代理系统高度的灵活性和可定制性。这些工具类型不仅涵盖了自定义开发的需求,还集成了内置功能和第三方生态的丰富资源,助力开发者构建智能、模块化的 AI 解决方案。

1、自定义工具类型

通常而言,ADK 支持多种自定义工具类型,满足特定应用场景的独特逻辑和业务流程需求,具体涉及:

  • 函数工具(Function Tools)

这类工具是为特定应用量身定制的解决方案,开发者可以根据业务需求设计专属功能,优化工作流效率。它们如同“专属裁缝”,根据我们的需求“量体裁衣”,打造独一无二的智能模块。

  • 函数/方法(Functions/Methods)

ADK 允许注册标准的同步 Python 函数(def)或类方法作为工具,提供完全的程序化控制。无论是简单的计算逻辑,还是复杂的业务处理,这些工具就像“万能工匠”的基础工具箱,随时待命。

  • 代理作为工具(Agents-as-Tools)

开发者可以将专业化代理作为可调用的工具,嵌入到父代理中,实现模块化行为。这种设计类似于“团队协作”,让每个“专家代理”分担任务,共同完成复杂的智能工作流。

  • 长时间运行函数工具(Long-Running Function Tools)

此类工具专为异步或耗时较长的操作设计,支持后台执行任务,如数据处理或 API 调用,宛如“耐力运动员”,在长时间任务中保持稳定表现。

2、内置工具:框架提供的即用型利器

ADK 内置了一系列预定义工具,覆盖常见的任务需求,为开发者提供了开箱即用的解决方案,具体:

  • WebSearchTool:实时搜索互联网信息,获取最新数据支持。
  • CodeExecutionTool:执行代码片段,辅助开发与调试。
  • RAGTool:基于检索增强生成(Retrieval-Augmented Generation)技术,增强知识库查询。

这些工具就像“现成的魔法道具”,让开发者无需从零开始,即可快速构建功能强大的代理系统。

3、第三方工具:无缝整合的生态扩展

ADK 支持轻松集成来自热门生态系统的第三方工具,进一步丰富其功能。开发者可以无缝接入 LangChain 或 CrewAI 等知名框架中的工具,充分利用这些生态的成熟功能和社区资源。

例如,LangChain 的记忆模块或 CrewAI 的任务分配工具,可以直接嵌入 ADK,增强代理的协作能力。

今天的解析就到这里,欲了解更多关于 Google 的 Agent Development Kit(ADK) 相关技术的深入剖析,最佳实践以及相关技术前沿,敬请关注我们的微信公众号:架构驿站,获取更多独家技术洞察!

Happy Coding ~

Reference :

[1] https://medium.com/google-cloud/from-zero-to-agent-getting-started-with-the-google-agent-development-kit-adk-08aefbc82f1e

[2] https://www.linkedin.cn/incareer/in/alan-olivares-amigo-97795925/en

Adiós !

云原生网关 Traefik 技术感兴趣的朋友们,可以了解一下我的新书,感谢支持!

Hello folks,我是 Luga,Traefik Ambassador,Jakarta EE Ambassador, 一个 15 年+ 技术老司机,从 IT 屌丝折腾到码畜,最后到“酱油“架构师。如果你喜欢技术,不喜欢呻吟,那么恭喜你,来对地方了,关注我,共同学习、进步、超越~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 架构驿站 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Firebase Studio:谷歌掀起AI编程革命,全栈开发进入“零门槛”时代
2025年4月,谷歌在Google Cloud Next大会上发布Firebase Studio,这款集AI驱动、云端协作与全栈开发于一体的工具,被开发者誉为“AI时代的Visual Studio”。它不仅是Project IDX的进化形态,更标志着编程从“人脑主导”向“人机共谋”的范式跃迁。从自然语言生成生产级代码到一键部署全球可用的应用,Firebase Studio正以零配置开发、多模态交互、全流程自动化三大杀器,重新定义软件工程的未来。
疯狂的KK
2025/04/25
360
Firebase Studio:谷歌掀起AI编程革命,全栈开发进入“零门槛”时代
Agent 时代的 HTTP 来了?谷歌 A2A 开源协议打破企业间 Agent 壁垒,OpenAI 系缺席标准之战
谷歌今日推出了一种名为 Agent2Agent(简称 A2A)的新型互操作协议,或将成为人工智能智能体从孤立系统迈向开放协作生态的重要信号。
深度学习与Python
2025/04/13
2200
Agent 时代的 HTTP 来了?谷歌 A2A 开源协议打破企业间 Agent 壁垒,OpenAI 系缺席标准之战
LangGraph,知多少?
LangGraph 作为 LangChain 的自然延伸,完美地填补了后者在构建复杂、动态的 AI 应用方面的空白。它为我们提供了一种全新的视角,让我们能够更轻松地创建智能代理,并将其应用于各种复杂的业务场景。‍
Luga Lee
2024/11/01
4010
LangGraph,知多少?
AI日报 - 2025年4月2日
▎🤖 AGI突破 | 研究揭示零RL训练可诱发模型顿悟,Anthropic发布Claude 3.5内部机制研究,简化语言模型推理优化新方法提出。
訾博ZiBo
2025/04/01
1910
AI日报 - 2025年4月2日
多AI代理框架全面对比:AutoGen、LangGraph、CrewAI、Swarm、Magentic-One,选对你的AI超级助手!
在当今快速发展的技术环境中,多AI代理框架已经成为构建智能系统的关键组成部分。这些框架使得开发者能够创建复杂的、自适应的应用程序,其中多个AI代理可以协作完成任务。本文将详细探讨AutoGen、LangGraph、CrewAI、Swarm、以及Magentic-One这五个流行的多AI代理框架,帮助你了解它们的特点、优势和适用场景。
井九
2024/12/20
1.6K0
多AI代理框架全面对比:AutoGen、LangGraph、CrewAI、Swarm、Magentic-One,选对你的AI超级助手!
一文读懂用于构建多代理的 CrewAI 开源框架
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI)生态领域相关的技术 - AI Agents ,本文将继续聚焦在针对新型开源 AI Agents CrewAI 的技术进行解析,使得大家能够了解 CrewAI 的基本概念以及基于 CrewAI 对其进行应用及市场开发。
Luga Lee
2024/01/02
7.2K0
一文读懂用于构建多代理的 CrewAI 开源框架
TPU 性能提升 10 倍,开源 A2A 颠覆智能体交互 | Google Cloud Next 25划重点
Google Cloud Next 25 重要发布概览:发布第七代 TPU Ironwood,提供更强的计算能力;存储、网络和计算方面的创新,有助于优化 AI 部署;Google 分布式云的优化,企业可以将 Gemini 模型部署到本地;Vertex AI 的创新,例如 Agent Development Kit 和 Agent2Agent 协议,可实现多智能体生态协同;Agentspace 的增强功能,使每个员工都能从 AI 中受益等。
深度学习与Python
2025/04/11
1160
TPU 性能提升 10 倍,开源 A2A 颠覆智能体交互 | Google Cloud Next 25划重点
来了!10个构建Agent的大模型应用框架
随着生成式人工智能(GenAI)的蓬勃发展,基于大型模型的应用已经悄然融入我们的日常工作和生活,它们在诸多领域中显著提升了生产力和工作效率。为了更便捷地构建这些基于大模型的应用程序,开源社区和产品开发者们正以前所未有的速度进行创新。
半吊子全栈工匠
2025/03/24
7.7K0
来了!10个构建Agent的大模型应用框架
AI Agent 智能体实战开发|功略fx
AI Agent(智能体)的开发是一个快速发展的领域,涉及多种工具和平台,旨在简化开发流程并提高效率。以下是一些关键点:
sou百课优
2024/10/31
2920
o3 deep research: LLM 驱动的 Agent 综述
大型语言模型(LLM)的崛起在过去几年引发了人工智能领域的飞跃式发展。尤其是 2022 年底 OpenAI 推出的 ChatGPT,短短两个月内月活用户就突破一亿,成为史上用户增长最快的消费者应用 (ChatGPT sets record for fastest-growing user base - analyst note | Reuters)。ChatGPT 所展现的强大自然语言对话和内容生成能力,如一场“核爆”引发全球对于通用人工智能的极大关注,各行各业开始思考如何将这类大模型应用到实际业务中。紧随其后,OpenAI 发布了更先进的 GPT-4 模型,能够理解更复杂的指令,并支持图像等多模态输入。这场由 ChatGPT 引领的LLM浪潮,不仅催生了大量类似产品和开源模型,也让“ AI 更自主地完成复杂任务”成为下一个技术探索热点。在这种背景下,由 LLM 驱动的 Agent(智能代理)概念逐渐兴起,成为 AI 技术爱好者和产业从业者共同关注的前沿方向。
立委
2025/03/08
2050
AI日报 - 2025年3月16日
Meta、Anthropic、OpenAI CEO预测AI将主导代码编写,影响中级工程师岗位
訾博ZiBo
2025/03/15
1510
AI日报 - 2025年3月16日
tRPC智能体生态又升级:发布A2A协议的实现trpc-a2a-go
代码已开源至 GitHub:https://github.com/trpc-group/trpc-a2a-go
腾讯开源
2025/04/20
1730
tRPC智能体生态又升级:发布A2A协议的实现trpc-a2a-go
Agent系列教程01-什么是Agent?当今为什么这么重要?
Agent(智能体)是一个能够基于数据自主完成任务或做出决策的程序。它与 AI模型对话,以使用工具和资源执行基于目标的操作。
致Great
2025/04/12
3610
Agent系列教程01-什么是Agent?当今为什么这么重要?
BotSharp 5.0 MCP:迈向更开放的AI Agent框架
在人工智能快速发展的时代,AI Agent(人工智能代理)作为一种能够自主感知环境、决策并执行动作的实体,在众多领域展现出了巨大的潜力。BotSharp 是一个功能强大的开源项目,由 SciSharp[1] 社区开发和维护,旨在实现.NET技术栈下高度可定制的多智能体解决方案。为开发高效的对话式 AI 系统提供了极大的灵活性。通过其模块化的设计和多模型的支持,它更适合需要定制化需求的大型企业或组织。BotSharp作为一款专注于AI Agent开发的框架,一直致力于为开发者提供强大而灵活的工具来构建各种类型的智能代理。BotSharp 5.0 的 MCP(Model Context Protocol)支持是该版本的核心升级之一,BotSharp 5.0 MCP版本的推出,标志着该框架向着更开放的方向迈出了重要的一步,为开发者和使用者带来了更多的可能性和机遇。
张善友
2025/04/06
1170
DeepResearch产品形态与发展研究报告
DeepResearch是一种AI驱动的智能研究工具,旨在解决复杂、知识密集型的研究任务。其核心功能包括:
@小森
2025/03/07
3741
42.5 Exaflops:谷歌新TPU性能超越最强超算24倍,智能体协作协议A2A出炉
本周三,谷歌正式发布了旗下第七代张量处理单元(TPU)Ironwood。谷歌称,在大规模部署的情况下,这款 AI 加速器的计算能力能达到全球最快超级计算机的 24 倍以上。
机器之心
2025/04/11
730
42.5 Exaflops:谷歌新TPU性能超越最强超算24倍,智能体协作协议A2A出炉
Cloud Next 2024上Google鼓吹新的Gemini代码辅助工具
在 Google Cloud Next '24 上,Google 展示了其对所有 AI 事物的持续投入,形式是若干新的开发者工具和新的以 AI 为重点的芯片。
云云众生s
2024/04/13
1610
Multi-Agent ,知多少?
众所周知,AI Agent 已经成为生成人工智能应用程序的重要组成部分。然而,为了能够有效地与复杂环境进行互动,这些代理需要具备强大的推理能力,以便能够独立做出决策并帮助用户解决各种任务。行为和推理之间存在着紧密的协同联系,这对于 AI Agent 快速学习新任务非常有帮助。此外,AI Agent 还需要推理能力来修改他们的计划,同时考虑到新的反馈或学到的信息。如果缺乏推理技能,这些代理的工作可能会出现问题,例如误解用户的查询或未能考虑到多步骤的影响。
Luga Lee
2024/11/01
3110
Multi-Agent ,知多少?
【AI Agent】你所不知道的 AI Agent:那些让机器拥有自主灵魂的神奇技术内幕
AI Agent,即人工智能代理或人工智能体,是一种融合了多种先进技术的智能系统。它以大语言模型为核心驱动力,在此基础上集成了规划、记忆和工具使用等关键组件。简单来说,AI Agent就像是一个拥有“大脑”的智能个体,能够感知周围环境,理解所面临的任务和目标,运用自身的知识和能力进行推理、规划,然后采取行动来实现目标。
学无止尽5
2025/01/24
2350
【AI Agent】你所不知道的 AI Agent:那些让机器拥有自主灵魂的神奇技术内幕
AI生态暗战升级,科技巨头铁幕下的终极博弈
在美剧《权力的游戏》中,不到终局,主角归属始终成谜。如今的AI行业,正上演着同样扣人心弦的戏码。
科技云报道
2025/04/23
1050
AI生态暗战升级,科技巨头铁幕下的终极博弈
推荐阅读
相关推荐
Firebase Studio:谷歌掀起AI编程革命,全栈开发进入“零门槛”时代
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验