前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >OpenAI 用Agent SDK重新定义Agent工作流构建方式

OpenAI 用Agent SDK重新定义Agent工作流构建方式

作者头像
AIGC新知
发布2025-03-12 14:16:14
发布2025-03-12 14:16:14
26200
代码可运行
举报
文章被收录于专栏:AIGC新知AIGC新知
运行总次数:0
代码可运行
A sleek, minimal interface displaying a task list for an AI agent, including ‘triage_agent,’ ‘guardrail,’ and ‘update_salesforce_record,’ over a fluid blue abstract background.
A sleek, minimal interface displaying a task list for an AI agent, including ‘triage_agent,’ ‘guardrail,’ and ‘update_salesforce_record,’ over a fluid blue abstract background.

就在刚刚,OpenAI正式推出了第一组基础构建模块,旨在助力开发者和企业打造实用且可靠的Agent系统。

在过去一年中,OpenAI不断拓展模型能力,新增了高级推理、多模态交互以及新型安全技术等功能,这些都为模型处理复杂多步骤任务奠定了坚实基础。

然而将这些能力转化为生产就绪的代理仍面临诸多挑战,通常需要大量的提示迭代和自定义编排逻辑,同时缺乏足够的可视化支持和内置辅助功能。

为攻克这些难题,他们精心打造了一套全新设计的 API 和工具,致力于简化代理型应用程序的开发流程:

  • 全新 Responses API:融合了 Chat Completions API 的简洁性与 Assistants API 的工具使用功能,专为构建代理而生。
  • 内置工具:涵盖网络搜索、文件搜索以及计算机使用等,为代理提供强大支持。
  • 全新 Agents SDK:支持编排单代理和多代理工作流,灵活应对各类复杂场景。
  • 集成可观测性工具:可追踪和检查 agent 工作流执行,让开发过程更加透明。

这些新工具优化了核心代理逻辑、编排和交互流程,极大地降低了开发者构建代理应用的门槛。在未来几周乃至数月内,还将陆续推出更多工具和功能,进一步简化和加速基于我们平台构建智能体应用的开发进程。

推出 Responses API

Responses API 是一个全新 API 原语,旨在利用 OpenAI 内置工具构建智能体。融合了 Chat Completions 的简洁性与 Assistants API 的工具使用能力。

随着模型能力的持续演进, Responses API 将为开发者构建智能体应用提供更灵活的基础架构。通过单次 Responses API 调用,开发者将能够使用多种工具和模型轮次解决日益复杂的任务。

Responses API 将支持网络搜索、文件搜索和计算机使用等新型内置工具。这些工具旨在协同工作,将模型与现实世界连接,使其在完成任务时更具实用性。

网络搜索

通过网络快速获取最新答案,并附带清晰且相关的引用来源。在 Responses API 中,使用 gpt-4o 和 gpt-4o-mini 时,网络搜索可作为工具使用,并可与其他工具或函数调用结合使用。

代码语言:javascript
代码运行次数:0
运行
复制
const response = await openai.responses.create({
    model: "gpt-4o",
    tools: [ { type: "web_search_preview" } ],
    input: "What was a positive news story that happened today?",
});

console.log(response.output_text);

文件搜索

通过改进的文件搜索工具轻松从海量文档中检索相关信息。该工具支持多种文件类型,具备查询优化、元数据过滤和自定义重新排序功能,能够提供快速、准确的搜索结果。通过 Responses API,仅需几行代码即可完成集成。

代码语言:javascript
代码运行次数:0
运行
复制
const productDocs = await openai.vectorStores.create({
    name: "Product Documentation",
    file_ids: [file1.id, file2.id, file3.id],
});

const response = await openai.responses.create({
    model: "gpt-4o-mini",
    tools: [{
        type: "file_search",
        vector_store_ids: [productDocs.id],
    }],
    input: "What is deep research by OpenAI?",
});

console.log(response.output_text);

计算机使用

可利用 Responses API 中的计算机使用工具构建能在计算机上完成任务的智能体,该工具由赋能 Operator 的同款计算机使用代理(CUA)模型驱动。

内置计算机使用工具可捕获模型生成的鼠标和键盘动作,使开发者能够通过直接将这些动作转化为其运行环境中的可执行命令,实现计算机使用任务的自动化。

代码语言:javascript
代码运行次数:0
运行
复制
const response = await openai.responses.create({
    model: "computer-use-preview",
    tools: [{
        type: "computer_use_preview",
        display_width: 1024,
        display_height: 768,
        environment: "browser",
    }],
    truncation: "auto",
    input: "I'm looking for a new camera. Help me find the best one.",
});

console.log(response.output);

该 API 还带来了多项可用性改进,包括统一的项目式设计、简化的多态性、直观的流式事件以及类似 response.output_text 的 SDK 辅助工具,可轻松获取模型的文本输出。

Agents SDK

除了构建智能体的核心逻辑并为其提供工具访问权限以使其发挥作用外,开发人员还需要编排智能体工作流程。

全新的开源 Agents SDK 简化了多智能体工作流程的编排,相比 Swarm⁠(实验性 SDK)实现了重大改进——该 SDK 已被开发者社区广泛采用,并被多个客户成功部署。

改进包括:

  • Agents: 轻松可配置的LLMs,附带清晰说明和内置工具。
  • 切换:在代理之间智能转移控制权。
  • 防护栏:可配置的安全检查,用于输入和输出验证。
  • 追踪与可观测性:可视化代理执行跟踪以调试和优化性能。
代码语言:javascript
代码运行次数:0
运行
复制
from agents import Agent, Runner, WebSearchTool, function_tool, guardrail

@function_tool
def submit_refund_request(item_id: str, reason: str):
    # Your refund logic goes here
    return "success"

support_agent = Agent(
    name="Support & Returns",
    instructions="You are a support agent who can submit refunds [...]",
    tools=[submit_refund_request],
)

shopping_agent = Agent(
    name="Shopping Assistant",
    instructions="You are a shopping assistant who can search the web [...]",
    tools=[WebSearchTool()],
)

triage_agent = Agent(
    name="Triage Agent",
    instructions="Route the user to the correct agent.",
    handoffs=[shopping_agent, support_agent],
)

output = Runner.run_sync(
    starting_agent=triage_agent,
    input="What shoes might work best with my outfit so far?",
)

Agents SDK 适用于多种现实应用场景,包括客户支持自动化、多步骤研究、内容生成、代码审查和销售线索挖掘。

Agents SDK 可与 Responses API 和 Chat Completions API 配合使用。只要其他供应商的模型提供 Chat Completions 风格的 API 端点,该 SDK 也能与其配合使用。

开发者可立即将其集成到 Python 代码库中,Node.js 支持即将推出。

Agent Traces UI in OpenAI Dashboard
Agent Traces UI in OpenAI Dashboard

来源信息:

  • https://openai.com/index/new-tools-for-building-agents/
  • https://platform.openai.com/docs/guides/agents
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AIGC新知 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档