OpenAI發(fā)布 Responses API 和 Agents SDK，增強智能體的開發(fā)流程

OpenAI于2025-03-12發(fā)布在Ai產(chǎn)品

Openai于2025年3月11日發(fā)布了Agent SDK和Responses API，OpenAI 推出的 Agent SDK 和 Responses API 是為了解決傳統(tǒng)智能體開發(fā)中的痛點，比如復(fù)雜的提示工程（Prompt Engineering）、協(xié)調(diào)邏輯復(fù)雜等問題。這兩個工具可以讓開發(fā)者和企業(yè)能夠輕松構(gòu)建實用且可靠的AI智能體。

Responses API是什么

Responses API 是一個強大的 API，結(jié)合了 Chat Completions API 的簡潔性和 Assistants API 的工具使用能力。它允許開發(fā)者通過單次 API 調(diào)用，集成多種工具和功能，從而簡化復(fù)雜任務(wù)的處理。

Responses API主要功能：

多工具集成：支持網(wǎng)絡(luò)搜索、文件搜索、計算機操作等功能，開發(fā)者可以在單次調(diào)用中完成多種操作。
實時數(shù)據(jù)交互：通過網(wǎng)絡(luò)搜索工具，AI 可以獲取最新信息并提供引用，適用于需要實時數(shù)據(jù)的場景。
多輪對話支持：通過響應(yīng)鏈將多個交互串聯(lián)起來，保持對話的連貫性。
企業(yè)級數(shù)據(jù)隱私：基于 Azure 的安全和合規(guī)標準，確保數(shù)據(jù)保護。

Responses API應(yīng)用

網(wǎng)頁搜索：基于 ChatGPT 同款搜索引擎，準確率高達 90%，支持信息溯源和引用標注。
文件搜索：支持多種文件格式，快速檢索海量文檔，適合企業(yè)知識庫管理。
電腦控制：允許智能體直接操作電腦，完成網(wǎng)頁自動化和數(shù)據(jù)錄入等任務(wù)。

Responses API使用代碼

// 網(wǎng)頁搜索示例
const response = await openai.responses.create({
  model: "gpt-4o",
  tools: [{ type: "web_search_preview" }],
  input: "今天發(fā)生了什么積極的新聞？"
});
console.log(response.output_text);
// 文件搜索示例
const productDocs = await openai.vectorStores.create({
  name: "產(chǎn)品文檔",
  file_ids: [file1.id, file2.id, file3.id],
});
const response = await openai.responses.create({
  model: "gpt-4o-mini",
  tools: [{
    type: "file_search",
    vector_store_ids: [productDocs.id],
  }],
  input: "OpenAI的深度研究是什么？"
});
console.log(response.output_text);
// 電腦控制示例
const response = await openai.responses.create({
  model: "computer-use-preview",
  tools: [{
    type: "computer_use_preview",
    display_width: 1024,
    display_height: 768,
    environment: "browser",
  }],
  truncation: "auto",
  input: "我想買個新相機，幫我找到最好的。",
});
console.log(response.output);

OpenAI發(fā)布 Responses API 和 Agents SDK，增強智能體的開發(fā)流程.webp

Agents SDK是什么？

Agents SDK 是一個開源框架，用于管理和協(xié)調(diào)多個 AI 智能體的工作流程。它基于 Swarm 框架升級，支持多智能體協(xié)作和復(fù)雜任務(wù)的編排。

Agents SDK主要功能：

配置化 Agent：輕松定義 Agent 的角色和工具。
智能交接（Handoff）：Agent 之間可以無縫交接任務(wù)，協(xié)作更高效。
安全檢查（Guardrails）：確保 Agent 的行為符合預(yù)期。
追蹤與可觀測性（Tracing & Observability）：實時監(jiān)控 Agent 的運行狀態(tài)，便于調(diào)試和優(yōu)化。

Agents SDK使用代碼

from openai_agent import Agent, function_tool
@function_tool
def submit_refund_request(refund_amount: float, reason: str):
    """提交退款申請"""
    print(f"提交退款申請，金額：{refund_amount}，原因：{reason}")
    return {"success": True}
# 定義 Agent
shopping_agent = Agent(
    name="Shopping Assistant",
    instructions="你是一個購物助手，可以搜索網(wǎng)絡(luò)商品信息。",
    tools=[WebSearchTool()],
)
triage_agent = Agent(
    name="Triage Agent",
    instructions="引導(dǎo)用戶到正確的客服 Agent。",
)
support_agent = Agent(
    name="Support Agent",
    instructions="你是一個客服 Agent，可以提交退款。",
    tools=[submit_refund_request],
)

應(yīng)用場景

企業(yè)自動化：通過 Responses API 和 Agents SDK，企業(yè)可以構(gòu)建自動化的 AI 工作流，例如處理訂單、客戶服務(wù)、數(shù)據(jù)處理等。
復(fù)雜任務(wù)處理：在需要多步驟操作的場景中，如電商購物助手、法律研究或金融建模，這些工具可以顯著提高效率。
多模態(tài)交互：支持智能體通過計算機操作工具執(zhí)行任務(wù)，例如在瀏覽器中自動完成搜索或填寫表單。

GitHub代碼庫：https://github.com/openai/openai-agents-python

OpenAI Agents SDK 是一個輕量級但功能強大的框架，用于構(gòu)建多智能體工作流。它支持任務(wù)交接、安全檢查、工具調(diào)用和內(nèi)置跟蹤功能，非常適合需要復(fù)雜智能體協(xié)作的企業(yè)自動化場景。