OpenAI發布 Responses API 和 Agents SDK,增強智能體的開發流程
Openai于2025年3月11日發布了Agent SDK和Responses API,OpenAI 推出的 Agent SDK 和 Responses API 是為了解決傳統智能體開發中的痛點,比如復雜的提示工程(Prompt Engineering)、協調邏輯復雜等問題。這兩個工具可以讓開發者和企業能夠輕松構建實用且可靠的AI智能體。
Responses API是什么
Responses API 是一個強大的 API,結合了 Chat Completions API 的簡潔性和 Assistants API 的工具使用能力。它允許開發者通過單次 API 調用,集成多種工具和功能,從而簡化復雜任務的處理。
Responses API主要功能:
多工具集成:支持網絡搜索、文件搜索、計算機操作等功能,開發者可以在單次調用中完成多種操作。
實時數據交互:通過網絡搜索工具,AI 可以獲取最新信息并提供引用,適用于需要實時數據的場景。
多輪對話支持:通過響應鏈將多個交互串聯起來,保持對話的連貫性。
企業級數據隱私:基于 Azure 的安全和合規標準,確保數據保護。
Responses API應用
網頁搜索:基于 ChatGPT 同款搜索引擎,準確率高達 90%,支持信息溯源和引用標注。
文件搜索:支持多種文件格式,快速檢索海量文檔,適合企業知識庫管理。
電腦控制:允許智能體直接操作電腦,完成網頁自動化和數據錄入等任務。
Responses API使用代碼
// 網頁搜索示例 const response = await openai.responses.create({ model: "gpt-4o", tools: [{ type: "web_search_preview" }], input: "今天發生了什么積極的新聞?" }); console.log(response.output_text); // 文件搜索示例 const productDocs = await openai.vectorStores.create({ name: "產品文檔", file_ids: [file1.id, file2.id, file3.id], }); const response = await openai.responses.create({ model: "gpt-4o-mini", tools: [{ type: "file_search", vector_store_ids: [productDocs.id], }], input: "OpenAI的深度研究是什么?" }); console.log(response.output_text); // 電腦控制示例 const response = await openai.responses.create({ model: "computer-use-preview", tools: [{ type: "computer_use_preview", display_width: 1024, display_height: 768, environment: "browser", }], truncation: "auto", input: "我想買個新相機,幫我找到最好的。", }); console.log(response.output);
Agents SDK是什么?
Agents SDK 是一個開源框架,用于管理和協調多個 AI 智能體的工作流程。它基于 Swarm 框架升級,支持多智能體協作和復雜任務的編排。
Agents SDK主要功能:
配置化 Agent:輕松定義 Agent 的角色和工具。
智能交接(Handoff):Agent 之間可以無縫交接任務,協作更高效。
安全檢查(Guardrails):確保 Agent 的行為符合預期。
追蹤與可觀測性(Tracing & Observability):實時監控 Agent 的運行狀態,便于調試和優化。
Agents SDK使用代碼
from openai_agent import Agent, function_tool @function_tool def submit_refund_request(refund_amount: float, reason: str): """提交退款申請""" print(f"提交退款申請,金額:{refund_amount},原因:{reason}") return {"success": True} # 定義 Agent shopping_agent = Agent( name="Shopping Assistant", instructions="你是一個購物助手,可以搜索網絡商品信息。", tools=[WebSearchTool()], ) triage_agent = Agent( name="Triage Agent", instructions="引導用戶到正確的客服 Agent。", ) support_agent = Agent( name="Support Agent", instructions="你是一個客服 Agent,可以提交退款。", tools=[submit_refund_request], )
應用場景
企業自動化:通過 Responses API 和 Agents SDK,企業可以構建自動化的 AI 工作流,例如處理訂單、客戶服務、數據處理等。
復雜任務處理:在需要多步驟操作的場景中,如電商購物助手、法律研究或金融建模,這些工具可以顯著提高效率。
多模態交互:支持智能體通過計算機操作工具執行任務,例如在瀏覽器中自動完成搜索或填寫表單。
GitHub代碼庫:https://github.com/openai/openai-agents-python
OpenAI Agents SDK 是一個輕量級但功能強大的框架,用于構建多智能體工作流。它支持任務交接、安全檢查、工具調用和內置跟蹤功能,非常適合需要復雜智能體協作的企業自動化場景。