OpenAI發(fā)布 Responses API 和 Agents SDK,增強(qiáng)智能體的開發(fā)流程
Openai于2025年3月11日發(fā)布了Agent SDK和Responses API,OpenAI 推出的 Agent SDK 和 Responses API 是為了解決傳統(tǒng)智能體開發(fā)中的痛點(diǎn),比如復(fù)雜的提示工程(Prompt Engineering)、協(xié)調(diào)邏輯復(fù)雜等問題。這兩個工具可以讓開發(fā)者和企業(yè)能夠輕松構(gòu)建實(shí)用且可靠的AI智能體。
Responses API是什么
Responses API 是一個強(qiáng)大的 API,結(jié)合了 Chat Completions API 的簡潔性和 Assistants API 的工具使用能力。它允許開發(fā)者通過單次 API 調(diào)用,集成多種工具和功能,從而簡化復(fù)雜任務(wù)的處理。
Responses API主要功能:
多工具集成:支持網(wǎng)絡(luò)搜索、文件搜索、計算機(jī)操作等功能,開發(fā)者可以在單次調(diào)用中完成多種操作。
實(shí)時數(shù)據(jù)交互:通過網(wǎng)絡(luò)搜索工具,AI 可以獲取最新信息并提供引用,適用于需要實(shí)時數(shù)據(jù)的場景。
多輪對話支持:通過響應(yīng)鏈將多個交互串聯(lián)起來,保持對話的連貫性。
企業(yè)級數(shù)據(jù)隱私:基于 Azure 的安全和合規(guī)標(biāo)準(zhǔn),確保數(shù)據(jù)保護(hù)。
Responses API應(yīng)用
網(wǎng)頁搜索:基于 ChatGPT 同款搜索引擎,準(zhǔn)確率高達(dá) 90%,支持信息溯源和引用標(biāo)注。
文件搜索:支持多種文件格式,快速檢索海量文檔,適合企業(yè)知識庫管理。
電腦控制:允許智能體直接操作電腦,完成網(wǎng)頁自動化和數(shù)據(jù)錄入等任務(wù)。
Responses API使用代碼
// 網(wǎng)頁搜索示例 const response = await openai.responses.create({ model: "gpt-4o", tools: [{ type: "web_search_preview" }], input: "今天發(fā)生了什么積極的新聞?" }); console.log(response.output_text); // 文件搜索示例 const productDocs = await openai.vectorStores.create({ name: "產(chǎn)品文檔", file_ids: [file1.id, file2.id, file3.id], }); const response = await openai.responses.create({ model: "gpt-4o-mini", tools: [{ type: "file_search", vector_store_ids: [productDocs.id], }], input: "OpenAI的深度研究是什么?" }); console.log(response.output_text); // 電腦控制示例 const response = await openai.responses.create({ model: "computer-use-preview", tools: [{ type: "computer_use_preview", display_width: 1024, display_height: 768, environment: "browser", }], truncation: "auto", input: "我想買個新相機(jī),幫我找到最好的。", }); console.log(response.output);
Agents SDK是什么?
Agents SDK 是一個開源框架,用于管理和協(xié)調(diào)多個 AI 智能體的工作流程。它基于 Swarm 框架升級,支持多智能體協(xié)作和復(fù)雜任務(wù)的編排。
Agents SDK主要功能:
配置化 Agent:輕松定義 Agent 的角色和工具。
智能交接(Handoff):Agent 之間可以無縫交接任務(wù),協(xié)作更高效。
安全檢查(Guardrails):確保 Agent 的行為符合預(yù)期。
追蹤與可觀測性(Tracing & Observability):實(shí)時監(jiān)控 Agent 的運(yùn)行狀態(tài),便于調(diào)試和優(yōu)化。
Agents SDK使用代碼
from openai_agent import Agent, function_tool @function_tool def submit_refund_request(refund_amount: float, reason: str): """提交退款申請""" print(f"提交退款申請,金額:{refund_amount},原因:{reason}") return {"success": True} # 定義 Agent shopping_agent = Agent( name="Shopping Assistant", instructions="你是一個購物助手,可以搜索網(wǎng)絡(luò)商品信息。", tools=[WebSearchTool()], ) triage_agent = Agent( name="Triage Agent", instructions="引導(dǎo)用戶到正確的客服 Agent。", ) support_agent = Agent( name="Support Agent", instructions="你是一個客服 Agent,可以提交退款。", tools=[submit_refund_request], )
應(yīng)用場景
企業(yè)自動化:通過 Responses API 和 Agents SDK,企業(yè)可以構(gòu)建自動化的 AI 工作流,例如處理訂單、客戶服務(wù)、數(shù)據(jù)處理等。
復(fù)雜任務(wù)處理:在需要多步驟操作的場景中,如電商購物助手、法律研究或金融建模,這些工具可以顯著提高效率。
多模態(tài)交互:支持智能體通過計算機(jī)操作工具執(zhí)行任務(wù),例如在瀏覽器中自動完成搜索或填寫表單。
GitHub代碼庫:https://github.com/openai/openai-agents-python
OpenAI Agents SDK 是一個輕量級但功能強(qiáng)大的框架,用于構(gòu)建多智能體工作流。它支持任務(wù)交接、安全檢查、工具調(diào)用和內(nèi)置跟蹤功能,非常適合需要復(fù)雜智能體協(xié)作的企業(yè)自動化場景。