OpenAI發(fā)布 Responses API 和 Agents SDK,增強智能體的開發(fā)流程
Openai于2025年3月11日發(fā)布了Agent SDK和Responses API,OpenAI 推出的 Agent SDK 和 Responses API 是為了解決傳統(tǒng)智能體開發(fā)中的痛點,比如復(fù)雜的提示工程(Prompt Engineering)、協(xié)調(diào)邏輯復(fù)雜等問題。這兩個工具可以讓開發(fā)者和企業(yè)能夠輕松構(gòu)建實用且可靠的AI智能體。
Responses API是什么
Responses API 是一個強大的 API,結(jié)合了 Chat Completions API 的簡潔性和 Assistants API 的工具使用能力。它允許開發(fā)者通過單次 API 調(diào)用,集成多種工具和功能,從而簡化復(fù)雜任務(wù)的處理。
Responses API主要功能:
多工具集成:支持網(wǎng)絡(luò)搜索、文件搜索、計算機操作等功能,開發(fā)者可以在單次調(diào)用中完成多種操作。
實時數(shù)據(jù)交互:通過網(wǎng)絡(luò)搜索工具,AI 可以獲取最新信息并提供引用,適用于需要實時數(shù)據(jù)的場景。
多輪對話支持:通過響應(yīng)鏈將多個交互串聯(lián)起來,保持對話的連貫性。
企業(yè)級數(shù)據(jù)隱私:基于 Azure 的安全和合規(guī)標準,確保數(shù)據(jù)保護。
Responses API應(yīng)用
網(wǎng)頁搜索:基于 ChatGPT 同款搜索引擎,準確率高達 90%,支持信息溯源和引用標注。
文件搜索:支持多種文件格式,快速檢索海量文檔,適合企業(yè)知識庫管理。
電腦控制:允許智能體直接操作電腦,完成網(wǎng)頁自動化和數(shù)據(jù)錄入等任務(wù)。
Responses API使用代碼
// 網(wǎng)頁搜索示例
const response = await openai.responses.create({
model: "gpt-4o",
tools: [{ type: "web_search_preview" }],
input: "今天發(fā)生了什么積極的新聞?"
});
console.log(response.output_text);
// 文件搜索示例
const productDocs = await openai.vectorStores.create({
name: "產(chǎn)品文檔",
file_ids: [file1.id, file2.id, file3.id],
});
const response = await openai.responses.create({
model: "gpt-4o-mini",
tools: [{
type: "file_search",
vector_store_ids: [productDocs.id],
}],
input: "OpenAI的深度研究是什么?"
});
console.log(response.output_text);
// 電腦控制示例
const response = await openai.responses.create({
model: "computer-use-preview",
tools: [{
type: "computer_use_preview",
display_width: 1024,
display_height: 768,
environment: "browser",
}],
truncation: "auto",
input: "我想買個新相機,幫我找到最好的。",
});
console.log(response.output);
Agents SDK是什么?
Agents SDK 是一個開源框架,用于管理和協(xié)調(diào)多個 AI 智能體的工作流程。它基于 Swarm 框架升級,支持多智能體協(xié)作和復(fù)雜任務(wù)的編排。
Agents SDK主要功能:
配置化 Agent:輕松定義 Agent 的角色和工具。
智能交接(Handoff):Agent 之間可以無縫交接任務(wù),協(xié)作更高效。
安全檢查(Guardrails):確保 Agent 的行為符合預(yù)期。
追蹤與可觀測性(Tracing & Observability):實時監(jiān)控 Agent 的運行狀態(tài),便于調(diào)試和優(yōu)化。
Agents SDK使用代碼
from openai_agent import Agent, function_tool
@function_tool
def submit_refund_request(refund_amount: float, reason: str):
"""提交退款申請"""
print(f"提交退款申請,金額:{refund_amount},原因:{reason}")
return {"success": True}
# 定義 Agent
shopping_agent = Agent(
name="Shopping Assistant",
instructions="你是一個購物助手,可以搜索網(wǎng)絡(luò)商品信息。",
tools=[WebSearchTool()],
)
triage_agent = Agent(
name="Triage Agent",
instructions="引導(dǎo)用戶到正確的客服 Agent。",
)
support_agent = Agent(
name="Support Agent",
instructions="你是一個客服 Agent,可以提交退款。",
tools=[submit_refund_request],
)應(yīng)用場景
企業(yè)自動化:通過 Responses API 和 Agents SDK,企業(yè)可以構(gòu)建自動化的 AI 工作流,例如處理訂單、客戶服務(wù)、數(shù)據(jù)處理等。
復(fù)雜任務(wù)處理:在需要多步驟操作的場景中,如電商購物助手、法律研究或金融建模,這些工具可以顯著提高效率。
多模態(tài)交互:支持智能體通過計算機操作工具執(zhí)行任務(wù),例如在瀏覽器中自動完成搜索或填寫表單。
GitHub代碼庫:https://github.com/openai/openai-agents-python
OpenAI Agents SDK 是一個輕量級但功能強大的框架,用于構(gòu)建多智能體工作流。它支持任務(wù)交接、安全檢查、工具調(diào)用和內(nèi)置跟蹤功能,非常適合需要復(fù)雜智能體協(xié)作的企業(yè)自動化場景。
提交您的產(chǎn)品
Ai應(yīng)用
Ai資訊
AI生圖
AI生視頻
開源AI應(yīng)用平臺










