Deep Research:OpenAI推出的深入信息挖掘和分析智能體
Openai 最新推出的 Deep Research 是一款面向深度研究領(lǐng)域的智能體產(chǎn)品,旨在幫助用戶進行復(fù)雜的信息查詢與分析,Deep Research能夠獨立發(fā)現(xiàn)、推理并整合來自網(wǎng)絡(luò)的見解,提供全面的研究報告和關(guān)鍵發(fā)現(xiàn)。
Deep Research功能與應(yīng)用
信息整合:能夠從多個來源收集信息,并將其整合成易于理解的報告。
實時分析:用戶可以進行實時的主題研究,獲取最新的信息和數(shù)據(jù)。
多領(lǐng)域適用性:該工具適用于金融、科學(xué)、政策和工程等多個領(lǐng)域,特別適合需要進行深入知識工作的專業(yè)人士。
Deep Research技術(shù)特點
端到端強化學(xué)習(xí)
Deep Research 使用端到端強化學(xué)習(xí)技術(shù),允許模型從輸入到輸出進行整體優(yōu)化。
通過與環(huán)境交互,模型能夠規(guī)劃和執(zhí)行多步驟的研究軌跡,并在發(fā)現(xiàn)偏差時回溯調(diào)整策略,確保結(jié)果的準確性。
多步驟推理與動態(tài)調(diào)整
Deep Research 能夠像人類研究者一樣制定研究計劃,逐步分解復(fù)雜任務(wù)。
例如,在處理市場趨勢分析時,模型會通過關(guān)鍵詞搜索獲取初步信息,進一步查找行業(yè)報告、統(tǒng)計數(shù)據(jù)等,并對不同來源的信息進行對比分析,最終生成綜合性報告。
隨著發(fā)現(xiàn)更多信息,模型會調(diào)整自己的計劃,以確保結(jié)果的全面性和準確性。
打破響應(yīng)時間限制
與傳統(tǒng)模型追求快速響應(yīng)不同,Deep Research 允許模型花費 5 至 30 分鐘甚至更長時間處理問題。
這種延遲并非缺點,而是模型走向成熟的標志。通過深入分析海量信息,模型能夠輸出更加全面、準確的研究成果。
模塊化設(shè)計
Deep Research 由多個模塊組成,包括信息發(fā)現(xiàn)、信息綜合、推理和輸出模塊。
信息發(fā)現(xiàn)模塊能夠快速定位學(xué)術(shù)數(shù)據(jù)庫、科研機構(gòu)網(wǎng)站等,為后續(xù)分析提供豐富素材。
信息綜合模塊負責(zé)整合信息,推理模塊進行邏輯推理,輸出模塊生成報告。
Deep Research應(yīng)用場景
市場研究與學(xué)術(shù)研究
Deep Research 在市場調(diào)研和學(xué)術(shù)研究領(lǐng)域表現(xiàn)出色。
例如,它可以收集不同地區(qū)和時間段的市場數(shù)據(jù),預(yù)測市場趨勢;在學(xué)術(shù)研究中,它能深入研讀文獻,挖掘不同研究之間的潛在聯(lián)系,為科研工作者提供有價值的研究思路。
消費決策與個性化推薦
對于需要仔細研究的商品(如汽車、家電、家具等),Deep Research 能夠生成高度個性化的推薦報告。
它通過分析用戶需求和市場數(shù)據(jù),提供詳細的購買建議。
復(fù)雜任務(wù)的自動化處理
用戶只需提供一個提示,Deep Research 即可查找、分析并整合數(shù)百個在線資源,生成達到研究分析師水平的綜合報告。
例如,它可以生成競爭對手和市場研究報告,或者幫助用戶找到忘記名字但記得某集內(nèi)容的電視劇。
性能與測試結(jié)果
“人類終極考試”表現(xiàn)
在 AI 安全與規(guī)模中心發(fā)布的“人類終極考試”中,Deep Research 達到了 26.6% 的準確率,遠超其他知名模型(如 DeepSeek-R1 的 9.4% 和 o3-mini high 的 13%)。
這個測試包含 3000 多個多項選擇題和簡答題,涵蓋從語言學(xué)到火箭科學(xué)、古典學(xué)到生態(tài)學(xué)的 100 多個學(xué)科。
GAIA 基準測試成績
在 GAIA 基準測試中,Deep Research 在三個難度級別上均達到了新的高度,成績?yōu)?72.57,超過之前最好的方法(63.64)。
這些任務(wù)要求模型具備推理、多模態(tài)流暢性、網(wǎng)頁瀏覽和工具使用等能力。
內(nèi)部基準測試與專家評價
OpenAI 的內(nèi)部測試顯示,Deep Research 能夠完成專家需數(shù)小時才能完成的任務(wù)。
例如,在金融、科學(xué)和工程領(lǐng)域,模型的表現(xiàn)得到了領(lǐng)域?qū)<业母叨仍u價。
Deep Research如何使用?
用戶權(quán)限
目前,Deep Research 只對 ChatGPT Pro 用戶開放,每月最多可進行 100 次查詢。
接下來,Plus 和 Team 用戶將獲得訪問權(quán)限,隨后是企業(yè)用戶。
操作步驟
在 ChatGPT 中,選擇「message composer」中的 Deep Research 并輸入查詢。
告訴 ChatGPT 你需要什么,無論是關(guān)于流媒體平臺的競爭分析,還是關(guān)于最佳通勤的個性化報告。
甚至可以附加文件或電子表格,為問題添加上下文。
一旦開始運行,側(cè)邊欄將顯示所采取的步驟和使用的來源摘要。
Deep Research 可能需要 5 到 30 分鐘的時間來完成其工作,用戶可以離開或處理其他任務(wù),任務(wù)完成后會收到通知。
最終結(jié)果將以報告的形式出現(xiàn)在聊天中,未來幾周內(nèi),OpenAI 還將為這些報告添加嵌入的圖像、數(shù)據(jù)可視化和其他分析輸出,以提供更清晰的說明和上下文。
與 GPT-4o 的對比
實時性
GPT-4o 更適合實時的多模態(tài)對話,而 Deep Research 則需要較長時間來完成深度和細節(jié)的多步驟研究任務(wù)。
綜合能力
Deep Research 能夠進行廣泛的探索并引用每個聲明,適合需要深度和細節(jié)的各個方面、特定領(lǐng)域的查詢。
GPT-4o 在編碼、數(shù)學(xué)和其他技術(shù)領(lǐng)域表現(xiàn)出令人印象深刻的能力,但許多現(xiàn)實世界的挑戰(zhàn)需要從各種在線來源收集廣泛的背景和信息,這是 Deep Research 的強項。
詳細:https://openai.com/index/introducing-deep-research/