node-DeepResearch:Jina AI推出的DeepSearch功能,深入挖掘復雜問題
Jina AI 最近推出一個DeepSearch工具:node-DeepResearch,node-DeepResearch是一個開源的自動化研究工具,可以通過搜索、閱讀網頁和推理,直到找到問題的答案。適用于自動化信息檢索和智能問答任務,結合了搜索引擎和大語言模型(LLM)來提高研究效率。
一、主要功能:
自動搜索和推理:使用搜索引擎查找相關網頁,并通過大模型(如 Gemini)推理,生成最終答案。
智能網頁閱讀:結合 Jina Reader,能夠從網頁提取關鍵內容,提升信息獲取的精準度。
可配置 API:用戶可配置自己的 Gemini API 和 Jina Reader API,以優化查詢效果。
二、應用場景:
文獻綜述:幫助研究人員快速查找和整理相關領域的文獻資料,生成文獻綜述報告。
市場調研:快速收集和分析市場數據,了解競爭對手動態、行業趨勢等。
新聞報道:快速收集和整理新聞事件的背景信息、相關報道,幫助記者快速撰寫新聞稿件。
學習輔助:幫助學生解答復雜的學術問題,提供學習資料和參考答案。
政策研究:幫助政策制定者收集和分析相關政策的背景信息、實施效果等。
三、主要目標:
自動化信息檢索:通過搜索引擎查找相關信息。
多步推理:處理復雜的多步問題,逐步分解并解決問題。
實時進度反饋:提供實時進度更新,使用戶能夠跟蹤查詢進展。
靈活性:支持各種類型的查詢,從簡單的事實性問題到復雜的開放式問題。
四、關鍵特性
持續搜索與閱讀:
基于搜索引擎(如 Brave 或 DuckDuckGo)查找相關信息。
閱讀網頁內容,直至找到問題的答案或達到預定的 token 預算限制。
多步推理:
分解復雜的問題成多個步驟,并逐個解決這些步驟。
支持長時間的任務處理,確保得到精確的結果。
實時進度反饋:
通過 Web Server API 提供實時進度更新,用戶可以通過 HTTP 請求獲取查詢狀態。
靈活的查詢方式:
支持多種類型的查詢需求,包括簡單的問題和復雜的開放式問題。
五、技術原理
語言模型:
使用 Gemini 作為核心語言模型,負責生成回答和推理邏輯。
Gemini 是一個強大的通用語言模型,能夠處理多種自然語言任務。
網頁內容處理:
利用 Jina Reader 將網頁內容轉換為適合語言模型處理的純文本格式。
Jina Reader 是一個開源工具,專用于處理 HTML 網頁內容。
搜索與信息提取:
結合搜索引擎獲取相關信息。
自動提取有用的網頁內容,以便進一步分析和推理。
多步推理流程:
初始化:設置初始上下文和變量。
預算檢查:在每一步檢查 token 預算是否超出。
生產提示:根據當前問題生成語言模型的輸入提示。
模型生成:調用 Gemini 生成回答或下一步動作。
動作處理:根據生成的動作執行相應的操作。
結果評估:評估生成的回答是否滿足問題要求,若不滿足則繼續推理。
循環與終止:如果在預算內找到答案,則結束查詢;否則進入“Beast Mode”生成最終答案。
六、如何部署 node-DeepResearch?
1. 安裝依賴
# 設置必要的環境變量 export GEMINI_API_KEY=export JINA_API_KEY=jina_ # 從 https://jina.ai/reader 獲取免費的 Jina API 密鑰 # 克隆倉庫并安裝依賴 git clone https://github.com/jina-ai/node-DeepResearch.git cd node-DeepResearch npm install
2. 使用命令行運行
# 提交查詢請求 npm run dev # 示例 npm run dev "what is the capital of France?" npm run dev "who will be the biggest competitor of Jina AI"
3. 調用API
# 啟動 Web Server npm run serve # 訪問地址 http://localhost:3000 # 提交查詢請求 (示例) curl -X POST http://localhost:3000/api/v1/query \ -H "Content-Type: application/json" \ -d '{"query": "What is the capital of France?"}'
GitHub倉庫:https://github.com/jina-ai/node-DeepResearch
相關文章
- 用戶登錄