Notte:一個開源的Web瀏覽智能體框架
Notte是什么?
Notte 是一個開源的 Web 瀏覽框架,通過單一 API 讓開發者輕松構建、部署和擴展智能體。它能管理瀏覽器會話,讓智能體自動完成復雜的 Web 任務,還能用自然語言命令感知和操作網頁。此外,它有安全的密鑰管理功能。Notte 的特別之處在于感知層,能把網頁的復雜信息轉化為簡潔的自然語言描述,讓智能體更高效、更可靠地工作。在任務時間、可靠性和評估得分上,它都比現有的解決方案表現更好。
Notte功能特點
瀏覽器管理:基于 Playwright 在底層處理瀏覽器會話和窗口,能夠方便地進行多窗口、多標簽頁的管理,以及瀏覽器的啟動、關閉、頁面導航等操作。
DOM 處理:將網頁頁面轉換為結構化的、適合智能體處理的格式。這樣可以讓智能體更容易理解網頁的內容結構,比如將網頁中的標題、段落、列表、鏈接等元素進行解析和分類,便于智能體根據需求提取信息。
錯誤處理:針對各種與瀏覽器相關的場景,提供了強大的錯誤管理機制。無論是網絡連接問題、頁面加載失敗,還是元素查找不到等問題,都能進行有效的捕獲和處理,保證智能體在瀏覽網頁過程中的穩定性和可靠性。
可配置選項:支持靈活配置,包括頭 less 模式(即無界面模式,可在服務器等環境中運行,節省資源且提高運行效率)、用戶代理(可以偽裝成不同的瀏覽器或設備訪問網頁,以適應不同網站的兼容性要求)、代理設置(便于通過代理服務器訪問網頁,突破網絡限制或實現隱私保護等)等。
安全控制:具備內置的網絡安全控制,并且可以自定義 Chrome 瀏覽器的參數,以增強瀏覽器的安全性,防止潛在的安全漏洞和攻擊。
Web腳本編寫:提供Web腳本編寫能力,以及最先進的抓取端點。
托管SDK:提供托管的SDK,可以管理云瀏覽器會話和所有庫的功能。
API端點:提供豐富的API端點,用于會話管理、頁面交互、智能體任務執行等。
Notte應用場景
信息提取與分析:可以讓智能體自動瀏覽多個網頁,提取特定的信息,如新聞文章中的關鍵事件、科技論文中的研究成果、電商網站上的商品信息等,并進行分析和總結。例如,自動收集多個行業報告網站上的市場數據,分析市場趨勢。
任務自動化:能夠模擬人類在網頁上的操作,完成一些重復性的任務,如自動填寫表單、提交數據、點擊按鈕等。比如,自動在招聘網站上搜索符合條件的職位并投遞簡歷。
智能問答系統:作為智能問答系統的一部分,使系統能夠通過瀏覽網頁獲取最新、最準確的信息來回答用戶的問題。當用戶提出一個關于特定主題的問題時,Notte 可以幫助智能體在網頁中查找相關內容,并整理出答案。
Notte安裝使用
安裝命令:使用uv sync --dev --all-extras和uv run pre-commit install進行安裝和配置。
瀏覽器安裝:使用patchright自動化瀏覽器交互,需要安裝所需的瀏覽器,如uv run patchright install --with-deps chromium。
環境變量配置:復制.env.example到.env,并填寫 API 密鑰,默認使用groq/llama-3.3-70b-versatile,需設置GROQ_API_KEY,也可設置其他 LLM 提供商的 API 密鑰。
網頁抓取與數據提取:
from notte_sdk import NotteClient notte = NotteClient() data = notte.scrape(url="https://pump.fun", instructions="get top 5 latest trendy coins on pf, return ticker, name, mcap")
項目鏈接
Github:https://github.com/nottelabs/notte
官網:https://www.notte.cc/
相關文章
- 用戶登錄