BrowserBee:隱私優先的網頁自動化Chrome擴展
BrowserBee是什么?
BrowserBee 是一款開源的 Chrome 擴展,通過自然語言指令來控制瀏覽器,實現網頁自動化操作。它結合了語言模型的解析能力和 Playwright 的自動化功能,讓用戶能夠更高效地完成各種任務,同時注重隱私保護。
BrowserBee功能特點
隱私保護:BrowserBee 的操作主要在本地瀏覽器內完成,僅與 LLM 提供商進行通信,不涉及其他數據傳輸。
多模型支持:支持多種主流 LLM 提供商,如 Anthropic、Openai、Gemini 和 Ollama。
豐富的工具集:提供導航、標簽管理、頁面交互、觀察、鼠標和鍵盤操作等多種工具。
記憶功能:可以存儲并復用有用的操作序列,提高效率。
用戶審批流程:在執行敏感操作(如購買或發布社交媒體更新)時,會要求用戶明確批準。
成本跟蹤:跟蹤 LLM 的 Token 使用和費用,幫助用戶管理成本。
BrowserBee使用場景
社交媒體管理:檢查通知、總結消息并幫助回復。
新聞聚合:收集并總結用戶喜愛的新聞源和博客的最新頭條。
個人助理:處理日常任務,如閱讀和發送電子郵件、預訂航班等。
研究助手:收集和組織公司、職位列表、市場趨勢或學術論文等信息。
知識書簽和總結:快速總結文章、提取關鍵信息并保存。
BrowserBee安裝與使用
安裝步驟
你可以通過以下步驟安裝 BrowserBee:
git clone https://github.com/parsaghaffari/browserbee.git cd browserbee
安裝依賴
npm install
構建擴展
npm run build
在 Chrome 中加載擴展
訪問 chrome://extensions/。
啟用右上角的 “開發者模式”。
點擊 “加載已解壓的擴展程序”,并選擇 dist 目錄。
BrowserBee 選項頁面應該會自動彈出,在該頁面設置你的 LLM API 密鑰(如 Anthropic、OpenAI、Gemini)或配置 Ollama。
使用方法
點擊 Chrome 工具欄中的 BrowserBee 圖標,或按下 Alt+Shift+B 打開側邊面板。
輸入指令,例如:“Go to Google, search for Cicero, and click the first result”。
按下回車鍵,等待 BrowserBee 完成任務。
優勢與局限
優勢:
隱私優先,數據不經過第三方后端。
開源透明,用戶可以自行檢查和修改代碼。
提供多種 LLM 選項,用戶可以根據需求選擇。
內存功能可以提高重復任務的效率。
局限:
需要手動安裝和配置 LLM API 密鑰。
目前僅支持 Chrome 瀏覽器。
使用 LLM 會產生一定的費用。
需要用戶學習如何更有效地表達指令。
項目鏈接
https://github.com/parsaghaffari/browserbee