BrowserBee:隱私優(yōu)先的網(wǎng)頁自動(dòng)化Chrome擴(kuò)展
BrowserBee是什么?
BrowserBee 是一款開源的 Chrome 擴(kuò)展,通過自然語言指令來控制瀏覽器,實(shí)現(xiàn)網(wǎng)頁自動(dòng)化操作。它結(jié)合了語言模型的解析能力和 Playwright 的自動(dòng)化功能,讓用戶能夠更高效地完成各種任務(wù),同時(shí)注重隱私保護(hù)。
BrowserBee功能特點(diǎn)
隱私保護(hù):BrowserBee 的操作主要在本地瀏覽器內(nèi)完成,僅與 LLM 提供商進(jìn)行通信,不涉及其他數(shù)據(jù)傳輸。
多模型支持:支持多種主流 LLM 提供商,如 Anthropic、Openai、Gemini 和 Ollama。
豐富的工具集:提供導(dǎo)航、標(biāo)簽管理、頁面交互、觀察、鼠標(biāo)和鍵盤操作等多種工具。
記憶功能:可以存儲(chǔ)并復(fù)用有用的操作序列,提高效率。
用戶審批流程:在執(zhí)行敏感操作(如購(gòu)買或發(fā)布社交媒體更新)時(shí),會(huì)要求用戶明確批準(zhǔn)。
成本跟蹤:跟蹤 LLM 的 Token 使用和費(fèi)用,幫助用戶管理成本。
BrowserBee使用場(chǎng)景
社交媒體管理:檢查通知、總結(jié)消息并幫助回復(fù)。
新聞聚合:收集并總結(jié)用戶喜愛的新聞源和博客的最新頭條。
個(gè)人助理:處理日常任務(wù),如閱讀和發(fā)送電子郵件、預(yù)訂航班等。
研究助手:收集和組織公司、職位列表、市場(chǎng)趨勢(shì)或?qū)W術(shù)論文等信息。
知識(shí)書簽和總結(jié):快速總結(jié)文章、提取關(guān)鍵信息并保存。
BrowserBee安裝與使用
安裝步驟
你可以通過以下步驟安裝 BrowserBee:
git clone https://github.com/parsaghaffari/browserbee.git cd browserbee
安裝依賴
npm install
構(gòu)建擴(kuò)展
npm run build
在 Chrome 中加載擴(kuò)展
訪問 chrome://extensions/。
啟用右上角的 “開發(fā)者模式”。
點(diǎn)擊 “加載已解壓的擴(kuò)展程序”,并選擇 dist 目錄。
BrowserBee 選項(xiàng)頁面應(yīng)該會(huì)自動(dòng)彈出,在該頁面設(shè)置你的 LLM API 密鑰(如 Anthropic、OpenAI、Gemini)或配置 Ollama。
使用方法
點(diǎn)擊 Chrome 工具欄中的 BrowserBee 圖標(biāo),或按下 Alt+Shift+B 打開側(cè)邊面板。
輸入指令,例如:“Go to Google, search for Cicero, and click the first result”。
按下回車鍵,等待 BrowserBee 完成任務(wù)。
優(yōu)勢(shì)與局限
優(yōu)勢(shì):
隱私優(yōu)先,數(shù)據(jù)不經(jīng)過第三方后端。
開源透明,用戶可以自行檢查和修改代碼。
提供多種 LLM 選項(xiàng),用戶可以根據(jù)需求選擇。
內(nèi)存功能可以提高重復(fù)任務(wù)的效率。
局限:
需要手動(dòng)安裝和配置 LLM API 密鑰。
目前僅支持 Chrome 瀏覽器。
使用 LLM 會(huì)產(chǎn)生一定的費(fèi)用。
需要用戶學(xué)習(xí)如何更有效地表達(dá)指令。
項(xiàng)目鏈接
https://github.com/parsaghaffari/browserbee