Browser Operator:Opera 瀏覽器推出的一款集成在瀏覽器里的助手
什么是 Browser Operator
Browser Operator 是 Opera 瀏覽器推出的一款集成在瀏覽器里的助手,用戶能用自然語言指令讓它幫忙完成各種網(wǎng)頁瀏覽任務(wù)。
Browser Operator 的特點(diǎn)
注重隱私:不依靠屏幕截圖或視頻捕獲理解瀏覽會話,也不把用戶憑據(jù)存到云端,完全在本地設(shè)備運(yùn)行,靠 DOM 樹和瀏覽器布局?jǐn)?shù)據(jù)獲取信息。
速度快:不用像人那樣逐像素“看”屏幕或用鼠標(biāo)導(dǎo)航,多數(shù)時候能一次訪問整個頁面,不用滾動,節(jié)省完成任務(wù)的時間。
本地操作:在瀏覽器里就能運(yùn)行,不用虛擬機(jī)或云端服務(wù)器,用戶的瀏覽歷史、登錄信息和 cookie 設(shè)置等都留在本地設(shè)備,體驗(yàn)流暢又私密。
智能交互:能和網(wǎng)頁里不可見元素互動,比如自動處理彈出對話框(像 cookie 接受和驗(yàn)證對話框),方便訪問頁面內(nèi)容。
Browser Operator 的使用場景
信息收集:從網(wǎng)站收集信息,然后填充到電子表格或者文檔中。
票務(wù)預(yù)訂:在線預(yù)訂各類票務(wù)和活動。
任務(wù)管理:用戶隨時能看到 Browser Operator 的操作過程,必要時能接手任務(wù)。
在線購物:支持在線買東西、訂機(jī)票、酒店、活動門票等。用戶用自然語言描述任務(wù),像“買 10 雙 Nike 白色網(wǎng)球襪,尺碼 12”,它就能自動完成購買流程。
Browser Operator 的工作原理
Browser Operator 利用瀏覽器客戶端的本地資源理解用戶自然語言指令,再通過 Opera 的 ai Composer Engine 處理信息來完成任務(wù)。它靠 DOM 樹和瀏覽器布局?jǐn)?shù)據(jù)獲取上下文,不依賴屏幕截圖或視頻捕獲,所以操作又快又高效。
如何使用 Browser Operator
安裝最新版 Opera 瀏覽器:去 Opera 官方網(wǎng)站下載并安裝最新版本。
找到 Browser Operator:可以通過 Opera 側(cè)邊欄,打開瀏覽器后點(diǎn)擊側(cè)邊欄中的 Browser Operator 圖標(biāo);也能在瀏覽器地址欄輸入特定命令或快捷方式。
輸入指令:在 Browser Operator 的輸入框里輸入想執(zhí)行的任務(wù),比如“買 10 雙 Nike 白色網(wǎng)球襪,尺碼 12”“訂明天從北京飛三亞的經(jīng)濟(jì)艙機(jī)票”“從 Walmart 買 3 包 A4 紙”。
執(zhí)行與監(jiān)控任務(wù):Browser Operator 開始執(zhí)行任務(wù),用戶能實(shí)時看進(jìn)度。要是任務(wù)需要輸入敏感信息(像支付信息、登錄信息),它會暫停,讓用戶手動輸入。用戶在任務(wù)執(zhí)行時能隨時接手操作或者取消任務(wù)。
任務(wù)完成后續(xù)操作:任務(wù)完成后,用戶能查看詳細(xì)步驟。要是有進(jìn)一步需求,比如取消錯誤訂單,可以直接給 Browser Operator 發(fā)新指令。
Browser Operator 現(xiàn)在是即將推出功能的預(yù)覽版,預(yù)計不久后會作為 Opera AI 功能更新計劃的一部分正式上線。
Opera 的 AI 瀏覽器愿景
Opera 一直是瀏覽器創(chuàng)新的先行者,像推出標(biāo)簽頁功能、地址欄搜索、內(nèi)置 VPN 和側(cè)邊欄即時通訊等。2023 年,Opera 重新設(shè)計了旗艦瀏覽器,以 AI 為核心。從 2024 年 3 月起,通過 AI 功能更新計劃測試實(shí)驗(yàn)性 AI 功能,如本地 LLM、圖像生成和 AI 標(biāo)簽命令。現(xiàn)在,Opera 再次革新瀏覽器的角色,成為首個能為用戶執(zhí)行任務(wù)的“代理型”瀏覽器 。
相關(guān):