Browser Operator:Opera 瀏覽器推出的一款集成在瀏覽器里的助手
什么是 Browser Operator
Browser Operator 是 Opera 瀏覽器推出的一款集成在瀏覽器里的助手,用戶能用自然語言指令讓它幫忙完成各種網頁瀏覽任務。
Browser Operator 的特點
注重隱私:不依靠屏幕截圖或視頻捕獲理解瀏覽會話,也不把用戶憑據存到云端,完全在本地設備運行,靠 DOM 樹和瀏覽器布局數據獲取信息。
速度快:不用像人那樣逐像素“看”屏幕或用鼠標導航,多數時候能一次訪問整個頁面,不用滾動,節省完成任務的時間。
本地操作:在瀏覽器里就能運行,不用虛擬機或云端服務器,用戶的瀏覽歷史、登錄信息和 cookie 設置等都留在本地設備,體驗流暢又私密。
智能交互:能和網頁里不可見元素互動,比如自動處理彈出對話框(像 cookie 接受和驗證對話框),方便訪問頁面內容。
Browser Operator 的使用場景
信息收集:從網站收集信息,然后填充到電子表格或者文檔中。
票務預訂:在線預訂各類票務和活動。
任務管理:用戶隨時能看到 Browser Operator 的操作過程,必要時能接手任務。
在線購物:支持在線買東西、訂機票、酒店、活動門票等。用戶用自然語言描述任務,像“買 10 雙 Nike 白色網球襪,尺碼 12”,它就能自動完成購買流程。
Browser Operator 的工作原理
Browser Operator 利用瀏覽器客戶端的本地資源理解用戶自然語言指令,再通過 Opera 的 ai Composer Engine 處理信息來完成任務。它靠 DOM 樹和瀏覽器布局數據獲取上下文,不依賴屏幕截圖或視頻捕獲,所以操作又快又高效。
如何使用 Browser Operator
安裝最新版 Opera 瀏覽器:去 Opera 官方網站下載并安裝最新版本。
找到 Browser Operator:可以通過 Opera 側邊欄,打開瀏覽器后點擊側邊欄中的 Browser Operator 圖標;也能在瀏覽器地址欄輸入特定命令或快捷方式。
輸入指令:在 Browser Operator 的輸入框里輸入想執行的任務,比如“買 10 雙 Nike 白色網球襪,尺碼 12”“訂明天從北京飛三亞的經濟艙機票”“從 Walmart 買 3 包 A4 紙”。
執行與監控任務:Browser Operator 開始執行任務,用戶能實時看進度。要是任務需要輸入敏感信息(像支付信息、登錄信息),它會暫停,讓用戶手動輸入。用戶在任務執行時能隨時接手操作或者取消任務。
任務完成后續操作:任務完成后,用戶能查看詳細步驟。要是有進一步需求,比如取消錯誤訂單,可以直接給 Browser Operator 發新指令。
Browser Operator 現在是即將推出功能的預覽版,預計不久后會作為 Opera AI 功能更新計劃的一部分正式上線。
Opera 的 AI 瀏覽器愿景
Opera 一直是瀏覽器創新的先行者,像推出標簽頁功能、地址欄搜索、內置 VPN 和側邊欄即時通訊等。2023 年,Opera 重新設計了旗艦瀏覽器,以 AI 為核心。從 2024 年 3 月起,通過 AI 功能更新計劃測試實驗性 AI 功能,如本地 LLM、圖像生成和 AI 標簽命令。現在,Opera 再次革新瀏覽器的角色,成為首個能為用戶執行任務的“代理型”瀏覽器 。
相關:
相關文章
- 用戶登錄