Amazon Nova Act:亞馬遜推出的具備操控網頁瀏覽器并自主執行簡單任務的的AI智能體
Nova Act是什么?
Nova Act是亞馬遜推出的一款具備操控網頁瀏覽器并自主執行簡單任務的的ai智能體,能夠控制網頁瀏覽器并獨立完成諸如搜索、填寫表單、完成結賬等簡單任務。它還支持詳細指令識別和復雜任務分解,幫助用戶簡化日常操作。
Nova Act功能特征
瀏覽器操控能力:Nova Act可通過分解復雜任務為原子指令(如搜索、結賬、填寫表單),并調用瀏覽器API或Playwright工具實現自動化操作,例如在線訂購沙拉、預訂餐廳或設置自動回復郵件。其內部測試顯示,在日期選擇、彈窗處理等UI交互任務中成功率超90%。
復雜任務分解:Nova Act SDK允許開發者將復雜任務分解為一系列可執行的簡單命令,例如“找出從我家到這三家商店的最便捷路線,然后在大約下午6點看電影”。
詳細指令識別:它能夠識別更詳細的指令,比如在購物時拒絕接受保險推銷。
多模態交互架構:依托自研的Nova基礎模型(如Nova Micro/Lite/Pro)解析網頁內容,結合ScreenSpot Web Text 94%的高分能力模擬人類操作邏輯,實現視覺識別、行為模擬與流程控制的閉環。
性能表現
在亞馬遜內部的ScreenSpot Web Text測試中,Nova Act得分為94%,優于OpenAI的CUA(88%)和Anthropic的Claude 3.7 Sonnet(90%)。不過,亞馬遜并未使用更常見的代理評估基準(如WebVoyager)對其進行測試,其性能對比仍需更多外部驗證。
Nova Act應用場景
購物助手:Nova Act可以幫助用戶完成在線購物,例如從Sweetgreen訂購沙拉、進行晚餐預訂等。
行程規劃:它可以協助用戶規劃行程,如找到從家到多個地點的最佳路線,并安排看電影等后續活動。
表單填寫:Nova Act能夠自動填寫各種在線表單。
日程安排:它還可以在日歷上選擇日期,幫助用戶安排日程。
信息查詢:Nova Act可以根據用戶指令,搜索并回答屏幕上顯示的內容相關問題。
與Alexa+集成:Nova Act還將為亞馬遜即將推出的Alexa+升級提供支持,這是對亞馬遜流行的語音助手的生成式AI增強版本。
Nova Act由亞馬遜新成立的舊金山AGI(人工通用智能)實驗室開發,Amazon Nova Act是該實驗室的首款公開產品。
詳細介紹:https://labs.amazon.science/blog/nova-act
官網:https://nova.amazon.com/