
GO-1大模型
GO-1大模型簡介
GO-1是什么?
Genie Operator-1(GO-1)是智元啟元大模型是智元機器人于2025年3月10日發布的中國首個通用具身基座模型。GO-1模型開創性地提出了Vision-Language-Latent-Action(ViLLA)架構,由多模態大模型(VLM)和混合專家(MoE)組成。
技術架構
ViLLA架構:VLM借助海量互聯網圖文數據,獲得通用場景感知和語言理解能力;MoE中的Latent Planner(隱式規劃器)通過跨本體和人類操作視頻數據,獲得通用的動作理解能力;Action Expert(動作專家)則通過百萬真機數據,實現精細的動作執行。
人類視頻學習:GO-1可以結合互聯網視頻和真實人類示范進行學習,增強對人類行為的理解。
小樣本快速泛化:能夠在極少數據甚至零樣本的情況下快速適應新場景和任務,降低了具身智能的門檻。
跨本體應用:支持部署到不同機器人本體,實現快速適配和高效落地。
持續進化:通過數據回流系統,從實際執行中不斷學習和進化。
主要特點
人類視頻學習:GO-1可以結合互聯網視頻和真實人類示范進行學習,增強對人類行為的理解,更好地為人類服務。
小樣本快速泛化:具有強大的泛化能力,能夠在極少數據甚至零樣本下泛化到新場景、新任務,降低了具身模型的使用門檻和后訓練成本。
一腦多形:作為通用機器人策略模型,GO-1能夠在不同機器人形態之間遷移,快速適配到不同本體,實現群體升智。
持續進化:搭配智元的數據回流系統,GO-1可以從實際執行遇到的問題數據中持續進化學習,越用越聰明。
實驗表現
在五種不同復雜度任務上測試GO-1,相比已有的最優模型,GO-1的平均成功率提高了32%。其中,在“Pour Water”(倒水)、“Table Bussing”(清理桌面)和“Restock Beverage”(補充飲料)任務中表現尤為突出。
應用前景
家庭場景
家務勞動:GO-1可以執行家務清潔、物品整理、廚房任務等,例如倒水、烤吐司、整理房間等。
智能助手:通過自然語言交互,幫助家庭成員完成日常任務,如拿取物品、開關電器等。
商業場景
零售服務:在零售店中,GO-1可以根據顧客需求提供個性化服務,如物品上架、貨物盤點、顧客引導等。
餐飲服務:在餐廳中,機器人可以完成送餐、清理桌面、補充飲料等任務。
工業場景
物流與分揀:模擬工業倉庫與生產線環境,執行物料分揀、包裝打包、物流搬運等任務。
生產輔助:在生產線上協助完成一些重復性或精細操作任務,如安裝、檢測等。
辦公場景
文件管理:幫助整理文件、遞送物品,提升辦公效率。
會議輔助:在會議中協助拿取物品、記錄信息等。
其他潛在場景
智元啟元大模型GO-1項目官網:https://agibot-world.com/blog/go1
GO-1論文:https://agibot-world.com/blog/agibot_go1.pdf