我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

Matrix-Game:昆侖萬維正式開源的17B+交互式世界基礎(chǔ)模型

Matrix-Game是什么?

Matrix-Game是昆侖萬維在2025年5月13日正式開源的17B+交互式世界基礎(chǔ)模型,也是工業(yè)界首個開源的10B+空間智能大模型。

screenshot (8).webp

Matrix-Game核心特點

  • 交互式世界生成:Matrix-Game是一個面向游戲世界建模的交互式世界基礎(chǔ)模型,用戶可以通過簡單的鍵盤指令、鼠標(biāo)移動等操作,自由探索、操控甚至創(chuàng)造出細(xì)節(jié)豐富、物理規(guī)則合理的虛擬世界。

  • 高精度控制:在控制性能上,Matrix-Game可實現(xiàn)“運動”“攻擊”等動作高達(dá)90%+準(zhǔn)確率,在細(xì)粒度視角控制下依然保持高精度響應(yīng)。

  • 多場景泛化能力:Matrix-Game在8大典型Minecraft場景中全面領(lǐng)先,展現(xiàn)出卓越的環(huán)境適應(yīng)性與泛化能力,有潛力泛化到非Minecraft游戲環(huán)境。

  • 自回歸式長視頻生成:支持自回歸式的長視頻生成,實現(xiàn)動作與視角之間的絲滑銜接,確保時間一致性與環(huán)境適應(yīng)性。

  • 系統(tǒng)化評估:提出了統(tǒng)一的GameWorldScore標(biāo)準(zhǔn),從視頻的視覺質(zhì)量、時序質(zhì)量、動作可控性與物理規(guī)則理解四個維度全面量化模型性能。

核心組成部分

  • Matrix-Game-MC數(shù)據(jù)集:自主構(gòu)建的大規(guī)模交互世界數(shù)據(jù)集,包含大規(guī)模無標(biāo)簽的Minecraft游戲視頻和帶有鍵盤與鼠標(biāo)控制信號的Minecraft與Unreal可控視頻數(shù)據(jù),具備精細(xì)的動作注釋。

  • Matrix-Game主模型:基于先進(jìn)的擴(kuò)散模型技術(shù),構(gòu)建了一個從圖像到世界的生成框架,能夠根據(jù)用戶的輸入生成連貫且可控的互動視頻。

  • GameWorldScore評測體系:從視頻的視覺質(zhì)量、時序質(zhì)量、動作可控性和物理規(guī)則理解四個維度全面量化模型性能,填補(bǔ)了該領(lǐng)域缺乏系統(tǒng)性評測基準(zhǔn)的空白。

Matrix-Game技術(shù)原理

  • 兩階段訓(xùn)練策略:第一階段利用大規(guī)模無標(biāo)簽的Minecraft游戲視頻數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,讓模型學(xué)習(xí)環(huán)境的基本特征和動態(tài)規(guī)律;第二階段用帶有鍵盤與鼠標(biāo)控制信號的Minecraft與Unreal可控視頻數(shù)據(jù)進(jìn)行細(xì)粒度的可控訓(xùn)練,讓模型根據(jù)用戶的輸入生成相應(yīng)的交互式視頻。

  • 圖像到世界建模:以單張參考圖像作為生成交互式視頻的起點,不依賴語言提示,基于視覺信號建模空間幾何、物體運動及其物理交互。

  • 自回歸式視頻生成:支持自回歸方式擴(kuò)展生成長度,每次用前一視頻片段的最后幾幀作為運動上下文,逐段遞進(jìn)生成,確保時間上的連貫性。訓(xùn)練中引入隨機(jī)擾動、隨機(jī)刪除及Classifier-freeguidance策略,緩解時序漂移和誤差累積。

  • 可控交互設(shè)計:鍵盤動作用離散token表達(dá),視角移動動作用連續(xù)token表達(dá),基于GameFactory的控制模塊,融入多模態(tài)DiffusionTransformer架構(gòu),用Classifier-freeguidance策略提升對控制信號的魯棒響應(yīng)能力。

Matrix-Game技術(shù)原理.jpg

Matrix-Game應(yīng)用場景

  • 虛擬游戲世界快速搭建:通過模型的可控生成能力,可低成本、高效率地創(chuàng)建多樣化、結(jié)構(gòu)合理的游戲地圖與交互環(huán)境,提升關(guān)卡設(shè)計與任務(wù)構(gòu)建的自由度。

  • 影視與元宇宙內(nèi)容生產(chǎn):支持高保真、物理一致的動態(tài)場景合成,為沉浸式體驗開發(fā)與創(chuàng)意內(nèi)容生成提供通用世界建?;A(chǔ)。

  • 具身智能體訓(xùn)練與數(shù)據(jù)生成:盡管當(dāng)前模型未直接用于具身智能,但Matrix-Game具備生成大規(guī)模交互視頻的能力,具備擴(kuò)展至具身智能體訓(xùn)練與評估的潛力,可以為智能體創(chuàng)建多樣復(fù)雜的虛擬環(huán)境,幫助助其任務(wù)執(zhí)行與推理能力的提升。

Matrix-Game模型優(yōu)勢

  • 細(xì)粒度用戶交互控制:支持多種細(xì)節(jié)操作,能根據(jù)用戶輸入準(zhǔn)確自然地響應(yīng)。

  • 高保真視覺與物理一致性:生成結(jié)果視覺連貫且遵循物理規(guī)律。

  • 多場景泛化能力:對多種 Minecraft 游戲場景有泛化能力,且有向非 Minecraft 游戲環(huán)境泛化的潛力。

  • 系統(tǒng)化評估體系:GameWorld Score 標(biāo)準(zhǔn)為模型的客觀評估與持續(xù)優(yōu)化提供有力支撐。

項目鏈接

項目官網(wǎng):https://matrix-game-homepage.github.io/

GitHub倉庫:https://github.com/Skyworkai/Matrix-Game

HuggingFace模型庫:https://huggingface.co/Skywork/Matrix-Game

技術(shù)論文:https://github.com/SkyworkAI/Matrix-Game/blob/main/assets/report.pdf

收藏
最新工具
Thea AI
Thea AI

一個專門為學(xué)生設(shè)計的AI學(xué)習(xí)平臺。它能自動把課堂筆記、PDF文件...

Pose Search
Pose Search

一個開源的人體姿勢搜索工具,允許用戶根據(jù)性別、關(guān)節(jié)或身體部位來篩...

Linnk AI
Linnk AI

面向研究人員和專業(yè)人士的工具,能在網(wǎng)頁、PDF 及多種文檔里快速...

Mentimeter
Mentimeter

一個讓傳統(tǒng)演示變得更有趣、更互動的工具。它特別適合用在教育、企業(yè)...

落筆AI寫作
落筆AI寫作

一個專為故事創(chuàng)作者設(shè)計的Ai小說寫作輔助工具,最大特點是把“找靈...

靈光APP
靈光APP

螞蟻集團(tuán)推出的全模態(tài)AI助手,它能理解和生成語言、圖像、語音與數(shù)...

Moakt Email
Moakt Email

一個能提供臨時郵箱服務(wù)的平臺,不用注冊就能快速弄出一個一次性的郵...

JOJO看報
JOJO看報

一個能在線看老報紙和雜志的網(wǎng)站,有《人民日報》《參考消息》《紅旗...

超級表格
超級表格

一款多人共享的在線表格工具,結(jié)合表格與表單功能,支持多人同時查看...

蘿卜簡歷
蘿卜簡歷

一個免費在線簡歷制作工具,用AI幫應(yīng)屆生和求職者寫更貼合崗位的簡...

主站蜘蛛池模板: 桓台县| 姜堰市| 芮城县| 军事| 岑溪市| 靖边县| 镇远县| 滨海县| 东源县| 霸州市| 泰顺县| 定安县| 惠水县| 明星| 富民县| 十堰市| 千阳县| 鄢陵县| 德保县| 太白县| 开封县| 荥阳市| 金华市| 扎兰屯市| 墨竹工卡县| 牡丹江市| 分宜县| 措美县| 虎林市| 宁远县| 甘肃省| 普宁市| 普兰县| 泸州市| 游戏| 慈溪市| 辉南县| 遵义市| 平度市| 大化| 高雄县|