我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

微軟MineWorld:基于《我的世界》的實時開源交互式世界模型

MineWorld是什么?

MineWorld是微軟于2025年4月14日開源的基于《我的世界》(Minecraft)的實時交互式世界模型,其目標是為智能體構建可感知、可推理、可行動的動態環境。

微軟MineWorld:基于《我的世界》的實時開源交互式世界模型.jpg

MineWorld技術特點

  • 視覺-動作自回歸 Transformer:MineWorld 利用視覺-動作自回歸 Transformer 驅動模型,將游戲場景和動作轉化為離散的 token ID,然后通過下一個 token 預測進行訓練。

  • 并行解碼算法:開發了一種新穎的并行解碼算法,可同時預測每幀中的空間冗余 token,讓不同規模的模型每秒生成 4 至 7 幀,實現與游戲玩家的實時互動。

  • 輸入與輸出:模型以游戲場景的初始圖像和用戶選擇的動作作為輸入,生成相應的下一個場景。

  • 評估指標:提出了新的評估指標,不僅可以評估視覺質量,還可以評估生成新場景時的動作跟隨能力。

MineWorld應用

  • 具身智能研究:為具身智能研究提供了一個復雜且動態的虛擬測試平臺。

  • 強化學習訓練:可用于強化學習的訓練,幫助智能體在模擬環境中學習和適應。

  • 交互式 ai 代理測試:為交互式 AI 代理的測試提供了一個實時的、可交互的環境。

MineWorld使用方式

  • Web Demo:用戶可以通過運行特定命令啟動網頁游戲,通過本地或公共 URL 訪問。用戶可以選擇初始幀、控制相機移動,并執行游戲動作,如跳躍、移動等。

  • 本地運行:用戶也可以在本地運行模型,以復現論文中的評估結果。

微軟MineWorld:基于《我的世界》的實時開源交互式世界模型.webp

MineWorld適用范圍與限制

適用范圍:MineWorld 專門針對《我的世界》游戲領域訓練,僅適用于生成與游戲相關的場景。

限制:

  • 無法生成其他視頻領域的結果(如互聯網視頻)。

  • 生成的視頻分辨率有限,可能導致細節信息丟失。

  • 模型可能繼承訓練數據中的偏差、錯誤或遺漏。

  • 需要進一步測試和驗證,才能考慮在商業或現實場景中應用。

MineWorld安裝使用

1. 環境配置:

  • 克隆倉庫:

git clone https://github.com/microsoft/mineworld.git
cd mineworld
  • 創建并激活 Conda 環境:

conda create -n mineworld python=3.10
conda activate mineworld
pip3 install -r requirements.txt
  • 推薦使用高性能 GPU(如 A100 或 H100)進行推理。

2. 下載預訓練模型:

  • 下載預訓練模型和相關配置文件,放置在 checkpoints 文件夾中。

  • 數據結構如下:

├── checkpoints
│   ├── 300M_16f.ckpt
│   ├── 700M_16f.ckpt
│   ├── 700M_32f.ckpt
│   ├── 1200M_16f.ckpt
│   └── 1200M_32f.ckpt
│   └── vae
│       ├── config.json
│       └── vae.ckpt
├── validation
│   └── validation.zip
└── gradio_scene
├── scene.mp4
└── scene.jsonl

3. 運行 Web Demo:

  • 使用以下命令啟動 Web Demo:

python mineworld.py --scene "path/to/scene.mp4" --model_ckpt "path/to/ckpt" --config "path/to/config"
  • 訪問本地或公共 URL,通過網頁進行交互。

  • 可以選擇初始幀、控制相機移動,并執行游戲動作(如跳躍、移動等)。

4. 本地推理:

  • 使用以下命令進行本地推理:

python inference.py --data_root "/path/to/validation/dataset" --model_ckpt "path/to/ckpt" --config "path/to/config" --demo_num 1 --frames 15 --accelerate-algo 'naive' --top_p 0.8 --output_dir "path/to/output"
  • 計算評估指標:

bash scripts/setup_metrics.sh
bash scripts/compute_metrics.sh

github:https://github.com/microsoft/MineWorld

收藏
最新工具
Quick Prompt
Quick Prompt

一個專注于提示詞(Prompt)的管理和快速輸入的瀏覽器擴展插件...

FoldNFly
FoldNFly

一個專注于紙飛機折疊教程的網站,提供豐富的紙飛機設計資源、制作指...

VoiceCanvas
VoiceCanvas

一款文本轉語音工具,支持 50 多種語言,具備語音克隆功能,僅需...

Loud Fame
Loud Fame

一款AI視頻生成和編輯工具,能夠將普通視頻轉換為具有動漫風格的視...

PPT世界
PPT世界

QIJ鰭跡旗下產品,集PPT模板下載、設計教程、交流社區和定制服...

職達AI簡歷
職達AI簡歷

一個專業的 AI 簡歷優化平臺,提供簡歷&求職一站式服務...

喵記多APP
喵記多APP

快手推出的邊聊天邊記錄的AI筆記,主要功能包括管理筆記,如剪藏、...

暢圖
暢圖

一款由摹客推出的AI原生可視化工具,專為個人和團隊的創意表達、知...

Ztalk ai
Ztalk ai

一個AI驅動的會議實時語音翻譯平臺,可以與 Zoom、Googl...

Supercut
Supercut

一款屏幕錄制工具,能幫你快速錄下屏幕上的內容,錄制的視頻可以自動...

主站蜘蛛池模板: 蛟河市| 黔东| 武功县| 土默特左旗| 儋州市| 长春市| 二手房| 苏州市| 寻乌县| 渑池县| 德阳市| 全南县| 安图县| 青海省| 通化县| 南康市| 洛浦县| 大石桥市| 青铜峡市| 遂平县| 朔州市| 思茅市| 西平县| 汝南县| 定边县| 榕江县| 普洱| 云和县| 乐清市| 神农架林区| 和静县| 红原县| 凯里市| 垦利县| 屏山县| 密云县| 兴文县| 财经| 通榆县| 华容县| 高台县|