我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

微軟MineWorld:基于《我的世界》的實時開源交互式世界模型

MineWorld是什么?

MineWorld是微軟于2025年4月14日開源的基于《我的世界》(Minecraft)的實時交互式世界模型,其目標是為智能體構建可感知、可推理、可行動的動態環境。

微軟MineWorld:基于《我的世界》的實時開源交互式世界模型.jpg

MineWorld技術特點

  • 視覺-動作自回歸 Transformer:MineWorld 利用視覺-動作自回歸 Transformer 驅動模型,將游戲場景和動作轉化為離散的 token ID,然后通過下一個 token 預測進行訓練。

  • 并行解碼算法:開發了一種新穎的并行解碼算法,可同時預測每幀中的空間冗余 token,讓不同規模的模型每秒生成 4 至 7 幀,實現與游戲玩家的實時互動。

  • 輸入與輸出:模型以游戲場景的初始圖像和用戶選擇的動作作為輸入,生成相應的下一個場景。

  • 評估指標:提出了新的評估指標,不僅可以評估視覺質量,還可以評估生成新場景時的動作跟隨能力。

MineWorld應用

  • 具身智能研究:為具身智能研究提供了一個復雜且動態的虛擬測試平臺。

  • 強化學習訓練:可用于強化學習的訓練,幫助智能體在模擬環境中學習和適應。

  • 交互式 ai 代理測試:為交互式 AI 代理的測試提供了一個實時的、可交互的環境。

MineWorld使用方式

  • Web Demo:用戶可以通過運行特定命令啟動網頁游戲,通過本地或公共 URL 訪問。用戶可以選擇初始幀、控制相機移動,并執行游戲動作,如跳躍、移動等。

  • 本地運行:用戶也可以在本地運行模型,以復現論文中的評估結果。

微軟MineWorld:基于《我的世界》的實時開源交互式世界模型.webp

MineWorld適用范圍與限制

適用范圍:MineWorld 專門針對《我的世界》游戲領域訓練,僅適用于生成與游戲相關的場景。

限制:

  • 無法生成其他視頻領域的結果(如互聯網視頻)。

  • 生成的視頻分辨率有限,可能導致細節信息丟失。

  • 模型可能繼承訓練數據中的偏差、錯誤或遺漏。

  • 需要進一步測試和驗證,才能考慮在商業或現實場景中應用。

MineWorld安裝使用

1. 環境配置:

  • 克隆倉庫:

git clone https://github.com/microsoft/mineworld.git
cd mineworld
  • 創建并激活 Conda 環境:

conda create -n mineworld python=3.10
conda activate mineworld
pip3 install -r requirements.txt
  • 推薦使用高性能 GPU(如 A100 或 H100)進行推理。

2. 下載預訓練模型:

  • 下載預訓練模型和相關配置文件,放置在 checkpoints 文件夾中。

  • 數據結構如下:

├── checkpoints
│   ├── 300M_16f.ckpt
│   ├── 700M_16f.ckpt
│   ├── 700M_32f.ckpt
│   ├── 1200M_16f.ckpt
│   └── 1200M_32f.ckpt
│   └── vae
│       ├── config.json
│       └── vae.ckpt
├── validation
│   └── validation.zip
└── gradio_scene
├── scene.mp4
└── scene.jsonl

3. 運行 Web Demo:

  • 使用以下命令啟動 Web Demo:

python mineworld.py --scene "path/to/scene.mp4" --model_ckpt "path/to/ckpt" --config "path/to/config"
  • 訪問本地或公共 URL,通過網頁進行交互。

  • 可以選擇初始幀、控制相機移動,并執行游戲動作(如跳躍、移動等)。

4. 本地推理:

  • 使用以下命令進行本地推理:

python inference.py --data_root "/path/to/validation/dataset" --model_ckpt "path/to/ckpt" --config "path/to/config" --demo_num 1 --frames 15 --accelerate-algo 'naive' --top_p 0.8 --output_dir "path/to/output"
  • 計算評估指標:

bash scripts/setup_metrics.sh
bash scripts/compute_metrics.sh

github:https://github.com/microsoft/MineWorld

收藏
最新工具
Custom Cursor
Custom Cursor

一個能讓你擁有個性化光標的網站。Custom Cursor網站有...

橙子8設計
橙子8設計

一站式AI電商圖片制作平臺,專為電商和跨境賣家服務。不用專業設計...

Sandspiel
Sandspiel

一款基于細胞自動機和實時物理的開源像素沙盤游戲,玩家可以在虛擬沙...

印象地圖
印象地圖

這是個可以幫你記住全國省市位置的測試工具。打開網站就能用,選個模...

Sandtris
Sandtris

一款把經典俄羅斯方塊和流沙物理效果結合的休閑游戲。玩家需要利用沙...

Maze Toys
Maze Toys

一個以迷宮游戲為主的網站,提供多種類型的迷宮玩法,包括Mini、...

AiPyApp
AiPyApp

一款以Python為核心的開源新人工智能體助手,結合大模型和 P...

Adobe Express
Adobe Express

Adobe推出的一站式設計工具,整合了圖像、視頻、文檔/PDF、...

Intangible AI
Intangible AI

創意行業空間智能AI平臺,通過簡潔的3D界面與空間智能技術解決A...

法大大iTerms
法大大iTerms

法大大推出的一站式法律AI工作臺,基于自研法律大模型的AI智能體...

主站蜘蛛池模板: 阳山县| 凤凰县| 苗栗市| 互助| 涞源县| 黔东| 蚌埠市| 阿拉善右旗| 河池市| 观塘区| 锦州市| 株洲市| 青田县| 舞阳县| 神池县| 江永县| 泗水县| 大邑县| 犍为县| 来宾市| 泌阳县| 林州市| 新闻| 平南县| 晴隆县| 和龙市| 锦屏县| 罗定市| 昭苏县| 大港区| 英山县| 名山县| 彰化市| 卢湾区| 云浮市| 岐山县| 榆树市| 万全县| 扎兰屯市| 富宁县| 玉田县|