Hi3DGen:從2D圖像生成高保真3D幾何模型的框架
Hi3DGen是什么?
Hi3DGen 是一種從 2D 圖像生成高保真 3D 幾何模型的框架。它通過法線圖作為中間表示,結合圖像到法線的估計器和法線到幾何的學習方法,提升生成保真度。此外,它還構建了高質量合成數據集 DetailVerse 支持訓練。實驗顯示,Hi3DGen在生成豐富幾何細節方面表現非常不錯,適用于虛擬現實、游戲開發等場景。
Hi3DGen功能特征
高保真 3D 生成:通過法線圖作為中間表示,結合先進的估計器和學習方法,能夠從 2D 圖像生成高保真、細節豐富的 3D 幾何模型。
強大的泛化能力:采用雙流訓練策略,解耦圖像的低頻和高頻模式,使得模型在不同輸入條件下都能穩定輸出高質量結果。
高效的幾何監督:通過法線正則化的潛在擴散學習方法,為 3D 幾何生成提供明確的監督信號,顯著提升生成精度。
高質量數據支持:配備 DetailVerse 合成數據集,包含復雜幾何結構和豐富細節,為模型訓練提供充足的數據支持。
Hi3DGen框架組成
圖像到法線的估計器(NiRNE):通過噪聲注入和雙流訓練,解耦圖像的低頻和高頻模式,從而實現泛化能力強、穩定且清晰的法線估計。
法線到幾何的學習方法(NoRLD):采用法線正則化的潛在擴散學習方法,在訓練過程中提供明確的 3D 幾何監督,顯著提高生成保真度。
3D 數據合成管道:構建了一個名為 DetailVerse 的高質量合成 3D 數據集,用于支持框架的訓練。
Hi3DGen技術優勢
利用法線圖作為中間表示:法線圖編碼了表面方向信息,可以有效緩解合成訓練數據與實際應用之間的域差距,并為幾何學習提供更清晰的幾何線索。
雙流訓練策略:通過解耦低頻和高頻圖像模式的學習,NiRNE 能夠在保持穩定性的同時生成更清晰的法線圖。
高質量合成數據集:DetailVerse 數據集包含復雜的幾何結構和豐富的表面細節,有助于訓練出更精確的模型。
Hi3DGen應用場景
虛擬現實(VR)與增強現實(AR):從 2D 圖像快速生成逼真的 3D 場景和物體模型。
游戲開發:用于從概念圖或現有 2D 資產快速生成游戲中的 3D 模型。
建筑設計與可視化:從建筑圖紙或照片生成 3D 建筑模型,幫助設計師快速生成設計效果。
影視特效與動畫制作:快速生成復雜的 3D 場景和道具模型,節省建模時間。
文化遺產保護:從文物照片生成高保真 3D 模型,用于數字化保存和展示。
Hi3DGen如何使用?
訪問Hi3DGen在線演示:https://huggingface.co/spaces/Stable-X/Hi3DGen
上傳單張或多張圖片
點擊”Generate Shape”按鈕,然后等待生成
使用”Export Mesh”功能導出不同格式的3D素材
項目主頁:https://stable-x.github.io/Hi3DGen/
在線演示:https://huggingface.co/spaces/Stable-X/Hi3DGen
GitHub代碼庫:https://github.com/Stable-X/Hi3DGen
論文:https://stable-x.github.io/Hi3DGen/hi3dgen_paper.pdf