騰訊Hunyuan3D-2推出的5個開源3D模型,各自特點是什么?
Hunyuan3D-2是什么?
Hunyuan3D 2是騰訊推出的j一款先進(jìn)的大規(guī)模 3D 資產(chǎn)生成系統(tǒng),能夠從文本或圖像生成高分辨率且?guī)в屑y理的 3D 模型。
Hunyuan3D-2核心功能
兩階段生成流程:采用先創(chuàng)建幾何模型,再為幾何模型合成紋理貼圖的兩階段生成方式。這種方式有效分離了形狀生成和紋理生成的難點,同時為生成的幾何模型或手工制作的幾何模型進(jìn)行紋理處理提供了靈活性。
高質(zhì)量生成:能夠創(chuàng)建逼真的 3D 模型,生成的紋理和幾何細(xì)節(jié)質(zhì)量高,超越了現(xiàn)有的開源和閉源模型。
多樣化輸出:可以生成包括物體、角色、環(huán)境等多種類型的 3D 資產(chǎn)。
快速生成:優(yōu)化了性能,能夠快速生成模型,提高工作效率。
Hunyuan3D-2開源模型特點
核心模型
Hunyuan3D-DiT-v2-0
高保真幾何生成:基于流擴(kuò)散的擴(kuò)散模型,能夠根據(jù)給定的圖像提示生成高保真度和高分辨率的無紋理幾何模型。
精確對齊:生成的幾何模型與輸入圖像精確匹配,為下游應(yīng)用奠定了堅實基礎(chǔ)。
混合網(wǎng)絡(luò)結(jié)構(gòu):采用雙流和單流的混合網(wǎng)絡(luò)結(jié)構(gòu),提升了生成效果。
參數(shù)量:模型參數(shù)量為 26 億。
Hunyuan3D-Paint-v2-0
高分辨率紋理合成:能夠為生成的幾何模型或手工制作的網(wǎng)格生成高分辨率且生動逼真的紋理貼圖。
多視圖擴(kuò)散技術(shù):結(jié)合幾何條件(如法線圖和位置圖)生成多視圖圖像,并烘焙為高分辨率紋理。
參數(shù)量:模型參數(shù)量為 13 億。
Hunyuan3D-Delight-v2-0
圖像去光影處理:將輸入圖像轉(zhuǎn)換為無光影的狀態(tài),生成光照不變的紋理貼圖。
提升紋理質(zhì)量:通過去除光影,能夠生成更高質(zhì)量的紋理,適合用于紋理生成的預(yù)處理。
參數(shù)量:模型參數(shù)量為 13 億。
擴(kuò)展模型
Hunyuan3D-DiT-v2-0-Fast
加速版本:通過指導(dǎo)蒸餾技術(shù)將推理時間縮短一半,適合對生成速度有更高要求的場景。
高效生成:在保持生成質(zhì)量的同時,顯著提升了生成速度。
Hunyuan3D-2mv
多視角形狀生成:專注于通過多視角輸入生成高質(zhì)量的 3D 幾何形狀。
適用于復(fù)雜場景:適合需要從多個角度理解場景或?qū)ο蟮?3D 創(chuàng)作。
Hunyuan3D-2mini
輕量級版本:在保留核心功能的同時,優(yōu)化了模型的大小和計算效率。
適合輕量級應(yīng)用:更適合對資源有限制的場景,如移動端或輕量級設(shè)備。
Hunyuan3D-2應(yīng)用
游戲開發(fā):能夠快速生成高質(zhì)量的 3D 游戲資產(chǎn),如角色、道具和場景。
UGC 社交與內(nèi)容創(chuàng)作:支持用戶生成內(nèi)容,用戶可以通過文本描述、圖片或草圖快速生成個性化的 3D 模型。
電商與廣告:根據(jù)商品圖片快速生成高精度的 3D 商品模型,用于線上展示和交互。
工業(yè)制造與設(shè)計:根據(jù)設(shè)計草圖或概念圖快速生成 3D 工業(yè)產(chǎn)品原型,支持多種格式,無縫對接 3D 打印工具。
教育與科研:提供開源模型和代碼,方便教育工作者和科研人員進(jìn)行教學(xué)和研究。
Hunyuan3D-2的推理代碼、模型檢查點、技術(shù)報告等均已開源。
項目官網(wǎng): https://3d-models.hunyuan.tencent.com
Github倉庫: https://github.com/Tencent/Hunyuan3D-2
HuggingFace模型庫: https://huggingface.co/tencent/Hunyuan3D-2