Vid2Avatar-Pro:從單目自然視頻中生成逼真的3D人體虛擬形象
Vid2Avatar-Pro是什么?
Vid2Avatar-Pro 是一種能夠從普通的單目自然視頻中創(chuàng)建逼真且可動畫化的3D人體虛擬形象的技術(shù)。它是 Vid2Avatar 的升級版本,通過引入通用先驗?zāi)P停║niversal Prior Model, UPM)和優(yōu)化的 3D 表示方法,提升了虛擬形象的逼真度和泛化能力。
Vid2Avatar-Pro功能特征
高逼真度與可動畫性:Vid2Avatar-Pro 能夠從普通單目視頻中生成逼真的 3D 虛擬形象,并支持復(fù)雜的動作動畫。
多視角渲染:生成的虛擬形象可以被渲染到任意視角,解決了傳統(tǒng)方法中視角受限的問題。
多樣化動作支持:虛擬形象能夠執(zhí)行多種復(fù)雜動作,如打羽毛球、打鼓、單腿跳躍等。
通用先驗?zāi)P停║PM):通過大規(guī)模多視角數(shù)據(jù)預(yù)訓(xùn)練的通用先驗?zāi)P停@著提升了對新姿態(tài)和視角的泛化能力。
Vid2Avatar-Pro應(yīng)用場景
影視制作:從普通視頻中重建演員的 3D 模型,用于特效制作。
虛擬現(xiàn)實(VR)與增強(qiáng)現(xiàn)實(AR):創(chuàng)建逼真的虛擬角色,提升沉浸感。
時尚與電商:通過視頻重建用戶 3D 模型,實現(xiàn)虛擬試衣。
體育分析:從比賽視頻中重建運動員模型,分析動作細(xì)節(jié)。
醫(yī)療康復(fù):記錄和分析患者康復(fù)過程中的動作。
Vid2Avatar-Pro 技術(shù)原理
通用先驗?zāi)P停║PM)
預(yù)訓(xùn)練階段:使用大規(guī)模多視角、動態(tài)的穿衣人類表演數(shù)據(jù)訓(xùn)練 UPM,使其能夠捕捉人類外觀和姿態(tài)的通用特征。
微調(diào)階段:在給定的單目野外視頻上,通過逆渲染技術(shù)對預(yù)訓(xùn)練的 UPM 進(jìn)行微調(diào),恢復(fù)特定人物的細(xì)節(jié)。
3D 高斯表示
使用規(guī)范前后地圖的 3D 高斯表示來構(gòu)建虛擬形象,這些地圖在不同身份之間共享。
通過正向線性混合蒙皮(LBS)和光柵化技術(shù)合成訓(xùn)練姿態(tài)/形狀參數(shù)。
自監(jiān)督場景分解
不依賴外部分割模塊,直接在 3D 中分離人體和背景。
通過兩個獨立的神經(jīng)場對人物和背景進(jìn)行參數(shù)化,解決了場景分解和表面重建任務(wù)。
優(yōu)化策略
引入由粗到細(xì)的采樣策略和新穎的目標(biāo)函數(shù),清晰地分離動態(tài)人體和靜態(tài)背景。
優(yōu)化背景模型、規(guī)范化的人體形狀和紋理以及每幀人體姿態(tài)參數(shù)。
Vid2Avatar-Pro使用方法
1. 數(shù)據(jù)準(zhǔn)備:
使用 ROMP 獲取初始 SMPL 形狀和姿勢。
使用 OpenPose 提取關(guān)鍵點。
2. 模型訓(xùn)練:
對背景模型、人體形狀紋理和姿態(tài)參數(shù)進(jìn)行聯(lián)合優(yōu)化。
使用預(yù)訓(xùn)練的 UPM 模型進(jìn)行微調(diào)。
3. 生成與渲染:
使用訓(xùn)練好的模型生成最終的 3D 虛擬形象。
通過逆渲染技術(shù)實現(xiàn)多視角渲染。
4. 動畫生成:
將虛擬形象綁定到新的動作序列,實現(xiàn)多樣化動畫。
論文鏈接:https://moygcc.github.io/vid2avatar-pro/static/CVPR2025_Vid2Avatar_Pro.pdf
項目主頁:https://moygcc.github.io/vid2avatar-pro/