字節跳動OmniHuman模型已經在即夢上線內測
字節跳動上線的OmniHuman模型已經在即夢AI上線內測,該模型采用全新的多模態視頻生成技術,用戶只需輸入一張圖片和一段音頻,就可以生成非常逼真真人視頻動畫,涵蓋從面部表情到全身動作,無論是說話、唱歌、跳舞等。
OmniHuman模型的主要功能:
視頻生成:能夠將輸入的單張照片轉化為逼真的全身動態視頻,葉可讓數字人表現出講話、唱歌等多種自然動作。
多模態輸入:同時支持肖像、半身及全身等不同尺寸的圖片輸入,結合音頻內容,數據訓練效果良好,能夠生成高質量的動畫視頻。
OmniHuman模型不僅支持肖像和全身視頻生成,還對不同類型的圖片,如動漫和3D卡通等非真人圖片輸入,表現令人滿意。即夢ai相關負責人表示,盡管OmniHuman已經表現出良好的效果,但在生成影視真實級別的視頻方面仍有提升空間。OmniHuman也將將逐步開放使用,現在進行小范圍內測,并設置嚴格的安全審核機制。
OmniHuman在哪里?
登錄即夢AI,左側欄選擇視頻生成。
我正在申請內測中...但用用戶說是對口型,效果不是很好,但有些說很贊。
相關文章
字節跳動旗下扣子空間推出一鍵文本生成播客功能
2025-05-29