MoCha:Meta推出的首個能實現電影級說話角色生成的DiT模型
MoCha是什么?
MoCha 是由 Meta 和多倫多大學聯合開發的一個 ai 模型,能夠根據語音或文本輸入生成帶有完整人物形象的高質量角色動畫視頻,生成動作連貫流暢,支持多角色對話,是首個能實現電影級對話角色生成的DiT模型。
MoCha功能特點
語音驅動的角色動畫生成:用戶輸入語音,MoCha 可以生成與語音內容同步的角色嘴型、面部表情、手勢及身體動作。
文本驅動的角色動畫生成:用戶僅輸入文本腳本,MoCha 會先自動合成語音,再驅動角色進行完整的口型和動作表現。
多角色輪番對話生成:MoCha 提供結構化提示模板與角色標簽,能自動識別對話輪次,并實現角色間“你來我往”的自然對話呈現。
支持多種應用場景:包括虛擬主播、動畫影視創作、教育內容創作、數字人客服和數字遺產等。
MoCha優勢
生成內容接近電影級:與傳統的“Talking Head”技術不同,MoCha 能夠生成全身動畫,讓角色動作更加自然。
降低創作門檻:無需動捕設備和 3D 建模經驗,降低了內容創作的門檻。
MoCha應用:
虛擬主播:自動生成日常 Vlog、角色問答
動畫影視創作:AI 自動配音 + 自動動畫,降低制作成本
教育內容創作:AI 老師角色講課或互動
數字人客服:擬人化企業客服、咨詢角色
數字遺產:為歷史人物或故人打造動態影像
相關鏈接
項目主頁: https:// congwei1230.github.io/MoCha/
論文: https:// arxiv.org/pdf/2503.23307
相關文章
OpenManus:開源版Manus,無需邀請碼
2025-03-07