首頁 > Ai資訊 > Ai產品

Wan 2.1：通義萬相推出的開源視頻生成模型

映技派于2025-02-21發布在Ai產品

通義萬相團隊推出Wan 2.1（萬相2.1）這個最新的視頻生成模型，該模型在視頻生成的多個方面有了很大的進步，像視頻質量、復雜運動呈現、物理規律模擬以及中文漢字生成等。特別是在中文內容生成方面，它是首個能夠有效控制中文文字特效生成的視頻模型，解決了之前模型在處理中文內容上的不足。

通義萬相團隊即將推出WanX 2.1.webp

Wan 2.1功能特點

復雜動作展現：Wan 2.1能穩定地呈現出各種各樣復雜的人物肢體動作，像旋轉、跳躍、翻滾這些動作都可以很好地展現出來，這讓視頻看起來更加生動真實。
物理規律還原：它可以很逼真地把現實世界里的物理規律還原出來，這樣生成的視頻就更真實，也更符合大家的預期。
高質量視頻生成：這個模型生成的視頻視覺效果更逼真，像素質量也提高了。它能讓生成的內容遵循物理規則，并且在執行復雜指令的時候更精準。
復雜運動處理：Wan 2.1在處理復雜運動場景方面特別厲害，比如花樣滑冰、游泳、跳水這些場景，它能讓動作保持協調真實，在復雜肢體動作生成方面有了很明顯的提升。
多語言支持：Wan 2.1是第一個能同時支持中英文文字特效的視頻生成模型，這在創意產業里的應用范圍就擴大了很多，像廣告、短視頻制作這些領域，不管是國內還是國際的需求都能滿足。
高效編解碼技術：它采用了自己研發的VAE（變分自編碼器）和DiT（某種深度學習架構）技術，靠著這個技術，生成無限長的1080P視頻成為了可能，而且效率和畫質都提高了。

Wan 2.1技術架構

Wan 2.1采用了自己研發的VAE（變分自編碼器）和DiT（Diffusion Transformer）架構，這讓它在時空上下文關系的建模能力上有了很大的提升。VAE會把視頻分成好多塊并且緩存中間特征，這樣就能高效地對超長1080P視頻進行編解碼，能生成無限長度的高清視頻。DiT通過時空全注意力機制和參數共享機制，讓生成質量和訓練效率都有了顯著的提高。

Wan 2.1模型還能支持無限長視頻生成，它用VAE把視頻拆分成多個部分并且緩存中間特征來實現高效編解碼，從而支持1080P長度的視頻生成。而且它的生成質量和訓練效率靠時空全注意力機制和參數共享機制得到了顯著提升，這樣生成的效果就更精細穩定。另外，用戶在設置參數的時候，可以選擇不同的預設模式，像簡單模式和專業模式，來滿足不同的創作水平和項目需求。