Wan 2.1:通義萬相推出的開源視頻生成模型
通義萬相團隊推出Wan 2.1(萬相2.1)這個最新的視頻生成模型,該模型在視頻生成的多個方面有了很大的進步,像視頻質量、復雜運動呈現、物理規律模擬以及中文漢字生成等。特別是在中文內容生成方面,它是首個能夠有效控制中文文字特效生成的視頻模型,解決了之前模型在處理中文內容上的不足。
Wan 2.1功能特點
復雜動作展現:Wan 2.1能穩定地呈現出各種各樣復雜的人物肢體動作,像旋轉、跳躍、翻滾這些動作都可以很好地展現出來,這讓視頻看起來更加生動真實。
物理規律還原:它可以很逼真地把現實世界里的物理規律還原出來,這樣生成的視頻就更真實,也更符合大家的預期。
高質量視頻生成:這個模型生成的視頻視覺效果更逼真,像素質量也提高了。它能讓生成的內容遵循物理規則,并且在執行復雜指令的時候更精準。
復雜運動處理:Wan 2.1在處理復雜運動場景方面特別厲害,比如花樣滑冰、游泳、跳水這些場景,它能讓動作保持協調真實,在復雜肢體動作生成方面有了很明顯的提升。
多語言支持:Wan 2.1是第一個能同時支持中英文文字特效的視頻生成模型,這在創意產業里的應用范圍就擴大了很多,像廣告、短視頻制作這些領域,不管是國內還是國際的需求都能滿足。
高效編解碼技術:它采用了自己研發的VAE(變分自編碼器)和DiT(某種深度學習架構)技術,靠著這個技術,生成無限長的1080P視頻成為了可能,而且效率和畫質都提高了。
Wan 2.1技術架構
Wan 2.1采用了自己研發的VAE(變分自編碼器)和DiT(Diffusion Transformer)架構,這讓它在時空上下文關系的建模能力上有了很大的提升。VAE會把視頻分成好多塊并且緩存中間特征,這樣就能高效地對超長1080P視頻進行編解碼,能生成無限長度的高清視頻。DiT通過時空全注意力機制和參數共享機制,讓生成質量和訓練效率都有了顯著的提高。
Wan 2.1模型還能支持無限長視頻生成,它用VAE把視頻拆分成多個部分并且緩存中間特征來實現高效編解碼,從而支持1080P長度的視頻生成。而且它的生成質量和訓練效率靠時空全注意力機制和參數共享機制得到了顯著提升,這樣生成的效果就更精細穩定。另外,用戶在設置參數的時候,可以選擇不同的預設模式,像簡單模式和專業模式,來滿足不同的創作水平和項目需求。
Wan 2.1應用場景
內容創作:對于視頻創作者來說,Wan 2.1是個很強大的工具,能幫助他們創作出效果更豐富的視頻。
廣告制作:在營銷和廣告方面,可以用它來制作很吸引人的宣傳視頻。
教育和培訓:在教育領域,它能通過生動的示范視頻讓學習體驗更好,提高信息傳遞的效率。
Wan 2.1使用方法
訪問平臺:訪問http://tongyi.aliyun.com/wanxiang/注冊賬號然后登錄。
選擇功能:登錄后在平左欄找到文字作畫,選擇Wan 2.1功能,這里可以看到不同的生成選項。
輸入提示詞:用戶可以輸入想要生成視頻的主題或者元素,中英文都可以輸入。
設置參數:根據自己的需求,用戶能調整生成視頻的參數,像視頻長度、特效類型、人物動作這些。
生成與預覽:提交之后系統會生成視頻,用戶可以預覽,覺得滿意了就可以下載或者分享。
演示地址:https://tongyi.aliyun.com/wanxiang/
相關文章
- 用戶登錄