
Vidu
Vidu簡介
Vidu是生數科技與清華大學合作開發的Vidu視頻大模型,憑借其創新的U-ViT架構,成為國內首個達到Sora級別的視頻大模型。該模型不僅在技術上具有全球首創性,而且通過開源的UniDiffuser模型,展示了其大規模可擴展性的驗證。
Vidu 不僅能模擬真實物理世界,還具備豐富的想象力,支持多鏡頭生成和高時空一致性。Vidu 模型融合了 Diffusion 與 Transformer 技術,創新性地開發了 U-ViT 架構。能夠一鍵生成長達 16 秒、分辨率高達 1080P 的高清視頻內容。
Vidu功能特征:
模型結構:Vidu 模型融合了 Diffusion 與 Transformer 技術,創新性地開發了 U-ViT 架構。
視頻生成能力:Vidu 能夠一鍵生成長達 16 秒、分辨率高達 1080P 的高清視頻內容。
3D生成:基于簡單文字輸入,生成高質量、多樣性和創造性的圖像 圖像生成 API調用 在線體驗 基于文本或圖像輸入,生成個性化3D模型 | 基于已有3D模型,對貼圖等進行自動化編輯。
實際應用演示:在官方資料中,展示了一個視頻示例,內容是“畫室中的一艘船駛向鏡頭”,展現了船和海浪的逼真效果。
高級功能:Vidu 不僅能模擬真實物理世界,還具備豐富的想象力,支持多鏡頭生成和高時空一致性。
北京生數科技有限公司(簡稱“生數科技”)成立于2023年3月,核心團隊成員來自清華大學人工智能研究院,此外匯集了來自阿里、騰訊、字節等知名科技公司的頂尖人才,是全球范圍內領先的深度生成式算法研究團隊,擁有擴散概率模型底層創新研發能力。公司致力打造世界領先的多模態大模型,融合文本、圖像、視頻、3D等多模態信息,探索生成式ai在藝術設計、游戲制作、影視后期、內容社交等場景的商業賦能,通過AI提升人類的創造力和生產力。