
Vidu
Vidu簡介
Vidu是生數(shù)科技與清華大學(xué)合作開發(fā)的Vidu視頻大模型,憑借其創(chuàng)新的U-ViT架構(gòu),成為國內(nèi)首個達(dá)到Sora級別的視頻大模型。該模型不僅在技術(shù)上具有全球首創(chuàng)性,而且通過開源的UniDiffuser模型,展示了其大規(guī)模可擴(kuò)展性的驗證。
Vidu 不僅能模擬真實物理世界,還具備豐富的想象力,支持多鏡頭生成和高時空一致性。Vidu 模型融合了 Diffusion 與 Transformer 技術(shù),創(chuàng)新性地開發(fā)了 U-ViT 架構(gòu)。能夠一鍵生成長達(dá) 16 秒、分辨率高達(dá) 1080P 的高清視頻內(nèi)容。
Vidu功能特征:
模型結(jié)構(gòu):Vidu 模型融合了 Diffusion 與 Transformer 技術(shù),創(chuàng)新性地開發(fā)了 U-ViT 架構(gòu)。
視頻生成能力:Vidu 能夠一鍵生成長達(dá) 16 秒、分辨率高達(dá) 1080P 的高清視頻內(nèi)容。
3D生成:基于簡單文字輸入,生成高質(zhì)量、多樣性和創(chuàng)造性的圖像 圖像生成 API調(diào)用 在線體驗 基于文本或圖像輸入,生成個性化3D模型 | 基于已有3D模型,對貼圖等進(jìn)行自動化編輯。
實際應(yīng)用演示:在官方資料中,展示了一個視頻示例,內(nèi)容是“畫室中的一艘船駛向鏡頭”,展現(xiàn)了船和海浪的逼真效果。
高級功能:Vidu 不僅能模擬真實物理世界,還具備豐富的想象力,支持多鏡頭生成和高時空一致性。
北京生數(shù)科技有限公司(簡稱“生數(shù)科技”)成立于2023年3月,核心團(tuán)隊成員來自清華大學(xué)人工智能研究院,此外匯集了來自阿里、騰訊、字節(jié)等知名科技公司的頂尖人才,是全球范圍內(nèi)領(lǐng)先的深度生成式算法研究團(tuán)隊,擁有擴(kuò)散概率模型底層創(chuàng)新研發(fā)能力。公司致力打造世界領(lǐng)先的多模態(tài)大模型,融合文本、圖像、視頻、3D等多模態(tài)信息,探索生成式ai在藝術(shù)設(shè)計、游戲制作、影視后期、內(nèi)容社交等場景的商業(yè)賦能,通過AI提升人類的創(chuàng)造力和生產(chǎn)力。