Vidu

中國(guó)首個(gè)長(zhǎng)時(shí)長(zhǎng)、高一致性、高動(dòng)態(tài)性視頻大模型，能夠一鍵生成長(zhǎng)達(dá) 16 秒、分辨率高達(dá) 1080P 的高清視頻內(nèi)容。

#Ai工具箱 #Ai視頻生成

Vidu簡(jiǎn)介

Vidu是生數(shù)科技與清華大學(xué)合作開發(fā)的Vidu視頻大模型，憑借其創(chuàng)新的U-ViT架構(gòu)，成為國(guó)內(nèi)首個(gè)達(dá)到Sora級(jí)別的視頻大模型。該模型不僅在技術(shù)上具有全球首創(chuàng)性，而且通過開源的UniDiffuser模型，展示了其大規(guī)模可擴(kuò)展性的驗(yàn)證。

Vidu 不僅能模擬真實(shí)物理世界，還具備豐富的想象力，支持多鏡頭生成和高時(shí)空一致性。Vidu 模型融合了 Diffusion 與 Transformer 技術(shù)，創(chuàng)新性地開發(fā)了 U-ViT 架構(gòu)。能夠一鍵生成長(zhǎng)達(dá) 16 秒、分辨率高達(dá) 1080P 的高清視頻內(nèi)容。

生數(shù)科技 - www.shengshu-ai.com.jpg

Vidu功能特征：

模型結(jié)構(gòu)：Vidu 模型融合了 Diffusion 與 Transformer 技術(shù)，創(chuàng)新性地開發(fā)了 U-ViT 架構(gòu)。
視頻生成能力：Vidu 能夠一鍵生成長(zhǎng)達(dá) 16 秒、分辨率高達(dá) 1080P 的高清視頻內(nèi)容。
3D生成：基于簡(jiǎn)單文字輸入，生成高質(zhì)量、多樣性和創(chuàng)造性的圖像圖像生成 API調(diào)用在線體驗(yàn) 基于文本或圖像輸入，生成個(gè)性化3D模型 | 基于已有3D模型，對(duì)貼圖等進(jìn)行自動(dòng)化編輯。
實(shí)際應(yīng)用演示：在官方資料中，展示了一個(gè)視頻示例，內(nèi)容是“畫室中的一艘船駛向鏡頭”，展現(xiàn)了船和海浪的逼真效果。
高級(jí)功能：Vidu 不僅能模擬真實(shí)物理世界，還具備豐富的想象力，支持多鏡頭生成和高時(shí)空一致性。

北京生數(shù)科技有限公司（簡(jiǎn)稱“生數(shù)科技”）成立于2023年3月，核心團(tuán)隊(duì)成員來自清華大學(xué)人工智能研究院，此外匯集了來自阿里、騰訊、字節(jié)等知名科技公司的頂尖人才，是全球范圍內(nèi)領(lǐng)先的深度生成式算法研究團(tuán)隊(duì)，擁有擴(kuò)散概率模型底層創(chuàng)新研發(fā)能力。公司致力打造世界領(lǐng)先的多模態(tài)大模型，融合文本、圖像、視頻、3D等多模態(tài)信息，探索生成式ai在藝術(shù)設(shè)計(jì)、游戲制作、影視后期、內(nèi)容社交等場(chǎng)景的商業(yè)賦能，通過AI提升人類的創(chuàng)造力和生產(chǎn)力。

百度曦靈數(shù)字人平臺(tái)

星火繪鏡