UniVG
UniVG簡介
百度UniVG是一種統一模式ai視頻生成系統,能夠以文本和圖像的任意組合作為輸入條件進行視頻生成。UniVG系統由百度團隊開發,解決現有視頻生成模型在處理單一任務或單一目標時的局限性。
UniVG開源地址:https://univg-baidu.github.io/

UniVG主要功能和特點:
高自由度視頻生成:使用多條件交叉注意力機制,根據輸入的圖像或文本生成與語義一致的視頻。
低自由度視頻生成:引入偏置高斯噪聲替代完全隨機的高斯噪聲,以更好地保留輸入條件的內容。
多任務處理:系統內的視頻生成模型被重新劃分為高自由度生成和低自由度生成兩類,分別適用于不同的生成任務。
擴散模型:基于擴散的視頻生成方法,在學術和工業界取得了顯著成功。
UniVG應用場景和優勢:
靈活輸入:用戶可以靈活地輸入圖像和文本條件,單獨或組合使用,滿足實際應用場景的需求。
高質量輸出:在MSR-VTT數據庫上實現了最低的FVD(Fréchet Video Distance),在人類評估中超過了當前開源方法,并與現有閉源方法Gen2相當。
多樣化任務:支持文本到視頻、圖像到視頻以及文本和圖像結合到視頻等多種視頻生成任務。
UniVG作為一個強大的工具,它通過整合文本和圖像輸入,推動了視頻生成技術向更靈活、更高質量的方向發展,為內容創作、廣告、娛樂等多個領域提供更大的推廣思路。
提交您的產品
Ai應用
Ai資訊
AI生圖
AI生視頻
開源AI應用平臺






