我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

ViViD:使用擴散模型的虛擬試穿視頻

ViViD:使用擴散模型的虛擬試穿視頻.jpg

ViViD,阿里巴巴開發的視頻虛擬試穿技術,可以隨意替換視頻中人物的衣服,ViViD能夠生成自然、真實的虛擬試穿視頻,可以將服裝轉移到視頻中的人物身上,同時保持視頻其余部分不變。

ViViD演示網站:https://becauseimbatman0.github.io/ViViD

ViViD論文地址:https://arxiv.org/abs/2405.11794

隨著電商的快速發展,消費者通過在線淘寶商城京東商城等電商平臺可以方便地接觸到各種類型的服裝。然而,單純依賴電商網站上的服裝圖片,消費者很難想象服裝穿在自己身上的效果,雖然通過圖片換裝的技術比較成熟了,但是視頻換裝特別在與身體動作的交互方面技術還是很少見到。

虛擬試穿視頻通過將服裝轉移到目標人物上。將基于圖像的試穿技術以逐幀方式直接應用于視頻領域會導致時間不一致的結果,而之前基于視頻的試穿解決方案只能產生低視覺質量和模糊的結果。

中國科學技術大學和阿里巴巴集團的研究團隊聯合開發的ViViD視頻虛擬試穿技術的目的就是通過合成視頻來解決這一問題,讓消費者看到衣物穿在自己身上的真實效果。這個視頻框架利用擴散模型(Diffusion Models)來實現高質量和一致性的試穿視頻。

ViViD:使用擴散模型的虛擬試穿視頻.jpg

具體來說,我們設計了服裝編碼器來提取細粒度的服裝語義特征,引導模型捕獲服裝細節并通過提出的注意特征融合機制將它們注入到目標視頻中。為了確保時空一致性,我們引入了一個輕量級的姿勢編碼器來編碼姿勢信號,使模型能夠學習服裝和人體姿勢之間的相互作用,并將分層時間模塊插入到文本到圖像的穩定擴散模型中,以獲得更加連貫和逼真的效果視頻合成。

此外,我們收集了一個新的數據集,這是迄今為止視頻虛擬試穿任務中最大、服裝類型最多樣化、分辨率最高的數據集。大量的實驗表明,我們的方法能夠產生令人滿意的視頻試戴結果。數據集、代碼和權重將公開。

收藏
最新工具
Quick Prompt
Quick Prompt

一個專注于提示詞(Prompt)的管理和快速輸入的瀏覽器擴展插件...

FoldNFly
FoldNFly

一個專注于紙飛機折疊教程的網站,提供豐富的紙飛機設計資源、制作指...

VoiceCanvas
VoiceCanvas

一款文本轉語音工具,支持 50 多種語言,具備語音克隆功能,僅需...

Loud Fame
Loud Fame

一款AI視頻生成和編輯工具,能夠將普通視頻轉換為具有動漫風格的視...

PPT世界
PPT世界

QIJ鰭跡旗下產品,集PPT模板下載、設計教程、交流社區和定制服...

職達AI簡歷
職達AI簡歷

一個專業的 AI 簡歷優化平臺,提供簡歷&求職一站式服務...

喵記多APP
喵記多APP

快手推出的邊聊天邊記錄的AI筆記,主要功能包括管理筆記,如剪藏、...

暢圖
暢圖

一款由摹客推出的AI原生可視化工具,專為個人和團隊的創意表達、知...

Ztalk ai
Ztalk ai

一個AI驅動的會議實時語音翻譯平臺,可以與 Zoom、Googl...

Supercut
Supercut

一款屏幕錄制工具,能幫你快速錄下屏幕上的內容,錄制的視頻可以自動...

主站蜘蛛池模板: 和平县| 曲松县| 方城县| 台东市| 武陟县| 盐津县| 甘孜| 吴桥县| 北票市| 牙克石市| 常德市| 岑溪市| 彰化县| 郑州市| 邛崃市| 山阳县| 梅河口市| 嵩明县| 栾川县| 东源县| 合江县| 钦州市| 城步| 遂溪县| 清新县| 隆回县| 津市市| 乌兰浩特市| 吴堡县| 弋阳县| 富蕴县| 新郑市| 深泽县| 象山县| 高碑店市| 安庆市| 夏邑县| 万载县| 监利县| 扎囊县| 庄浪县|