我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

UNO:字節跳動開發的一個多主體條件圖像生成模型

UNO是什么?

UNO是由字節跳動研究團隊開發的多主體條件圖像生成模型,通過擴散變換器的上下文生成能力,生成高一致性的多主體配對數據。

UNO核心特點

  • 多圖像條件生成:支持單主體和多主體驅動的圖像生成,能夠根據一張或多張參考圖像生成新的圖像。

  • 漸進式跨模態對齊:通過逐步對齊不同模態(如文本和圖像)來提高生成一致性,分為兩個階段。第一階段使用單主體上下文生成數據來微調預訓練的文本到圖像模型,使其成為一個主體到圖像模型;第二階段繼續在生成的多主體數據對上進行訓練。

  • 通用旋轉位置嵌入:支持多種分辨率和長寬比的圖像生成,能夠有效緩解在擴展視覺主體控制時出現的屬性混淆問題。

UNO核心特點.webp

UNO關鍵機制:

  • 漸進式跨模態對齊(Progressive Cross-Modal Alignment):分為兩個階段。第一階段使用單主體上下文生成的數據微調預訓練的文本到圖像模型,使其成為一個主體到圖像模型;第二階段繼續在生成的多主體數據對上進行訓練。

  • 通用旋轉位置嵌入(Universal Rotary Position Embedding,UnoPE):能夠有效緩解在擴展視覺主體控制時出現的屬性混淆問題,支持多種分辨率和長寬比的圖像生成。

UNO工作原理

UNO利用擴散變換器的上下文生成能力,生成高一致性的多主體配對數據。它從一個文本到圖像模型迭代訓練而來,通過其獨特的漸進式跨模態對齊和通用旋轉位置嵌入等機制,實現了在單主體和多主體驅動生成中既能保持高一致性又能確保可控性。

UNO工作原理.jpg

UNO應用場景

  • 單主體生成:根據一張參考圖像生成圖像,例如可以根據一張時鐘的圖片生成一個時鐘在海灘上的圖像。

  • 多主體生成:根據多張參考圖像生成圖像,比如將一個玩偶的圖片和水晶球的圖片作為參考,生成玩偶在水晶球中的圖像。

  • 上下文生成:通過上下文提示生成高一致性的圖像,比如給出“一個帶有紅色太陽傘的海灘上的時鐘”這樣的提示,結合時鐘的參考圖像,生成符合描述的圖像。

UNO使用方法

環境配置:

  • 創建虛擬環境并安裝依賴:

python -m venv uno_env
source uno_env/bin/activate
pip install -r requirements.txt
  • 下載模型權重:自動下載(運行推理腳本時代碼自動下載),或手動使用huggingface-cli下載權重到指定目錄。

推理示例:運行以下命令生成圖像:

python inference.py --prompt "A clock on the beach is under a red sun umbrella" --image_paths "assets/clock.png" --width 704 --height 704

訓練:運行訓練腳本:

accelerate launch train.py

相關鏈接

項目主頁:https://bytedance.github.io/UNO

GitHub倉庫:https://github.com/bytedance/UNO 

arXiv論文:https://arxiv.org/abs/2504.02160

演示:https://huggingface.co/spaces/bytedance-research/UNO-FLUX

收藏
最新工具
Quick Prompt
Quick Prompt

一個專注于提示詞(Prompt)的管理和快速輸入的瀏覽器擴展插件...

FoldNFly
FoldNFly

一個專注于紙飛機折疊教程的網站,提供豐富的紙飛機設計資源、制作指...

VoiceCanvas
VoiceCanvas

一款文本轉語音工具,支持 50 多種語言,具備語音克隆功能,僅需...

Loud Fame
Loud Fame

一款AI視頻生成和編輯工具,能夠將普通視頻轉換為具有動漫風格的視...

PPT世界
PPT世界

QIJ鰭跡旗下產品,集PPT模板下載、設計教程、交流社區和定制服...

職達AI簡歷
職達AI簡歷

一個專業的 AI 簡歷優化平臺,提供簡歷&求職一站式服務...

喵記多APP
喵記多APP

快手推出的邊聊天邊記錄的AI筆記,主要功能包括管理筆記,如剪藏、...

暢圖
暢圖

一款由摹客推出的AI原生可視化工具,專為個人和團隊的創意表達、知...

Ztalk ai
Ztalk ai

一個AI驅動的會議實時語音翻譯平臺,可以與 Zoom、Googl...

Supercut
Supercut

一款屏幕錄制工具,能幫你快速錄下屏幕上的內容,錄制的視頻可以自動...

主站蜘蛛池模板: 中西区| 裕民县| 崇左市| 海淀区| 仙居县| 汉源县| 凤山市| 丁青县| 蒲江县| 扶绥县| 鞍山市| 达州市| 运城市| 汉源县| 密云县| 金华市| 鹿邑县| 固阳县| 甘南县| 合作市| 宕昌县| 扶余县| 达拉特旗| 宝丰县| 玉山县| 柏乡县| 静乐县| 巴南区| 营山县| 乐昌市| 营山县| 乡宁县| 合山市| 永靖县| 闻喜县| 杭州市| 马关县| 凤冈县| 和龙市| 红原县| 安岳县|