我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

CreatiDesign模型:用于創意平面設計的統一多條件擴散變換器

CreatiDesign 是復旦大學和字節跳動團隊合作開發的一款高精度、多模態、可編輯的圖形設計生成模型。它能夠高精度地生成圖形設計,同時處理多種元素,包括主視覺元素、輔助裝飾和文本內容,解決了傳統方法在多條件輸入時的不足。通過精細解耦和獨立控制,CreatiDesign 讓設計更加可控、一致。

這個模型采用創新的多模態注意力機制,還能自動合成數據,因此在多個評估標準上都超過了現有的頂尖水平。它不僅提高了設計效率,還讓用戶可以在已有設計的基礎上靈活修改,比如添加新元素或調整文本,同時保持整體設計的協調和完整。

CreatiDesign模型:用于創意平面設計的統一多條件擴散變換器.webp

模型架構

CreatiDesign 采用 MM-DiT(多模態擴散變換器)框架,通過簡化架構實現了多種不同條件的協同控制。主要特點如下:

  • 多主體圖像條件:用戶可以輸入多個主視覺元素(如產品圖、LOGO等),并自由擺放。這些元素經過編碼器處理后生成主視覺token,用于后續生成。

  • 語義布局條件:輔助元素或文本的語義描述通過T5文本編碼器轉換為語義特征token,空間位置信息經傅立葉變換后與語義特征拼接,形成布局token。

  • 全局描述:用戶還可以輸入整體描述,由T5編碼為全局描述token,用于指導整體內容和風格。

  • 多模態注意力機制:在每一層Transformer中,采用多模態注意力(MM-Attention)機制,使不同模態的token深度融合,實現多條件的聯合建模和控制。

獨立可控性

CreatiDesign 提出了兩種專屬注意力掩碼機制,增強每個條件的獨立可控性:

  • 主體注意力掩碼(Subject Attention Mask):主體token僅與指定區域內的圖像token交互,與布局token、全局描述token及無關區域的圖像token完全隔離,確保主體內容高度還原。

  • 布局注意力掩碼(Layout Attention Mask):每個布局token僅與指定區域內的圖像token交互,防止布局元素之間語義串擾。

數據集

CreatiDesign 構建了包含40萬樣本的大規模多條件標注數據集,滿足實際設計需求。此外,還提出了全自動平面設計數據合成流程,包括主題生成、文本圖層渲染和基于前景的圖像生成。

應用場景

CreatiDesign 可以生成各種平面設計圖,如電影海報、品牌促銷、產品廣告和社交媒體圖。它還支持多輪編輯,用戶可以在已有設計結果上靈活插入新文本或主體,或修改文本內容,模型能夠精準編輯指定區域,同時保持非編輯區域的內容不變。

優勢

相比以往的可控擴散模型,CreatiDesign 在多條件異質信息統一建模、多條件精細解耦與區域獨立控制以及大規模高質量數據支持等方面表現出色。它解決了以往模型在處理圖形設計時存在的“偏科”或缺乏精準可控性的問題。

項目鏈接

技術論文:https://arxiv.org/pdf/2505.19114

項目主頁:https://huizhang0812.github.io/CreatiDesign/

Github:https://github.com/HuiZhang0812/CreatiDesign

HuggingFace:https://huggingface.co/datasets/HuiZhang0812/CreatiDesign_dataset


收藏
最新工具
unDraw
unDraw

美國設計師Katerina Limpitsouni創作的開源插畫...

Storyset
Storyset

一個由知名素材平臺Freepik公司旗下的免費在線自定義矢量插畫...

Jigsaw Planet
Jigsaw Planet

一個數百萬免費在線拼圖平臺,用戶能直接通過瀏覽器創建、游玩和分享...

GeoFS
GeoFS

一款免費的網頁版多人飛行模擬器網站,只要瀏覽器就可以運行,不需要...

Avido AI
Avido AI

通過 AI 技術幫用戶生成適合 YouTube 和 TikTok...

表答AI
表答AI

一款能抓取網頁內容并能情感分析的數據分析產品,并把采集分析過程自...

Recaster AI
Recaster AI

通過導入產品圖像或數據,生成定制的SEO內容,支持從Shopif...

ScanPDF
ScanPDF

一個能夠讓PDF看起來就像是掃描件一樣的在線免費工具。只需點擊鼠...

SkylineWebCams
SkylineWebCams

在美洲、歐洲、亞洲、非洲及大洋洲59個國家,提供全球五大洲實時高...

Ezgif
Ezgif

一個簡單、免費的在線 GIF 制作工具和基礎動畫圖像編輯工具集,...

主站蜘蛛池模板: 福海县| 满洲里市| 保德县| 嘉定区| 资中县| 江孜县| 宝丰县| 柳州市| 彭山县| 潍坊市| 青铜峡市| 蓬溪县| 乌海市| 宕昌县| 监利县| 绥芬河市| 安徽省| 扎囊县| 中西区| 阿勒泰市| 西乌珠穆沁旗| 陇川县| 南涧| 特克斯县| 咸阳市| 黔江区| 石屏县| 富民县| 和平县| 舒兰市| 武功县| 肇源县| 桑日县| 桑植县| 文安县| 恭城| 邛崃市| 孝义市| 临清市| 出国| 周口市|