Piece it Together(PiT):將部分組件整合到一個(gè)完整的概念中,并生成缺失的部分。
Piece it Together(PiT)是什么?
Piece it Together(PiT)是由特拉維夫大學(xué)和Bria ai的研究人員開發(fā)的一種視覺概念生成框架 。它能夠?qū)⒂脩籼峁┑牟糠忠曈X組件無縫集成到一個(gè)連貫的整體概念中,并同時(shí)生成缺失的部分,從而生成一個(gè)完整且合理的概念,也就是說,你只需要隨機(jī)輸入幾個(gè)圖像,比如一張翅膀、一撮頭發(fā)、一只眼睛,它就能自動(dòng)幫你生成一幅完整圖像。這種方法特別適用于創(chuàng)意設(shè)計(jì)領(lǐng)域,例如角色設(shè)計(jì)、產(chǎn)品設(shè)計(jì)和玩具設(shè)計(jì)等。
PiT功能特征
部分到整體的生成:將用戶提供的部分視覺組件(如物體的某個(gè)部分、草圖等)整合成一個(gè)完整的概念。
缺失部分的補(bǔ)全:自動(dòng)推斷并生成缺失的部分,使最終生成的概念在目標(biāo)領(lǐng)域內(nèi)合理且完整。
語義操作:在生成的概念上進(jìn)行語義編輯和操作,例如調(diào)整角色的風(fēng)格、情緒等。
文本條件的恢復(fù):通過IP-LoRA技術(shù),恢復(fù)生成概念的文本條件控制能力,使生成的圖像能夠更好地適應(yīng)不同的場(chǎng)景或風(fēng)格。
基于IP+空間的表示:使用IP-Adapter+的內(nèi)部表示空間,相比CLIP空間,能夠更好地保留視覺細(xì)節(jié),同時(shí)支持語義操作。
輕量級(jí)流匹配模型:通過訓(xùn)練一個(gè)輕量級(jí)的流匹配模型(IP-Prior),能夠基于特定領(lǐng)域的先驗(yàn)知識(shí)生成連貫的組合。
靈活的輸入形式:支持多種輸入形式,包括圖像片段、草圖等,為用戶提供更大的靈活性。
多樣的輸出結(jié)果:對(duì)于相同的輸入,模型可以生成多種合理的輸出,幫助設(shè)計(jì)師探索不同的創(chuàng)意方向。
PiT應(yīng)用場(chǎng)景
角色設(shè)計(jì):設(shè)計(jì)師可以輸入角色的部分特征(如翅膀、眼睛等),模型生成完整的角色設(shè)計(jì),并支持進(jìn)一步的語義編輯,如調(diào)整角色的情緒或風(fēng)格。
產(chǎn)品設(shè)計(jì):輸入產(chǎn)品的部分設(shè)計(jì)元素(如形狀、材質(zhì)等),模型生成完整的產(chǎn)品設(shè)計(jì),并支持風(fēng)格調(diào)整。
玩具概念化:輸入玩具的部分特征(如動(dòng)物的頭部、服裝等),模型生成完整的玩具設(shè)計(jì)。
創(chuàng)意繪畫:輸入草圖或部分繪畫元素,模型生成完整的繪畫作品,并支持風(fēng)格調(diào)整。
PiT使用方法
準(zhǔn)備輸入:用戶需要準(zhǔn)備一些視覺組件,如圖像片段、草圖等,這些組件可以是概念的一部分。
輸入模型:將這些組件輸入到PiT模型中。
生成概念:模型會(huì)自動(dòng)整合這些組件,并生成一個(gè)完整的概念,同時(shí)補(bǔ)全缺失的部分。
語義編輯(可選):用戶可以在生成的概念上進(jìn)行語義編輯,如調(diào)整風(fēng)格或情緒。
文本條件控制(可選):通過IP-LoRA技術(shù),用戶可以為生成的概念添加文本條件,以適應(yīng)不同的場(chǎng)景或風(fēng)格。
項(xiàng)目地址:https://eladrich.github.io/PiT/
論文:https://arxiv.org/html/2503.10365v1