Whisk:Google推出的新的“以圖生圖”圖像生成工具
Google推出了一款名為Whisk的全新ai圖像生成工具,這個(gè)工具使用戶不需要提示詞,只需提供圖像即可幫你混合出各種風(fēng)格的圖像。不需要使用傳統(tǒng)的文本提示。Whisk由Google Labs開發(fā),結(jié)合了Gemini和Imagen 3模型,能快速將多張照片的風(fēng)格組合成新的風(fēng)格圖像輸出,生成成新的圖片。
比如我們提供一張人物的、一張場景的和一個(gè)風(fēng)格的圖片,它就能把人物和場景風(fēng)格自由組合在一起,生成這種風(fēng)格的新場景人物照片。
Whisk體驗(yàn)地址:https://labs.google/fx/tools/whisk/unsupported-country
Whisk的主要功能和特點(diǎn):
以圖生圖功能:Whisk的最大亮點(diǎn)在于它允許用戶直接上傳圖像,生成新的圖像,而不需要書寫復(fù)雜的文本提示。
多圖上傳與風(fēng)格融合:用戶可以上傳多張圖片來定義生成圖像的主題、場景和藝術(shù)風(fēng)格。這種多維度的輸入方式允許用戶將各類元素融合在一起,創(chuàng)造出新的圖像作品。
采用先進(jìn)的AI模型:Whisk利用了Google的Gemini和Imagen 3模型,這些模型增強(qiáng)了圖像生成的質(zhì)量和速度,使得生成的圖像更加細(xì)膩和富有創(chuàng)意。
自動(dòng)生成的文字提示:在生成新的圖像后,Whisk還能夠自動(dòng)生成與之相關(guān)的文字提示。
Whisk還支持用戶在創(chuàng)作過程中直接生成圖像并進(jìn)行快速修改。這意味著用戶不僅可以上傳圖像,還可以通過添加描述性的文本來調(diào)整生成的圖像,這一點(diǎn)增加了創(chuàng)作的靈活性和多樣性。
此外,谷歌明確指出,Whisk其目的是快速的視覺探索,而非精細(xì)編輯。因此,生成的圖像可能有時(shí)不盡如人意,這也是谷歌提供用戶編輯底層提示以優(yōu)化結(jié)果的原因之一。
Whisk已開放在更多國家使用,現(xiàn)在可以在超過 100 個(gè)國家使用,Whisk之前僅在美國地區(qū)提供試用,其他地區(qū)的用戶可以等等。