
通義萬相
通義萬相簡介
通義萬相擁有的文生圖和圖生圖能力,可以輔助人類進行圖片創作,大幅降低圖片設計門檻。未來還可應用于藝術設計、游戲和文創等應用場景。通義萬相只要包括文本生成圖像、相似圖像生成和圖像風格遷移三大功能。
通義萬相是阿里云通義系列ai繪畫創作大模型,基于阿里研發的組合式生成模型Composer,它擁有 50 億參數,并在數十億個文本、圖像對上進行訓練,通過一個基于擴散模型的「組合式生成」框架,Composer 能夠對配色、布局、風格等圖像設計元素進行拆解和組合,實現了高度可控性和極大自由度的圖像生成效果。
通義萬相功能:
1、文生圖:文生圖頁面左側有一個簡潔的界面,上方有一個文本輸入框,在輸入框內可以輸入prompt。文本框下方提供8個可選的畫面風格,你可以在水彩、油畫、中國畫、扁平插畫、二次元、素描、3D 卡通等多種風格中進行選擇。在輸入文字描述并選定風格后,ai 便可自動生成創作圖片了。同時為了方便使用,輸出圖像的比例有現成的 1:1、16:9 和 9:16 三種可選。
2、相似圖生成:用戶只要提供提供一張參考圖像,可獲取內容、風格相似的 AI 畫作。這里要注意,上傳的圖像大小要在 10M 以下,格式則支持常見的 JPG、JPEG、PNG、BMP 等,通義萬相文本生成的圖片可以直接生成相似圖,點擊生成按鈕,右側生成4張相似圖片可供下載。
3、風格遷移:風格遷移界面支持輸入兩張圖片,一張為原圖,一張為指定風格圖。生成的圖像會保留原圖的內容和風格圖的風格。你只要上傳想要變換風格的原圖和目標風格的示意圖,就可以很快將原圖處理為目標風格的創意圖了。與相似圖像生成一樣,原圖和風格圖的大小不得超過 10M,格式相同。
無論是文生圖還是圖生圖,通義萬相從語義相關性、畫面完整性以及細節豐富度等方面來看,都給了我們很大的驚喜。
通義萬相優點:
生成速度快。
文生圖風格多樣:支持8種風格,并且風格之間的差別,特色都十分顯著。無論是二次元風格還是寫實風格,表現力都不錯。
相似圖與原圖貼合程度極高:產品將相似圖片與原圖進行精確匹配,保留了原本圖片的特征和細節。使用過程中無需擔心生成的圖片與原圖差異過大。
風格遷移保留原本圖像信息:萬相能夠保留原本圖像的信息,使得生成的圖片在擁有新的藝術風格的同時仍然能夠保持原始圖像的特征。
通義萬相的推出標志著阿里云在人工智能領域的持續創新。在去年的世界人工智能大會上,阿里云“通義”大模型系列首次亮相。此后,通義千問、通義聽悟等模型和產品相繼推出,家族新成員通義萬相的亮相,至此,AI 的三大主要方向已經全部打通。意味著阿里云在大模型領域已經具備處理或生成文本、語音和圖片等模態的能力。