Qwen-Image-Edit:通義千問推出的圖像編輯模型,可以進行語義和外觀雙重編輯
Qwen-Image-Edit是通義千問推出的圖像編輯模型,它在20B參數的Qwen-Image模型基礎上進一步訓練而來,能同時處理圖片里的語義和外觀修改,比如精準改圖片上的文字,還能做IP形象創作、換風格等操作,在多個公開測試里表現是最好的,已經在ModelScope、Hugging Face和GitHub上開源了。

Qwen-Image-Edit核心能力
語義和外觀都能改:把圖片輸進Qwen2.5-VL能控制圖片要表達的意思,輸進VAE Encoder能控制圖片的樣子。用這個能力可以做IP形象創作、讓物體轉方向、換圖片風格,也能給圖片加東西、刪東西、重新畫。
改文字很準:中英文文字都能改,在不改原來字體、大小、風格的情況下,能給圖片里的文字加內容、刪內容、改內容,還能改特定文字的顏色。
測試表現好:在多個公開測試里達到了目前最好的效果。
Qwen-Image-Edit技術
一個是多任務訓練。用了改進的多任務訓練方法,把傳統的文字生成圖片、文字加圖片生成新圖片、圖片生成新圖片這些任務結合起來,讓Qwen2.5-VL和MMDiT這兩個部分的隱藏信息能更好地對應上。
另一個是雙重編碼。把圖片分別輸進Qwen2.5-VL(用來控制圖片要表達的意思)和VAE Encoder(用來控制圖片的樣子),這樣模型改圖片時,既能明白你想要改什么意思,又能保證圖片看起來和原來差不多。
Qwen-Image-Edit使用場景
IP創作:可以基于一個角色做出不同的內容,比如把Qwen的吉祥物卡皮巴拉做成MBTI表情包。
視角轉換:能讓物體轉90度、180度。
風格遷移:能把人物頭像換成吉卜力動畫那種風格。
如何用Qwen-Image-Edit做風格遷移的步驟
先去Qwen Chat(chat.qwen.ai)點“圖像編輯”功能。
然后上傳你想改風格的圖片到編輯界面。
接著在提示詞里寫清楚想換成什么風格,比如“把這張人物頭像換成吉卜力風格”。
再點提交,模型就會開始處理。
處理好后,能看到改完的圖片,能下載下來。

Qwen-Image-Edit模型下載地址:
ModelScope:https://modelscope.cn/models/Qwen/Qwen-Image-Edit
Hugging Face:https://huggingface.co/Qwen/Qwen-Image-Edit
GitHub:https://github.com/QwenLM/Qwen-Image
相關文章
- 用戶登錄
提交您的產品
Ai應用
Ai資訊
AI生圖
AI生視頻
開源AI應用平臺










