OpenAI推出的GPT-4o圖像生成有哪些功能特點?
2025年3月25日,Openai通過一場直播活動正式發(fā)布了GPT-4o的原生圖像生成功能,并將其集成到ChatGPT和Sora平臺,用戶可以通過文字提示生成高質(zhì)量圖像,甚至對現(xiàn)有圖像進行風格化編輯。
GPT-4o圖像生成功能的主要功能特點
多模態(tài)能力:GPT-4o能夠理解和編輯現(xiàn)有圖像,而不僅僅是生成新的圖像。它可以通過圖像識別技術(shù)理解照片中的人物、物體和場景,并進行風格化編輯。
風格遷移:可以將現(xiàn)實照片轉(zhuǎn)化為動漫風格,同時保留人物的姿勢和表情。
文本渲染與圖像融合:能夠在圖像中添加文字,并根據(jù)圖像的整體風格自動調(diào)整文字的字體、顏色和位置,確保最終效果自然且美觀。
語義理解與場景生成:能夠根據(jù)一句話描述生成全新的漫畫內(nèi)容,包括分格布局、人物表情和對話內(nèi)容。
圖像合成與格式化:可以將上傳的圖像與指定的風格和布局無縫融合,生成符合要求的圖像,如交易卡。
圖像識別與上色排版:能夠?qū)⑹掷L漫畫草稿轉(zhuǎn)化為全彩色電子版,自動上色并優(yōu)化排版。
GPT-4o圖像生成功能的主要應用場景
藝術(shù)創(chuàng)作:將現(xiàn)實照片轉(zhuǎn)化為動漫風格,生成藝術(shù)作品。
內(nèi)容創(chuàng)作:制作社交媒體內(nèi)容、宣傳海報或個性化卡片。
教育與學習:生成與教學相關(guān)的圖像,如科學圖表或歷史場景。
游戲開發(fā):設(shè)計游戲角色和場景。
漫畫創(chuàng)作:從零開始生成漫畫內(nèi)容,或?qū)⑹掷L草稿轉(zhuǎn)化為電子版并進行上色和排版。
在安全性與溯源方面,這個功能更新會阻止違反內(nèi)容政策的圖像生成請求,比如兒童性虐待和換臉等方面,而且生成的圖像包含C2PA元數(shù)據(jù),從而標識為GPT-4o生成。
ChatGPT的Plus、Pro、Team和Free用戶可以試用這個功能了,很快也會向企業(yè)和教育用戶開放,開發(fā)者將很快通過API使用GPT-4o生成圖像。