首頁 > Ai資訊 > Ai產品

CogView4：全球首個支持生成漢字的開源文生圖生成模型

映技派于2025-03-04發布在Ai產品

CogView4是什么？

CogView4是由智譜AI于2025年3月4日發布的首個支持中英雙語提示詞的開源文生圖ai模型，也是全球首個支持生成漢字的開源文生圖模型，尤其擅長理解和遵循中文提示詞，能在畫面中生成漢字，非常適合做廣告、短視頻創作等。

CogView4主要特點

支持中英雙語輸入：CogView4能夠處理任意長度的中英文提示詞，并生成高質量圖像。
漢字生成能力：該模型可以將漢字自然融入圖像中，特別適合廣告、短視頻等創意領域。
任意分辨率圖像生成：支持生成512×512到2048×2048范圍內的任意分辨率圖像。
強大的語義對齊能力：在DPG-Bench基準測試中，CogView4的綜合評分排名第一，展現了其在復雜語義對齊和指令跟隨方面的卓越性能。
技術優化：采用二維旋轉位置編碼（2D RoPE）和多階段訓練策略，包括基礎分辨率訓練、泛分辨率訓練、高質量數據微調以及人類偏好對齊訓練。
顯存優化與高效推理：通過模型CPU卸載和文本編碼器量化等技術，顯著降低了顯存占用。
開源與生態支持：遵循Apache 2.0協議，后續將支持ControlNet、ComfyUI等生態集成，并推出完整的微調工具包。

CogView4技術

架構：基于擴散模型結合Transformer架構，使用60億參數。
文本編碼器：采用雙語GLM-4編碼器，通過中英雙語圖文對進行訓練。
顯存優化：通過模型CPU卸載和文本編碼器量化等技術，降低顯存占用，提升推理效率。

CogView4應用場景

CogView4特別適合需要中文創意的領域，例如廣告設計、短視頻制作、海報創作等，能夠將中英文字符自然融入畫面。

廣告創意：生成帶有特定文字的海報、文案配圖等。
短視頻制作：根據視頻腳本或創意描述生成相應畫面。
藝術創作：輔助藝術家和設計師生成具有特定風格和意境的圖像。
教育領域：生成與教學內容相關的圖像，如古詩文意境圖。
游戲開發：根據游戲劇情和角色設定生成游戲畫面和角色形象。
其他創意領域：如漫畫創作、插畫設計、品牌宣傳等。

CogView4使用

1. 在線體驗

HuggingFace：https://huggingface.co/spaces/THUDM-HF-SPACE/CogView4
ModelScope：https://modelscope.cn/models/ZhipuAI/CogView4-6B

2. 本地部署

如果需要在本地使用CogView4，可以通過以下步驟進行部署：

獲取模型代碼：訪問CogView4的GitHub倉庫，地址是：https://github.com/THUDM/CogView4。
硬件要求：CogView4模型需要較高的顯存，最低推薦使用12GB顯存的GPU。
安裝依賴：根據GitHub倉庫中的說明，安裝必要的Python依賴和環境。
運行模型：按照倉庫中的指南啟動模型，輸入提示詞生成圖像。

3. 模型微調

智譜計劃推出CogView4的微調工具包，用戶可以根據自己的需求對模型進行定制化訓練。例如，可以針對特定的廣告風格或品牌需求進行微調，以生成更符合需求的圖像。

4. 通過Hugging Face使用

Hugging Face模型庫地址：https://huggingface.co/THUDM/CogView4-6B。

#文生圖

DiffRhythm:全球首個基于擴散模型的端到端音樂生成工具

Llasa:一款基于Llama的文本轉語音（TTS）,生成效果自然流暢富有感情

文生圖模型Ideogram 2A：更快的生成速度和更

文生圖模型Ideogram 2A：更快的生成速度和更

2025-02-28

有哪些好用的AI文生圖工具

有哪些好用的AI文生圖工具

2024-08-31

云界AI新手教程| 玩轉AI文生圖so easy,簡

云界AI新手教程| 玩轉AI文生圖so easy,簡

2023-12-08

Giiso寫作機器人的重大升級：AI文生圖功能正式上

Giiso寫作機器人的重大升級：AI文生圖功能正式上

2023-11-02

最新工具

8 Ball Pool

是游戲工作室 Miniclip 開發的一款熱門在線臺球游戲，支持...

Minecraft Classic

一個免費的，基于瀏覽器的Minecraft版本，可在帶完整鍵盤的...

稿定證件照

稿定設計推出的在線證件照制作工具。可以在線換底色、改尺寸、美化人...

稿定摳圖

稿定設計推出的在線摳圖工具，能快速處理圖片背景。支持一鍵摳圖，上...

LocallyTools

安全、免費、可離線使用的本地工具集合，LocallyTools把...

Cookie Clicker

一款點擊類休閑游戲，玩家通過點擊屏幕上的大餅干獲取餅干。隨著游戲...

Neal.Fun

開發者Neal Agarwal的個人網站。這里有好多有趣又好玩的...

??Online-Go

（OGS）是一個面向全球圍棋愛好者的在線對弈與學習平臺，支持中文...

Autodesk Inventor

歐特克公司推出的一款三維CAD軟件，主要面向設計師和工程師，提供...

CatOCR

一款免費的在線圖片轉文字識別工具，主要功能是批量提取圖片文字，支...

用戶登錄

我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院