阿里通義最新生圖模型 Z-Image 發佈首日下載量達 50 萬

阿里通義大模型團隊最新發布的生圖模型 Z-Image 在上線後迅速登頂 Hugging Face 趨勢榜雙榜第一，其首日下載量達 50 萬。

據介紹，Z-Image 是一款開源、免費的高效圖像生成基礎模型，參數量為 6B，1秒出圖。無需依賴頂級算力和參數堆砌，即可在 16GB 顯存的消費級顯卡上，生成品質可與頂級商業模型相媲美的超真實圖像，尤其在中英雙語文本渲染方面效果突出。

Z-Image 僅以 6B 的參數量就能實現媲美百億級模型的生成效果，關鍵在於其系統性的效率優化設計，覆蓋數據、架構、訓練與推理四大支柱。

Z-Image 亮點如下：

極致高效的照片級真實感

Z-Image 以 6B 參數的規模，實現了與參數量大一個數量級模型相媲美的照片級真實感。無論是皮膚質感、髮絲細節，還是自然光影與材質紋理，都能精細還原，構圖與氛圍兼具美學表現。

中英雙語文本渲染能力突出

Z-Image-Turbo 能精準渲染中英文混合文本，即使在小字號、複雜排版或海報設計等高難度場景下，也能保持文字清晰、版式自然，同時不犧牲人臉真實感與整體畫面美感，效果媲美當前領先的閉源模型。

廣博的知識與文化理解

Z-Image 具備對現實世界的廣泛認知，能準確生成著名地標（如埃菲爾鐵塔、故宮）、知名人物及特定文化元素（如春節窗花、英式電話亭），確保畫面在細節、比例與語境上符合真實常識。

引入先驗知識的深度語義理解

通過提示詞增強器（Prompt Enhancer），Z-Image 能處理“雞兔同籠”邏輯題、古詩“小橋流水人家”可視化等複雜任務，讓 AI 不只是“畫圖”，而是“理解後創作”。

強大的指令遵循與創意編輯能力

Z-Image-Edit 可精準執行複合編輯指令，例如“讓人物微笑 + 轉頭 + 背景換成櫻花 + 添加中文標語”，並在大幅修改中保持身份、光照、風格的高度一致性，避免常見編輯模型的錯位、失真問題。

GitHub：https://github.com/Tongyi-MAI/Z-Image
Hugging Face：https://huggingface.co/Tongyi-MAI/Z-Image-Turbo
ModelScope：https://www.modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo

發佈評論

Product

Company

Support

Company

阿里通義最新生圖模型 Z-Image 發佈首日下載量達 50 萬

發佈 評論

發佈評論