阿里通義最新生圖模型 Z-Image 發佈首日下載量達 50 萬

新聞
Remote
52
06:53 PM · Nov 28 ,2025

阿里通義大模型團隊最新發布的生圖模型 Z-Image 在上線後迅速登頂 Hugging Face 趨勢榜雙榜第一,其首日下載量達 50 萬。

據介紹,Z-Image 是一款開源、免費的高效圖像生成基礎模型,參數量為 6B,1秒出圖。無需依賴頂級算力和參數堆砌,即可在 16GB 顯存的消費級顯卡上,生成品質可與頂級商業模型相媲美的超真實圖像,尤其在中英雙語文本渲染方面效果突出。

Z-Image 僅以 6B 的參數量就能實現媲美百億級模型的生成效果,關鍵在於其系統性的效率優化設計,覆蓋數據、架構、訓練與推理四大支柱。

Z-Image 亮點如下:

  • 極致高效的照片級真實感

Z-Image 以 6B 參數的規模,實現了與參數量大一個數量級模型相媲美的照片級真實感。無論是皮膚質感、髮絲細節,還是自然光影與材質紋理,都能精細還原,構圖與氛圍兼具美學表現。

  • 中英雙語文本渲染能力突出

Z-Image-Turbo 能精準渲染中英文混合文本,即使在小字號、複雜排版或海報設計等高難度場景下,也能保持文字清晰、版式自然,同時不犧牲人臉真實感與整體畫面美感,效果媲美當前領先的閉源模型。

  • 廣博的知識與文化理解

Z-Image 具備對現實世界的廣泛認知,能準確生成著名地標(如埃菲爾鐵塔、故宮)、知名人物及特定文化元素(如春節窗花、英式電話亭),確保畫面在細節比例語境上符合真實常識。

  • 引入先驗知識的深度語義理解

通過提示詞增強器(Prompt Enhancer),Z-Image 能處理“雞兔同籠”邏輯題、古詩“小橋流水人家”可視化等複雜任務,讓 AI 不只是“畫圖”,而是“理解後創作”

  • 強大的指令遵循與創意編輯能力

Z-Image-Edit 可精準執行複合編輯指令例如“讓人物微笑 + 轉頭 + 背景換成櫻花 + 添加中文標語”,並在大幅修改中保持身份、光照、風格的高度一致性,避免常見編輯模型的錯位、失真問題。

GitHub:https://github.com/Tongyi-MAI/Z-Image
Hugging Face:https://huggingface.co/Tongyi-MAI/Z-Image-Turbo
ModelScope:https://www.modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.