DeepSeek 新論文提出“流形約束超連接”(mHC)框架,梁文鋒參與撰寫

新聞
HongKong
1
10:54 AM · Jan 04 ,2026

DeepSeek團隊近日發佈論文提出了名為mHC(流形約束超連接)的新網絡架構,旨在解決傳統架構在大規模模型訓練中的不穩定性問題,這一研究或將為下一代基礎架構的演進指明新方向。

新論文名為《mHC :Manifold-Constrained Hyper-Connections》(《mHC:流形約束超連接 》),DeepSeek創始人兼CEO梁文鋒出現在了合著名單之中,而解振達(Zhenda Xie)、韋毅軒(Yixuan Wei)、曹煥琪(Huanqi Cao)則是核心貢獻者。

論文地址:https://www.arxiv.org/abs/2512.24880

根據介紹,MHC架構通過數學約束(如雙隨機矩陣流形),將傳統超連接(HC)的信號放大倍數從3000倍降至1.6倍,顯著提升訓練穩定性,同時保持模型性能。實驗顯示,MHC在27B參數模型中,推理任務準確率提升約7%,訓練時間僅增加6.7%,實現“低能耗、高收益”優化。

結合論文提及的“內部大規模實驗”及DeepSeek往年發佈節奏,業內推測V4模型可能支持100萬token長上下文、適配國產AI芯片,並具備多模態能力。發佈時間或定於2026年2月初,借春節用户活躍期展示技術成果。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.