木子吉博客 - 博客首頁 | YeLogs.com

博客 / 列表

Feb 27 2026

木子吉 - 一文讀懂MOE：大模型背後的"專家分工"智慧

一文讀懂MOE：大模型背後的"專家分工"智慧本文基於綜述論文：A Comprehensive Survey of Mixture-of-Experts Algorithms, Theory, and Applications(Siyuan Mu and Sen Lin)。如需深入瞭解，建議閲讀原文。重點內容 MoE（混合專家模型）是當前大模型擴展的核心技術之一，DeepSeek、M

Feb 27 2026

木子吉 - 混合專家模型 (MoE) 詳解

混合專家模型 (MoE) 詳解隨着 Mixtral 8x7B (announcement, model card) 的推出，一種稱為混合專家模型 (Mixed Expert Models，簡稱 MoEs) 的 Transformer 模型在開源人工智能社區引起了廣泛關注。在本篇博文中，我們將深入探討 MoEs 的核心組件、訓練方法，以及在推理過程中需要考量的各種因素。讓我們開始吧！目錄

1