一、動量優化器(Momentum) 1、核心思想 模擬物理中的 “動量” 概念,通過積累歷史梯度的 “慣性” 來加速收斂,減少震盪。 解決 SGD(隨機梯度下降)在溝壑區域(梯度方向頻繁變化)收斂慢、震盪大的問題。 2、公式 (1)動量變量(積累歷史梯度) (2)參數更新 其中,γ為動量因子(通常