目錄 背景 模型結構 模型效果 實現代碼 背景 模型結構 訓練過程 實現代碼 前言 本文主要介紹知識蒸餾原理,並以BERT為例,介紹兩篇BERT蒸餾論文及代碼,第一篇論文是在下游任務中使用BiLSTM對BERT蒸餾,第二篇是對Transformer蒸餾,即TinyBert。