一、什麼是 N-gram 核心定義:N-gram 是來自給定文本或語音序列的N 個連續項(如單詞、字符)的序列。它是一種通過查看一個項目的前後文來建模序列的概率模型。 N:代表連續項的數量。 項(Item):通常是單詞(Word),也可以是字符(Character)或音節。 核心思想:N-gram 模型基於一個簡化的假設:一個詞的出現概