概述 在語音轉文本ASR工具合集彙總介紹過幾款語音識別模型和項目,其中就包括OpenAI開源的Whisper。 論文,OpenAI開源的支持多語言的通用ASR。在68萬小時的標註數據上進行訓練,有很強的泛化能力;作為一個多任務模型,可執行多語言語音識別、語音翻譯和口語識別。通過使用分塊算法,也可用於轉錄任意長度的音頻樣本。分塊是通過在實例化管