語音轉文本ASR工具合集彙總過幾個ASR項目或模型,本文繼續彙總,並做簡單介紹和部分初步實戰。 注:缺乏深入實戰,和問題記錄,請勿噴。 Omnilingual ASR 論文,項目首頁,Meta開源(GitHub,2.4K Star,207 Fork),支持1600種語言,其中超過500種語言是首次被任何ASR系統覆蓋。 ASR系統
概述 接上篇DeepSeek系列模型/項目介紹。 DeepSeek-Coder 代碼大模型系列,旨在通過AI技術來理解和生成代碼,提升開發效率。 特性: 核心定位:開源代碼智能模型,促進研究和商業應用 模型規模:從1.3B到236B等多種參數,V2採用MoE架構 訓練數據:從零開始訓練,使用2萬億高
概述 之前彙總過BaaS(Backend as a Service,後端即服務)平台或項目,參考BaaS;也彙總過低代碼平台,參考低代碼平台。 BaaS和低代碼 兩者還是有一些共通之處 flowchart TD subgraph A [低代碼/零代碼平台] direction TB A1["可視化UI構建"] A2["拖
概述 在語音轉文本ASR工具合集彙總介紹過幾款語音識別模型和項目,其中就包括OpenAI開源的Whisper。 論文,OpenAI開源的支持多語言的通用ASR。在68萬小時的標註數據上進行訓練,有很強的泛化能力;作為一個多任務模型,可執行多語言語音識別、語音翻譯和口語識別。通過使用分塊算法,也可用於轉錄任意長度的音頻樣本。分塊是通過在實例化管