ElevenLabs 發佈轉錄模型 Scribe v2,支持 90 多種語言

新聞
HongKong
2
07:17 PM · Jan 12 ,2026

ElevenLabs 推出 Scribe v2 轉錄模型 ,專注於離線批量轉錄和字幕製作場景。該模型在英語中的詞錯率約為 5% ,在印地語等 90 多種語言中低於 10% 。

Scribe v2 已集成至 ElevenLabs Studio,支持超過 10 小時 的大文件處理,並符合 GDPR 和 HIPAA 等合規要求。其功能包括支持自定義術語的 Keyterm Prompting 以及智能多説話人日誌。

亮點特性

  • 適用於大規模轉錄和字幕:Scribe v2 專為批量轉錄、字幕製作和標題生成設計,其穩定性和準確度比 Scribe v1 更高,能夠處理長音頻、停頓、語調變化和長時間靜音。模型支持 90 多種語言,適用於跨語種場景。
  • 關鍵詞提示:提供關鍵詞提示功能,用户可提供多達 100 個詞語或短語,模型會根據上下文決定何時準確轉錄這些術語,適合技術文檔、品牌名等。
  • 內置實體檢測支持 56 類實體的檢測,並給出精確的時間戳,可用於識別個人信息、健康數據或支付信息。
  • 多語言自動轉錄:無需手工分段即可處理單個文件中的多語言內容。
  • 企業級功能提供智能説話人分離、精確的字級時間戳、動態音頻標籤(識別笑聲或腳步聲)等特性,並符合 SOC 2、ISO 27001、PCI DSS L1、HIPAA、GDPR 等合規要求,支持零保留模式。
  • Scribe v2 已經集成到 ElevenLabs Studio 中,開發者也可通過 API 使用

此外,針對超低延遲需求,官方還推出了 Scribe v2 Realtime 版本,專門為 Agent 用例進行了優化。

詳情查看:https://elevenlabs.io/blog/introducing-scribe-v2

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.