UltraEval-Audio 開源發佈:全模態、語音大模型評測框架

新聞
HongKong
1
02:39 PM · Jan 04 ,2026

清華 NLP 實驗室、OpenBMB 與面壁智能聯合發佈並開源 UltraEval-Audio,一個面向音頻模型的測評框架。它不僅為音頻大模型領域確立了一套完備的評測方法論,更將這套體系具象化為開箱即用的工程框架,完善了音頻評測體系和框架,增加了系統化的評測體系定義(如表1)。

開源地址:https://github.com/OpenBMB/UltraEval-Audio

UltraEval-Audio 最新版本 v1.1.0 在原有的“一鍵測評”音頻模型的基礎上,重點新增熱門音頻模型的一鍵復現能力,擴展對 TTS/ASR/Codec 等專業模型與專項評測的支持,並引入隔離推理運行機制,以在工程層面降低復現門檻、提升評測流程的可控性與可遷移性。

值得一提的是,作為 MiniCPM-o 2.6、VoxCPM 等高影響力音頻、全模態模型的御用測評工具,UltraEval-Audio v1.1.0 開源將幫助研究者顯著提高音頻模型的研發效率。

➤  相關鏈接

UltraEval-Audio v1.1.0評測框架 :
https://github.com/OpenBMB/UltraEval-Audio/tree/main/replication

UltraEval-Audio v1.1.0論文《UltraEval-Audio: A Unified Framework for Comprehensive Evaluation of Audio Foundation Models》:
https://github.com/OpenBMB/UltraEval-Audio/blob/main/assets/UltraEval_Audio__A_Unified_Framework_for_Comprehensive_Evaluation_of_Audio_Large_Language_Models.pdf

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.