清華 NLP 實驗室、OpenBMB 與面壁智能聯合發佈並開源 UltraEval-Audio,一個面向音頻模型的測評框架。它不僅為音頻大模型領域確立了一套完備的評測方法論,更將這套體系具象化為開箱即用的工程框架,完善了音頻評測體系和框架,增加了系統化的評測體系定義(如表1)。
開源地址:https://github.com/OpenBMB/UltraEval-Audio
UltraEval-Audio 最新版本 v1.1.0 在原有的“一鍵測評”音頻模型的基礎上,重點新增熱門音頻模型的一鍵復現能力,擴展對 TTS/ASR/Codec 等專業模型與專項評測的支持,並引入隔離推理運行機制,以在工程層面降低復現門檻、提升評測流程的可控性與可遷移性。
值得一提的是,作為 MiniCPM-o 2.6、VoxCPM 等高影響力音頻、全模態模型的御用測評工具,UltraEval-Audio v1.1.0 開源將幫助研究者顯著提高音頻模型的研發效率。
➤ 相關鏈接
UltraEval-Audio v1.1.0評測框架 :
https://github.com/OpenBMB/UltraEval-Audio/tree/main/replication
UltraEval-Audio v1.1.0論文《UltraEval-Audio: A Unified Framework for Comprehensive Evaluation of Audio Foundation Models》:
https://github.com/OpenBMB/UltraEval-Audio/blob/main/assets/UltraEval_Audio__A_Unified_Framework_for_Comprehensive_Evaluation_of_Audio_Large_Language_Models.pdf