浙江省衞生健康信息中心、螞蟻健康、浙江省安診兒醫學人工智能科技有限公司共同聯合開發了迄今為止最大且最強大的開源醫療語言模型:AntAngelMed。
核心亮點
- 權威評測全球領先:在 OpenAI 的 HealthBench 評測上,AntAngelMed 超越所有開源模型及一系列頂尖閉源模型;在中國權威評測 MedAIBench 上,綜合排名第一。
- 專業的醫療能力:AntAngelMed 通過嚴謹的三階段訓練流程(醫療語料持續預訓練、高質量指令精調以及基於 GRPO 的強化學習),鑄就了其專業的醫療能力。該訓練流程為模型賦予了深厚的醫學知識、複雜的診療推理能力以及強大的安全與倫理對齊能力。
- 極致的推理效率:基於 Ling-flash-2.0 的高效 MoE 架構,AntAngelMed 以 100B 的總參數量,僅激活 6.1B 參數即可達到約 40B 稠密模型的性能水平。它在 H20 硬件上推理速度超過 200 tokens/s,並支持 128K 上下文窗口。
AntAngelMed 在 HealthBench 的開源模型中排名第一:
據介紹,AntAngelMed 採用了三階段訓練流程:
- 首先,通過持續預訓練對通用基座模型 Ling-flash-2.0-base 注入大規模、高質量的醫學語料,構建了深厚的醫療知識底藴;
- 隨後,在監督微調階段,通過多源異構的高質量指令數據,一方面強化了模型的通用核心思維鏈,另一方面針對醫患問答、診斷推理等真實醫療場景進行深度適配;
- 最後,AntAngelMed 採用先進的 GRPO 強化學習算法,並通過雙階段強化學習路徑對模型能力進一步優化提升:首先以 “推理強化學習” 鍛造其邏輯推理的核心能力,再以 “通用強化學習” 打磨其同理心與安全邊界意識,最終實現了醫療專業性與人文關懷的高度統一。
團隊還為專為 AntAngelMed 進行推理加速,採用 FP8 量化 + EAGLE3 優化,在 32 併發場景下,推理吞吐量較 FP8 顯著提升:在 HumanEval 提升 71%,GSM8K 提升 45%,Math-500 提升高達 94%,實現了推理性能與模型穩定性的深度平衡。
HuggingFace:https://huggingface.co/MedAIBase/AntAngelMed
ModelScope:https://modelscope.cn/models/MedAIBase/AntAngelMed
Github: https://github.com/MedAIBase/AntAngelMed/tree/main