谷歌發佈開源 AI 醫療模型 MedGemma 1.5

谷歌宣佈推出新一代開源醫療 AI 模型 MedGemma 1.5，增強對醫學影像的支持。同時發佈的還有開源醫療語音轉文本模型 MedASR。兩款模型旨在提升臨牀工作流程效率，支持全球開發者和醫療機構免費使用，推動人工智能在醫療領域的應用與發展。

更廣泛的醫療圖像支持

MedGemma 1.5 擴展了對高維醫學影像的支持，包括 CT、MRI 體積數據和整片組織病理圖像；也提升了對胸部 X 光時間序列及解剖標註的理解能力。
這是目前首個公開可用、支持三維體積數據與二維圖像同時處理的多模態大型語言模型。

性能顯著提升

內部基準顯示，與前一代相比：

支持開發更強大應用

谷歌同時發佈了 MedASR，一款針對醫學口述語音特別訓練的 自動語音識別（ASR）模型：

詳細內容查看：https://research.google/blog/next-generation-medical-image-interpretation-with-medgemma-15-and-medical-speech-to-text-with-medasr/

發佈評論