谷歌发布医疗 AI 模型 MedGemma 1.5 4B:可本地部署,CT、MRI 都能处理

2026-01-14 发布 · 浏览13次 · 点赞0次 · 收藏0次
感谢网友 咩咩洋HH_KK 的线索投递!

1 月 14 日消息,谷歌今日发布了专为医疗场景设计的 AI 模型“MedGemma 1.5 4B”及语音识别模型“MedASR”。MedGemma 1.5 4B 是一款可本地运行的轻量化模型,相比前代产品,其准确率得到了提升。

据了解,谷歌已免费开放 MedGemma 系列开源医疗模型。MedGemma 1.5 4B 为可本地部署的轻量化模型,能够读取并分析文本及图像格式的医疗记录并进行推理。MedASR 是一款专注于医疗术语的语音识别模型,可与 MedGemma 系列模型集成,且相比现有模型具备更高的转录准确率。

谷歌提供的数据显示,与前代模型 MedGemma 1 4B(浅蓝色)相比,MedGemma 1.5 4B(蓝色)的文本处理准确率有所提升。

以下表格展示了 MedGemma 1.5 4B 与各类模型的基准测试得分。该模型的得分高于通用模型 Gemma 3 4B 及前代医疗模型 MedGemma 1 4B,部分测试中甚至优于参数规模更大的 MedGemma 1 27B。

MedGemma 系列前代产品已支持处理文本及胸部 X 光片、病理组织图像等影像数据,而 MedGemma 1.5 4B 进一步升级,可兼容计算机断层扫描(CT)、磁共振成像(MRI)等三维数据。

在影像处理准确率基准测试中,MedGemma 1.5 4B(蓝色)的得分同样高于 MedGemma 1 4B(浅蓝色)。

MedGemma 系列的另一大特点是便于开发者进行微调优化,目前已衍生出超过 500 款衍生模型。随着未来开发者社区的持续贡献,预计将推出针对各类细分任务优化的模型版本,MedGemma 1.5 4B 的相关迭代也在其中。

同日发布的 MedASR 是一款专为医疗场景打造的语音识别模型。该模型对“胸部 X 光片相关对话”的转录错误率仅为 5.2%。谷歌强调,这一表现显著优于 OpenAI 的 Whisper large-v3(同类场景错误率 12.5%)。此外,MedASR 的转录结果还可直接作为 MedGemma 系列模型的输入提示词(prompt)。

谷歌发布医疗 AI 模型 MedGemma 1.5 4B:可本地部署,CT、MRI 都能处理 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。