网易首页 > 网易号 > 正文 申请入驻

谷歌发布多模态模型MedGemma 27B、轻量级编码器MedSigLIP

0
分享至

编辑丨coisini

人工智能(AI)在医疗健康领域具有巨大应用潜力,但由于医疗数据多样、医疗任务复杂、隐私保护要求高,模型的训练与部署面临挑战。

基于这些问题,谷歌面向健康医疗研究及应用构建了 HAI-DEF—— 一个包含一系列轻量级开源模型的集合。今年 5 月,谷歌基于 Gemma 3 架构又开发了生成式模型 MedGemma,进一步扩展了 HAI-DEF。

现在,谷歌发布 MedGemma 技术报告,并推出两款新模型:多模态模型 MedGemma 27B、轻量级图文编码器 MedSigLIP。

技术报告:https://www.alphaxiv.org/abs/2507.05201

模型地址:https://deepmind.google/models/gemma/medgemma/

MedGemma:面向健康领域的多模态生成模型

MedGemma 系列包含 4B 和 27B 两种规模的模型变体,现均已支持图像与文本的多模态输入,并生成文本输出。

MedGemma 4B 在 MedQA 医学问答基准测试中取得 64.4% 的准确率,位列超小型开源模型(<80 亿参数)第一梯队。

在一项非盲实验中,美国执业放射科医师评估认为:MedGemma 4B 生成的胸部 X 光报告中,81% 在诊断准确性上达到与原始放射科报告相近的临床处理建议水平。

此外,MedGemma 4B 在医学影像分类任务中的表现可媲美顶尖专用模型。

MedGemma 27B 纯文本版在 MedQA 基准上取得了 87.7% 的准确率,与 DeepSeek R1 仅差 3 个百分点,而推理成本仅为其十分之一。

而 MedGemma 27B 多模态版,通过新增对复杂多模态数据及纵向电子健康记录(EHR)解析的支持,与 4B 多模态版和 27B 纯文本版形成功能互补。

MedGemma 基于 Gemma 3 架构,采用医学数据进行训练。在开发过程中,研究团队注重保留 Gemma 模型的通用能力,这使得 MedGemma 能够:

  • 出色处理医学与非医学信息混合的任务
  • 保持多语言指令跟随能力
  • 在非英语语境中维持性能

MedGemma 的一个关键特性是其出色的适应能力,开发者能直接提升目标应用的性能表现。这凸显了 MedGemma 作为医疗 AI 开发起点的价值。

MedSigLIP:专为医疗打造的图像编码器

MedSigLIP 是一个仅含 4 亿参数的轻量级图像编码器,采用基于 Sigmoid 损失的视觉语言预训练架构(SigLIP)。

研究团队通过对胸部 X 光片、组织病理切片、皮肤病图像及眼底影像等多样化医学影像数据进行调优,使 MedSigLIP 能捕捉不同模态特有的细微特征。

MedSigLIP 特别适用于:

  • 传统图像分类:构建高性能医学影像分类模型
  • 零样本图像分类:实现无需特定训练样本的分类
  • 语义图像检索:从海量医学影像数据中查找视觉或语义相似的图像

MedSigLIP 作为一个组件,为 MedGemma 提供了视觉理解能力,其编码性能媲美或超越专业医学图像编码器。

总的来说,谷歌 MedGemma 系列为医学图文处理提供了基础平台,有望显著加速医学研究及下游应用开发。

感兴趣的读者可以阅读论文原文,了解更多研究内容。

参考内容:https://research.google/blog/medgemma-our-most-capable-open-models-for-health-ai-development/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
表面谦谦君子,实则流氓头子,这四位男星表里不一

表面谦谦君子,实则流氓头子,这四位男星表里不一

看尽落尘花q
2026-02-19 19:28:49
王心迪晋级自由式滑雪男子空中技巧决赛

王心迪晋级自由式滑雪男子空中技巧决赛

环球网资讯
2026-02-20 18:27:33
生存资本被夺,退伍老兵当街砍死城管队长,自首后最终结局如何?

生存资本被夺,退伍老兵当街砍死城管队长,自首后最终结局如何?

易玄
2024-08-19 10:18:27
​高德每月8亿人在用,维护544万公里道路,成本高上天。

​高德每月8亿人在用,维护544万公里道路,成本高上天。

岁月有情1314
2026-01-08 00:01:16
量子计算机梦碎一地

量子计算机梦碎一地

粤语音乐喷泉
2026-02-19 18:24:42
为什么普通人不要碰A股?

为什么普通人不要碰A股?

流苏晚晴
2026-02-20 17:51:08
洪森将中国援建基地转送美,太原舰拉响战斗警报055能灭一个舰队

洪森将中国援建基地转送美,太原舰拉响战斗警报055能灭一个舰队

路路观察
2026-02-20 20:20:09
什刹海大爷雕的抽象“玲娜贝儿”爆火,迪士尼法务部看了都沉默!

什刹海大爷雕的抽象“玲娜贝儿”爆火,迪士尼法务部看了都沉默!

广告案例精选
2026-01-31 19:38:10
绝非迷信!正月初五,3事别犯了忌讳:1不拜、2不吵、3不吃

绝非迷信!正月初五,3事别犯了忌讳:1不拜、2不吵、3不吃

牛锅巴小钒
2026-02-20 18:34:32
广东一女子登山脚崴,小伙热心背她40分钟下山,恶心的还是发生了

广东一女子登山脚崴,小伙热心背她40分钟下山,恶心的还是发生了

西莫的艺术宫殿
2026-02-20 15:06:52
当你六十多岁,还要照顾八九十岁的父母时,就会看到三个家庭真相

当你六十多岁,还要照顾八九十岁的父母时,就会看到三个家庭真相

素十三儿
2026-02-20 08:28:32
央视直播英超,阿森纳利物浦同遇新帅,曼联主帅时隔三年再遇魔咒

央视直播英超,阿森纳利物浦同遇新帅,曼联主帅时隔三年再遇魔咒

嗨皮看球
2026-02-20 10:28:12
阿卡怒喷超时警告太荒谬,辛纳输球不意外,美三姐妹四强围剿白菜

阿卡怒喷超时警告太荒谬,辛纳输球不意外,美三姐妹四强围剿白菜

网球之家
2026-02-20 12:32:33
看完这40张照片,才知道时间有多可怕!

看完这40张照片,才知道时间有多可怕!

神奇故事
2025-10-26 23:50:42
1985年,19岁的苏菲·玛索在东京街头,英气十足

1985年,19岁的苏菲·玛索在东京街头,英气十足

娱你同欢
2026-02-15 10:12:04
1971年台湾退出联合国,毛主席悔叹:不改国名就能顺势将其收复

1971年台湾退出联合国,毛主席悔叹:不改国名就能顺势将其收复

大运河时空
2026-02-10 07:00:03
高市国会上首次发表与外国人“共生”宣言!强调日本不排外,但将实行史上最严“清零计划”

高市国会上首次发表与外国人“共生”宣言!强调日本不排外,但将实行史上最严“清零计划”

东京新青年
2026-02-20 18:09:28
“最美妲己”傅艺伟近况曝光!儿子去世2年,一个人孤苦伶仃生活

“最美妲己”傅艺伟近况曝光!儿子去世2年,一个人孤苦伶仃生活

李橑在北漂
2026-02-10 04:40:46
固态电池 比亚迪仰望U9全固态版2026年1月青海首测 技术盈利双突破

固态电池 比亚迪仰望U9全固态版2026年1月青海首测 技术盈利双突破

趣味萌宠的日常
2026-02-20 02:14:34
仅剩几小时,比尔·盖茨突然取消

仅剩几小时,比尔·盖茨突然取消

观察者网
2026-02-19 22:03:08
2026-02-20 20:52:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1234文章数 224关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

OpenAI刷新AI公司估值纪录:8500亿美元 断层第一

头条要闻

OpenAI刷新AI公司估值纪录:8500亿美元 断层第一

体育要闻

宁忠岩:我拿过那么多银牌和铜牌 现在终于赢了

娱乐要闻

苏翊鸣夺金朱易示爱,两人默契引热议

财经要闻

太疯狂!“顾客不问价直接出手”

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

手机
房产
教育
时尚
数码

手机要闻

苹果iOS 26.4 Beta移除App Store退出登录功能,切换账户更繁琐

房产要闻

春节三亚楼市再放大招!千亿巨头,重磅推出超性价比海景现房

教育要闻

“院校专业组”志愿怎么填?2026年最新填报步骤与策略

冬季羽绒服是最“受捧”的单品,这样选款和搭配,舒适耐看

数码要闻

3000尼特屏手表,能当手电筒吗?

无障碍浏览 进入关怀版