网易首页 > 网易号 > 正文 申请入驻

Nature:AI击败人类医学专家?哈佛团队:这一领域仍需解决4大难题

0
分享至

在医学研究和临床治疗中,准确解读医学图像并生成有洞察力的报告对病人的护理是必不可少的,但却给人类临床专家带来了沉重的负担。

人工智能(AI),特别是多模态生成式医学图像解释(GenMI)领域的快速发展,为自动化这一复杂过程的部分工作创造了机会。尽管 GenMI 有望在生成跨学科报告方面达到人类专家水平,但仍在准确性、透明度等方面面临障碍

厘清这些障碍并提出针对性解决方案,对于帮助临床医生改善护理质量、加强医学教育、减少工作量、扩大专业准入并提供实时专业知识至关重要。

今天,来自哈佛医学院的研究团队在权威科学期刊 Nature 上发文,全面综述了开发从图像中生成医学报告的 AI 系统方面的进展和挑战

论文链接:

https://www.nature.com/articles/s41586-024-07618-3

除了分析医疗报告生成的新模型的优势和应用之外,他们倡导一种新的范式,以授权临床医生及其患者的方式部署 GenMI。

在临床中发挥 GenMI 的优势

现有的大多数 AI 解决方案都侧重于自动完成医学影像中的单一任务,没有考虑到放射学和临床成像中涉及的更全面的综合分析。

因此,AI 有很大潜力在医学成像和报告方面实现更广泛的用途,例如快速撰写出涉及多科室的权威报告,摄取多种模式和临床数据,生成更加准确、流畅和可解释的报告等。

图|自动生成医疗报告的应用

目前,医疗报告生成框架主要由视觉编码器和语言解码器组成。其中,编码器将图像中的视觉信息提取为向量表示,而解码器接收一个向量并产生特定的输出。

近年来,科研人员在编码器-解码器方法的基础上不断创新,从而更好地编码图像数据、考虑外部知识、筛选异常等。包括大语言模型(LLM)在内的大型预训练通用 AI 系统,通过推动开发新的 GenMI 解决方案,彻底改变了医学图像解释。

这些 GenMI 方法可以产生更准确的医疗报告,以及使用相同的基础模型执行其他几个下游任务并处理多模态数据。

这些算法大多建立在视觉语言模型(VLM)的基础上,VLM 将单个视觉和语言模型融合到一个统一的框架中,可以对图像和文本输入进行联合编码。

图|GenMI 的能力

利用 GenMI 协助临床医生和患者,在临床环境中充分发挥它们的优势,可以通过两个范例来理解。

第一个是部署 AI 住院实习医师。AI 住院实习医师首先会专门起草临床上准确的报告,作为住院实习医师或医生撰写报告的起点。在开发过程中,可以在临床环境中对模型进行前瞻性测试。然后,AI 住院实习医师可以在主治医师的监督下进行微调或校准,并从所需的修正和补充中学习。

图|部署 AI 住院实习医师

第二个是符合人类偏好。基于人类反馈的强化学习(RLHF)和直接偏好优化(DPO)是应用于此类任务的两种技术。

对话式医疗报告生成模型,使临床医生可以根据需要提供反馈和后续问题,还可以与临床医生合作,通过生成式 AI 改变输入图像的属性,观察模型预测中的相关差异,并将这些差异与临床医生识别出的突出特征进行比较,从而对 AI 成像工具进行审核,还可以对为患者生成的报告进行调整,使其更直白,包含更少的医学术语,更多围绕患者病情。

总的来说,临床医生可以通过 3 种途径与 AI 系统协作

  • 利用 AI 模型的诊断能力,获得诊断错误的反馈。模型可以结合多模态输出,其中的解释加上在原始图像上的边界框,可以突出图像中以前可能被忽略的相关区域;

  • 模型快速解析图像和报告的能力,有助于临床医生快速搜索类似病例和图像;

  • 模型可以协助临床医生决策,其提出的探究性问题可以让临床医生深入了解与特定病症相关的诊断模式。

仍需克服 4 大挑战

然而,研究团队表示,要想发挥 GenMI 等 AI 系统的优势,还需要解决基准、人类过度依赖、数据集和模型偏差以及新模型、新科室等挑战。

首先,是基准和评估指标。在安全实施医学报告生成模型,AI 住院实习医师将在住院治疗中发挥更重要的作用之前,必须开展评估下游临床效果的研究,明确衡量标准。

流行的 LLM 的性能会随着时间的推移而发生显著变化,这种差异可能会造成严重后果。例如,疾病预测模型可能会被操纵以输出特定的诊断和结果测量,从而导致处方过量、保险欺诈和伪造临床试验。

因此,在将 LLM 作为人工智能住院实习医师的一部分进行部署时,必须确保采取一致的安全措施和监管。

其次,是临床医生和患者的过度依赖。临床医生可能出于对错误问责的模糊性、确认偏差和自动化偏差,过于依赖机器自动化指导等各种原因,不愿意更改 AI 生成报告中的文字,忽略模型无法识别的罕见发现。

虽然 AI 住院实习医师可以让患者直接与真正的临床专家进行交流,但这些交流应该在可控的情况下进行,这样患者就不会依赖 AI 住院实习医师来指导他们的医疗护理。同时,临床医生应向患者传授正确的查询方法,并让他们了解 AI 工具,以便自己进行探索。在部署 AI 住院实习医师的整个过程中,必须承认 AI 系统的局限性,尤其是在直接护理等只有人类才能处理和提供的更广泛的语境、同理心和认知的领域。

然后,是有偏差的数据集和模型。深度学习模型,尤其是 LLM,很容易受到训练数据固有偏差的影响。在 AI 住院实习医师的范例中,这种缺陷尤其容易造成问题,因为模型不仅会在生成的报告中,还会在医学教育和临床医生理解等方面延续这种偏差。

此外,人类的主观反馈是改进 AI 住院医师的关键因素,而这本身就可能造成有偏见的反馈循环。训练数据的质量、规模和平衡也是决定模型偏差的重要因素,因此亟需更广泛、更具代表性的数据集。

目前,大多数进展都是由 MIMIC-CXR 等数据集推动的,这些数据集仅限于单模态胸部 X 光扫描,其他数据集也不平衡,除了配对图像和相关报告普遍不足外,与正常扫描相比,异常扫描要少得多,并且往往会捕捉到更常见的疾病,而罕见的疾病则很少出现。异常也通常只局限于图像的一小部分,因此模型很难对其进行筛选。

最后,是新的模式和新的科室。目前,将 GenMI 应用于三维成像(包括 MRI 和 CT 扫描)的工作十分有限。部分原因是这一领域缺乏大型标注数据集,只有少数未发布、稀少或难以获取的数据集。

除了三维放射图像,GenMI 还以有限的方式应用于其他科室。眼科和皮肤科的报告生成在一定程度上取得了成功,在其考虑中纳入了外部知识和疾病分类等标准技术。尽管纳入新科室和图像类型将扩展 AI 工具的能力,但获取大规模多模态数据集的成本非常高昂,资源充足的公司或有能力收集或授权使用这些专有数据集。

自动生成医疗报告在减轻临床负担、扩大专家级临床医疗服务覆盖面方面有广阔前景。GenMI 可以生成更高质量的报告,通过提供交互式临床专业知识授权临床医生和患者,并通过扩展教育功能改善未来的临床护理。

研究团队表示,在不同模式和科室的临床环境中,制定衡量其效果的公开基准、进行持续的临床合作和谨慎的模型验证至关重要,这有助于学术界更透明地衡量报告生成的进展,并为临床监管机构未来的工作提供指导,使其安全有效。

作者:与可

如需转载或投稿,请直接在公众号内留言

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

离离言几许
2026-03-26 15:01:41
连续两个月从中国进口镓锗为零后,日本宣布无人机要做世界第一

连续两个月从中国进口镓锗为零后,日本宣布无人机要做世界第一

小小科普员
2026-03-26 19:07:58
华山医院候诊屏现“照顾号”引热议,院方:为75岁以上老人等优待群体提供便利

华山医院候诊屏现“照顾号”引热议,院方:为75岁以上老人等优待群体提供便利

上游新闻
2026-03-26 15:33:08
人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

掠影后有感
2026-03-26 10:39:36
丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

冷紫葉
2026-03-24 19:12:36
受权发布|中华人民共和国国务院令  第833号

受权发布|中华人民共和国国务院令  第833号

新华社
2026-03-26 17:03:04
4月1日医保7号令落地!1965-1985年出生的,这6件事务必抓紧办

4月1日医保7号令落地!1965-1985年出生的,这6件事务必抓紧办

混沌录
2026-03-25 15:50:11
中方拒收道歉,日本自卫官被转移,小泉进次郎沉默24小时后发声

中方拒收道歉,日本自卫官被转移,小泉进次郎沉默24小时后发声

何氽简史
2026-03-26 15:40:58
想拿中国尿素救春耕?先把欠中企的百亿欠款还了!否则一粒不售

想拿中国尿素救春耕?先把欠中企的百亿欠款还了!否则一粒不售

过期少女致幻录
2026-03-26 11:44:43
引而不发才是王道,封锁霍尔木兹海峡,伊朗打完了最后一张牌……

引而不发才是王道,封锁霍尔木兹海峡,伊朗打完了最后一张牌……

家传编辑部
2026-03-26 10:34:27
伊朗称正在搜捕逃亡美军

伊朗称正在搜捕逃亡美军

界面新闻
2026-03-25 23:21:14
家长违停孩子开门杀撞人后逃逸?交警回应

家长违停孩子开门杀撞人后逃逸?交警回应

中国新闻周刊
2026-03-26 14:46:51
突发传闻:封锁霍尔木兹的伊朗关键人物被击毙

突发传闻:封锁霍尔木兹的伊朗关键人物被击毙

桂系007
2026-03-26 16:19:32
伊朗战争还将持续多久?据传特朗普希望4-6周内终结战事

伊朗战争还将持续多久?据传特朗普希望4-6周内终结战事

财联社
2026-03-26 18:29:05
张雪峰奶奶近况令人担忧,4年内子孙相继离世,不设追思会瞒着她

张雪峰奶奶近况令人担忧,4年内子孙相继离世,不设追思会瞒着她

古希腊掌管松饼的神
2026-03-26 11:29:25
坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

南权先生
2026-03-25 15:25:11
张雪峰猝然离世,办公室内景曝光,摆设奇怪,写真照被指像遗照,生前的话字字催泪

张雪峰猝然离世,办公室内景曝光,摆设奇怪,写真照被指像遗照,生前的话字字催泪

笔墨V
2026-03-26 14:53:51
41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

180视角
2026-03-26 13:01:03
斯柯达退出中国?大众中国回应:销售持续至年中,客户将持续获得全面售后支持

斯柯达退出中国?大众中国回应:销售持续至年中,客户将持续获得全面售后支持

澎湃新闻
2026-03-26 17:02:26
一觉醒来,爱吃活鱼的人天塌了,央视曝光的内幕真可怕!

一觉醒来,爱吃活鱼的人天塌了,央视曝光的内幕真可怕!

涛哥锐评
2026-03-26 17:57:04
2026-03-26 20:35:00
学术头条
学术头条
致力于学术传播和科学普及,重点关注AI4Science、大模型等前沿科学进展。
1430文章数 5081关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

房产
教育
旅游
家居
艺术

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

教育要闻

2026人工智能时代下的教育课堂变革

旅游要闻

鲁冰花开啦!快来新乡南太行八里沟 赴一场春日之约

家居要闻

傍海而居 静观蝴蝶海

艺术要闻

哪一座桥不是风景?

无障碍浏览 进入关怀版