网易首页 > 网易号 > 正文 申请入驻

AI诊断准确率超医生20%,芝大揭示AI辅助临床诊断的瓶颈与潜力

0
分享至

当 AI 系统在医学诊断上的表现超过人类专家时,人机协作一定会带来更好的结果吗?来自美国芝加哥大学的一项研究给出了意外的答案。

这项研究专门针对前列腺癌磁共振成像(MRI,Magnetic Resonance Imaging)诊断进行了深入的人机协作实验。之所以选择这个难题,该论文第一作者、芝加哥大学陈诧姹博士对 DeepTech 解释道:“前列腺癌 MRI 诊断是一个真实存在且难度较高的问题。许多以往的 AI 医疗研究所选择的领域,医生诊断的准确率可能已高达 90% 以上,但前列腺 MRI 诊断即使对经验丰富的放射科医生也极具挑战性。”

也就是说,在一个比较难的问题上,AI 可能给人带来的帮助更大,因为 AI 会比人更好,而且人也有更多的进步空间。

研究团队训练了一个基于 nnU-Net 架构的 AI 模型,使用包含 1411 个病例的 PI-CAI 公开数据集。这个模型在测试集上的 AUROC(Area Under the Receiver Operating Characteristic curve,接受者操作特征曲线下面积)分别达到 0.730 和 0.790,明显超过了参与研究的 8 名放射科医生的平均水平(这些医生来自美国和欧洲,年龄在 29 到 52 岁之间,大多具有丰富的前列腺 MRI 诊断经验)。

实验模拟了两种可能的临床 AI 部署场景。第一种是在医生独立诊断后,再提供 AI 的建议作为参考;第二种则是直接将 AI 的建议前置提供给医生。

第一阶段实验中,8 名放射科医生需要对 75 个病例进行三步诊断:先独立诊断,然后查看 AI 预测,最后做出最终判断。30 天后的第二阶段实验里,医生们首先会看到详细的个人表现反馈,包括第一阶段的各项诊断指标,然后在 AI 预测直接展示的情况下诊断 100 个新病例。

研究结果首先证实了 AI 辅助的直接价值,但也揭示了一个更深层次的协作瓶颈。在第一组实验中,放射科医生独立诊断的平均准确率为 63.2%,获得 AI 辅助后,他们的平均准确率提升至 66.2%。然而,这一“人+AI”的协作表现,仍未能超越 AI 模型本身 69.3% 的独立诊断准确率。

原因何在?陈诧姹观察到:虽然医生会更加依赖 AI 的决策,但他们不知道在哪种情况下该相信 AI 的建议。医生并不能分辨出哪些情况下 AI 是对的,哪些情况下 AI 是错的,所以即使他们总体上更信任 AI,最终的准确率提升还是有限。

研究显示,在第一阶段研究中,当医生的初步诊断与 AI 出现分歧时(平均 22.6 个病例),医生只在 4.6 个案例中选择改变自己的判断,改变率仅为 20.4%。且在这些存在分歧的病例中,医生自己的准确率只有 44.4%,远低于总体水平。这说明医生往往在最需要 AI 帮助的时候,反而更坚持自己的判断。

第二阶段实验中,性能反馈和直接展示 AI 建议确实提高了医生对 AI 的采纳率,从第一阶段的 75.5% 上升到 78.4%,但这种提升并没有带来诊断表现的显著改善。看来,简单地告诉医生数据还不够,无法根本改变他们的决策习惯。

既然个体层面的协作存在局限,研究团队便将目光转向了群体决策,探索实现“互补性能”(Complementary Performance)的可能性,即人机团队的表现超越任何一方单独表现的理想状态。他们将 8 位医生在 AI 辅助下做出的诊断结果进行整合,通过“多数票决”(majority vote)的方式形成一个集体的最终决策。

这一策略的效果十分显著。数据显示,这个“人+AI”群体的平均诊断准确率达到了 73.3%,不仅显著优于人类专家的独立表现(63.2%),也首次超越了 AI 模型的独立表现(69.3%)。

“这个结果的意义在于,”陈诧姹强调,“它说明在这个问题上,人类和 AI 确实是可以互补的。只有他们能互补,你最后才能看到一个比任何一方单独表现都更好的结果。”

这一发现表明,虽然让单个医生完美地驾驭 AI 存在困难,但通过群体智慧的机制,人类的经验、直觉与 AI 强大的数据分析能力确实可以实现互补,从而达到最佳诊断效果。这为未来 AI 在临床中的应用模式提供了新的思路:或许重点不应仅仅是为单个医生提供一个“超级工具”,而是构建一个人与 AI 深度融合的“协作团队”。

对于如何更好地实现这种互补,陈诧姹认为,未来的方向包括持续优化 AI 模型本身,使其更加精准。同时,更重要的是要增进医生对 AI 的 理解。“你要告诉他们 AI 模型能做到什么样,有哪些病历是 AI 模型特别擅长的,然后哪些病历 AI 模型可能没有那么好。”通过给予医生关于 AI 模型能力边界的清晰认知和数据反馈,能帮助他们建立更合理、更有效的信任。

相关论文相关以《领域专家能否恰当地依赖 AI?一项关于 AI 辅助前列腺癌 MRI 诊断的案例研究》(Can Domain Experts Rely on AI Appropriately? A Case Study on AI-Assisted Prostate Cancer MRI Diagnosis)为题发表于会议 ACM Conference on Fairness, Accountability, and Transparency [1]。芝加哥大学陈诧姹博士是第一作者,芝加哥大学谭宸浩教授担任通讯作者。

参考资料:

1.https://arxiv.org/pdf/2502.03482v1

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
公益一类二类事业单位改革,多种事业编实行员额制,签订劳动合同

公益一类二类事业单位改革,多种事业编实行员额制,签订劳动合同

马蹄烫嘴说美食
2026-03-26 13:59:16
以色列坑惨了美国?特朗普大倒苦水,赶在开战前,伊朗布下死局

以色列坑惨了美国?特朗普大倒苦水,赶在开战前,伊朗布下死局

阿芒娱乐说
2026-03-26 16:15:00
人老了,搞垮自己最快的方式就是:胡思乱想、过度操心、情绪失控

人老了,搞垮自己最快的方式就是:胡思乱想、过度操心、情绪失控

风起见你
2026-03-16 11:07:25
14.99万!“史上最便宜”特斯拉来了

14.99万!“史上最便宜”特斯拉来了

首席品牌观察
2026-03-24 16:18:39
赚麻了!深圳32座“最吸金”商场曝光,网友:第二名封神了!

赚麻了!深圳32座“最吸金”商场曝光,网友:第二名封神了!

深圳买房计划
2026-03-25 22:26:10
研究所所长猥亵下属后续,女主多张高清照曝光,知情人再爆料

研究所所长猥亵下属后续,女主多张高清照曝光,知情人再爆料

观察鉴娱
2026-03-26 09:25:28
最近全网都在夸陈若琳长得好看,我真的想说:别光看脸啊

最近全网都在夸陈若琳长得好看,我真的想说:别光看脸啊

小光侃娱乐
2026-03-26 06:55:03
成都宝妈近一年狂扫5套“老破小”!地铁口+软装实现以租养贷

成都宝妈近一年狂扫5套“老破小”!地铁口+软装实现以租养贷

封面新闻
2026-03-25 21:28:05
黄金,注意!无敌扫荡又要开始了!

黄金,注意!无敌扫荡又要开始了!

杨子黄金
2026-03-26 09:06:53
对越反击战期间,越南女兵的诡计有多离谱?敢将自己脱得赤条条的

对越反击战期间,越南女兵的诡计有多离谱?敢将自己脱得赤条条的

抽象派大师
2026-03-26 10:58:00
拒绝回归WCBA!李月汝再赴美国,官宣重磅决定,韩旭也要这么干了

拒绝回归WCBA!李月汝再赴美国,官宣重磅决定,韩旭也要这么干了

萌兰聊个球
2026-03-26 13:09:33
举火烧天!杨瀚森接球顺下单臂隔扣班克斯,目前9中9独揽20分

举火烧天!杨瀚森接球顺下单臂隔扣班克斯,目前9中9独揽20分

懂球帝
2026-03-26 10:15:02
李双江庆87岁大寿!怒吼要奋斗到90岁,切不动蛋糕戴玉强扶手帮忙

李双江庆87岁大寿!怒吼要奋斗到90岁,切不动蛋糕戴玉强扶手帮忙

嫹笔牂牂
2026-03-26 07:37:49
马英九真正翻脸原因是郑丽文聘请王金平为最高顾问,把马晾在一边

马英九真正翻脸原因是郑丽文聘请王金平为最高顾问,把马晾在一边

雪中风车
2026-03-26 09:16:02
破案!陈家政表现神勇杜锋却全程黑脸原因找到,现场球迷说出实情

破案!陈家政表现神勇杜锋却全程黑脸原因找到,现场球迷说出实情

后仰大风车
2026-03-26 08:15:08
人民日报专访陈梦!不谈金牌退役,句句不提孙颖莎,却字字藏着她

人民日报专访陈梦!不谈金牌退役,句句不提孙颖莎,却字字藏着她

林雁飞
2026-03-25 16:09:46
“史诗狂怒”行动印证美军A-10攻击机无可替代的近距空中支援作用

“史诗狂怒”行动印证美军A-10攻击机无可替代的近距空中支援作用

假如明天来临
2026-03-23 12:10:03
快讯!美国要打大仗了!

快讯!美国要打大仗了!

达文西看世界
2026-03-26 09:29:08
史诗级!曝1.7亿“顶星”空降阿森纳!两大攻击手遭“打包”放逐

史诗级!曝1.7亿“顶星”空降阿森纳!两大攻击手遭“打包”放逐

头狼追球
2026-03-26 13:48:03
伊朗发射导弹以色列多地响防空警报

伊朗发射导弹以色列多地响防空警报

财联社
2026-03-26 14:39:05
2026-03-26 17:27:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16488文章数 514797关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

旅游
本地
亲子
家居
公开课

旅游要闻

德阳绵竹:赏花、览文旅精品......沿山旅游“火”起来

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

亲子要闻

妈妈是时尚小达人爸爸是朴素老模范!我要当爸爸的专属赞助人

家居要闻

傍海而居 静观蝴蝶海

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版