网易首页 > 网易号 > 正文 申请入驻

AI诊断准确率超医生20%,芝大揭示AI辅助临床诊断的瓶颈与潜力

0
分享至

当 AI 系统在医学诊断上的表现超过人类专家时,人机协作一定会带来更好的结果吗?来自美国芝加哥大学的一项研究给出了意外的答案。

这项研究专门针对前列腺癌磁共振成像(MRI,Magnetic Resonance Imaging)诊断进行了深入的人机协作实验。之所以选择这个难题,该论文第一作者、芝加哥大学陈诧姹博士对 DeepTech 解释道:“前列腺癌 MRI 诊断是一个真实存在且难度较高的问题。许多以往的 AI 医疗研究所选择的领域,医生诊断的准确率可能已高达 90% 以上,但前列腺 MRI 诊断即使对经验丰富的放射科医生也极具挑战性。”

也就是说,在一个比较难的问题上,AI 可能给人带来的帮助更大,因为 AI 会比人更好,而且人也有更多的进步空间。

研究团队训练了一个基于 nnU-Net 架构的 AI 模型,使用包含 1411 个病例的 PI-CAI 公开数据集。这个模型在测试集上的 AUROC(Area Under the Receiver Operating Characteristic curve,接受者操作特征曲线下面积)分别达到 0.730 和 0.790,明显超过了参与研究的 8 名放射科医生的平均水平(这些医生来自美国和欧洲,年龄在 29 到 52 岁之间,大多具有丰富的前列腺 MRI 诊断经验)。

实验模拟了两种可能的临床 AI 部署场景。第一种是在医生独立诊断后,再提供 AI 的建议作为参考;第二种则是直接将 AI 的建议前置提供给医生。

第一阶段实验中,8 名放射科医生需要对 75 个病例进行三步诊断:先独立诊断,然后查看 AI 预测,最后做出最终判断。30 天后的第二阶段实验里,医生们首先会看到详细的个人表现反馈,包括第一阶段的各项诊断指标,然后在 AI 预测直接展示的情况下诊断 100 个新病例。

研究结果首先证实了 AI 辅助的直接价值,但也揭示了一个更深层次的协作瓶颈。在第一组实验中,放射科医生独立诊断的平均准确率为 63.2%,获得 AI 辅助后,他们的平均准确率提升至 66.2%。然而,这一“人+AI”的协作表现,仍未能超越 AI 模型本身 69.3% 的独立诊断准确率。

原因何在?陈诧姹观察到:虽然医生会更加依赖 AI 的决策,但他们不知道在哪种情况下该相信 AI 的建议。医生并不能分辨出哪些情况下 AI 是对的,哪些情况下 AI 是错的,所以即使他们总体上更信任 AI,最终的准确率提升还是有限。

研究显示,在第一阶段研究中,当医生的初步诊断与 AI 出现分歧时(平均 22.6 个病例),医生只在 4.6 个案例中选择改变自己的判断,改变率仅为 20.4%。且在这些存在分歧的病例中,医生自己的准确率只有 44.4%,远低于总体水平。这说明医生往往在最需要 AI 帮助的时候,反而更坚持自己的判断。

第二阶段实验中,性能反馈和直接展示 AI 建议确实提高了医生对 AI 的采纳率,从第一阶段的 75.5% 上升到 78.4%,但这种提升并没有带来诊断表现的显著改善。看来,简单地告诉医生数据还不够,无法根本改变他们的决策习惯。

既然个体层面的协作存在局限,研究团队便将目光转向了群体决策,探索实现“互补性能”(Complementary Performance)的可能性,即人机团队的表现超越任何一方单独表现的理想状态。他们将 8 位医生在 AI 辅助下做出的诊断结果进行整合,通过“多数票决”(majority vote)的方式形成一个集体的最终决策。

这一策略的效果十分显著。数据显示,这个“人+AI”群体的平均诊断准确率达到了 73.3%,不仅显著优于人类专家的独立表现(63.2%),也首次超越了 AI 模型的独立表现(69.3%)。

“这个结果的意义在于,”陈诧姹强调,“它说明在这个问题上,人类和 AI 确实是可以互补的。只有他们能互补,你最后才能看到一个比任何一方单独表现都更好的结果。”

这一发现表明,虽然让单个医生完美地驾驭 AI 存在困难,但通过群体智慧的机制,人类的经验、直觉与 AI 强大的数据分析能力确实可以实现互补,从而达到最佳诊断效果。这为未来 AI 在临床中的应用模式提供了新的思路:或许重点不应仅仅是为单个医生提供一个“超级工具”,而是构建一个人与 AI 深度融合的“协作团队”。

对于如何更好地实现这种互补,陈诧姹认为,未来的方向包括持续优化 AI 模型本身,使其更加精准。同时,更重要的是要增进医生对 AI 的 理解。“你要告诉他们 AI 模型能做到什么样,有哪些病历是 AI 模型特别擅长的,然后哪些病历 AI 模型可能没有那么好。”通过给予医生关于 AI 模型能力边界的清晰认知和数据反馈,能帮助他们建立更合理、更有效的信任。

相关论文相关以《领域专家能否恰当地依赖 AI?一项关于 AI 辅助前列腺癌 MRI 诊断的案例研究》(Can Domain Experts Rely on AI Appropriately? A Case Study on AI-Assisted Prostate Cancer MRI Diagnosis)为题发表于会议 ACM Conference on Fairness, Accountability, and Transparency [1]。芝加哥大学陈诧姹博士是第一作者,芝加哥大学谭宸浩教授担任通讯作者。

参考资料:

1.https://arxiv.org/pdf/2502.03482v1

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
逆转中国台北,男篮3人优秀,1人最差,赢球功臣锁定,出线稳了

逆转中国台北,男篮3人优秀,1人最差,赢球功臣锁定,出线稳了

现代小青青慕慕
2026-03-02 02:12:30
蒙古为何成为韩国老男人的圣地?带你去瞧瞧这个可悲的国家

蒙古为何成为韩国老男人的圣地?带你去瞧瞧这个可悲的国家

吕醿极限手工
2025-12-29 18:33:00
内维尔:桑切斯今天表现得很差,几乎是完全失控了

内维尔:桑切斯今天表现得很差,几乎是完全失控了

懂球帝
2026-03-02 02:30:47
透露S妈悲伤过度被送急诊,她表示很久没有见小玥儿,小箖箖

透露S妈悲伤过度被送急诊,她表示很久没有见小玥儿,小箖箖

情感大头说说
2026-03-02 00:18:09
罗德里戈:内马尔入选世界杯大名单不存在争议,我们需要他

罗德里戈:内马尔入选世界杯大名单不存在争议,我们需要他

懂球帝
2026-03-01 21:09:57
2023年,100岁的基辛格预测:若爆发三战,敢打美国本土仅3个国家

2023年,100岁的基辛格预测:若爆发三战,敢打美国本土仅3个国家

李哥三观很正
2024-09-01 04:23:53
曾经的重点大学沦为双非!这4所高校实力堪比211,录取分却被低估

曾经的重点大学沦为双非!这4所高校实力堪比211,录取分却被低估

Delete丨CC
2026-03-01 19:43:25
全球首款机器人手机!荣耀Robot Phone亮相MWC:今年就量产发布

全球首款机器人手机!荣耀Robot Phone亮相MWC:今年就量产发布

快科技
2026-03-01 22:45:20
亚马尔闪耀背后,放大了巴萨1个棘手问题,3大球星全难成主力

亚马尔闪耀背后,放大了巴萨1个棘手问题,3大球星全难成主力

晚雾空青
2026-03-02 01:33:19
自称无法获得世界宽恕后,中央媒体对谷爱凌的称呼发生变化

自称无法获得世界宽恕后,中央媒体对谷爱凌的称呼发生变化

陈意小可爱
2026-03-01 13:17:13
国家最大的敌人,是愚昧和僵化

国家最大的敌人,是愚昧和僵化

深度报
2026-02-06 22:28:05
放假半天!不补休

放假半天!不补休

小易商丘
2026-03-01 10:00:47
胡春华发表署名文章

胡春华发表署名文章

社评
2025-10-31 10:11:37
褚时健到2002年才明白,原来当年是得罪了惹不起的那几位

褚时健到2002年才明白,原来当年是得罪了惹不起的那几位

阿柒的讯
2026-02-24 15:07:34
这女的真不讲究

这女的真不讲究

太急张三疯
2026-02-14 19:35:03
1980年邓小平说:毛主席的错误,要毫不含糊地批评,但要实事求是

1980年邓小平说:毛主席的错误,要毫不含糊地批评,但要实事求是

帝哥说史
2026-02-25 06:30:03
意外!这是中超冠军?上港全场0射正,新外援被北京国安踢哭了

意外!这是中超冠军?上港全场0射正,新外援被北京国安踢哭了

罗掌柜体育
2026-03-01 18:54:02
美国女子:我告知移民局特工患有自闭症后,他们将我从车里拖出来

美国女子:我告知移民局特工患有自闭症后,他们将我从车里拖出来

倾世璃歌
2026-02-06 13:05:02
哈梅内伊之死成“遇害”,哈尼亚死后页面变黑白,异国孝行感天地

哈梅内伊之死成“遇害”,哈尼亚死后页面变黑白,异国孝行感天地

山间听雨
2026-03-01 20:59:10
特朗普可能会成为美国历史上最倒霉的总统,在特殊的时刻当上总统

特朗普可能会成为美国历史上最倒霉的总统,在特殊的时刻当上总统

百态人间
2026-02-09 15:39:25
2026-03-02 04:27:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16343文章数 514683关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

特朗普警告伊朗“不要报复” 伊朗外长回应

头条要闻

特朗普警告伊朗“不要报复” 伊朗外长回应

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

黄景瑜 李雪健坐镇!38集犯罪大剧来袭

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

本地
家居
时尚
公开课
军事航空

本地新闻

津南好·四时总相宜

家居要闻

素色肌理 品意式格调

今年春天最流行的4件卫衣,照着穿就很好看

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗前总统内贾德遇袭身亡

无障碍浏览 进入关怀版