网易首页 > 网易号 > 正文 申请入驻

AI诊断准确率超医生20%,芝大揭示AI辅助临床诊断的瓶颈与潜力

0
分享至

当 AI 系统在医学诊断上的表现超过人类专家时,人机协作一定会带来更好的结果吗?来自美国芝加哥大学的一项研究给出了意外的答案。

这项研究专门针对前列腺癌磁共振成像(MRI,Magnetic Resonance Imaging)诊断进行了深入的人机协作实验。之所以选择这个难题,该论文第一作者、芝加哥大学陈诧姹博士对 DeepTech 解释道:“前列腺癌 MRI 诊断是一个真实存在且难度较高的问题。许多以往的 AI 医疗研究所选择的领域,医生诊断的准确率可能已高达 90% 以上,但前列腺 MRI 诊断即使对经验丰富的放射科医生也极具挑战性。”

也就是说,在一个比较难的问题上,AI 可能给人带来的帮助更大,因为 AI 会比人更好,而且人也有更多的进步空间。

研究团队训练了一个基于 nnU-Net 架构的 AI 模型,使用包含 1411 个病例的 PI-CAI 公开数据集。这个模型在测试集上的 AUROC(Area Under the Receiver Operating Characteristic curve,接受者操作特征曲线下面积)分别达到 0.730 和 0.790,明显超过了参与研究的 8 名放射科医生的平均水平(这些医生来自美国和欧洲,年龄在 29 到 52 岁之间,大多具有丰富的前列腺 MRI 诊断经验)。

实验模拟了两种可能的临床 AI 部署场景。第一种是在医生独立诊断后,再提供 AI 的建议作为参考;第二种则是直接将 AI 的建议前置提供给医生。

第一阶段实验中,8 名放射科医生需要对 75 个病例进行三步诊断:先独立诊断,然后查看 AI 预测,最后做出最终判断。30 天后的第二阶段实验里,医生们首先会看到详细的个人表现反馈,包括第一阶段的各项诊断指标,然后在 AI 预测直接展示的情况下诊断 100 个新病例。

研究结果首先证实了 AI 辅助的直接价值,但也揭示了一个更深层次的协作瓶颈。在第一组实验中,放射科医生独立诊断的平均准确率为 63.2%,获得 AI 辅助后,他们的平均准确率提升至 66.2%。然而,这一“人+AI”的协作表现,仍未能超越 AI 模型本身 69.3% 的独立诊断准确率。

原因何在?陈诧姹观察到:虽然医生会更加依赖 AI 的决策,但他们不知道在哪种情况下该相信 AI 的建议。医生并不能分辨出哪些情况下 AI 是对的,哪些情况下 AI 是错的,所以即使他们总体上更信任 AI,最终的准确率提升还是有限。

研究显示,在第一阶段研究中,当医生的初步诊断与 AI 出现分歧时(平均 22.6 个病例),医生只在 4.6 个案例中选择改变自己的判断,改变率仅为 20.4%。且在这些存在分歧的病例中,医生自己的准确率只有 44.4%,远低于总体水平。这说明医生往往在最需要 AI 帮助的时候,反而更坚持自己的判断。

第二阶段实验中,性能反馈和直接展示 AI 建议确实提高了医生对 AI 的采纳率,从第一阶段的 75.5% 上升到 78.4%,但这种提升并没有带来诊断表现的显著改善。看来,简单地告诉医生数据还不够,无法根本改变他们的决策习惯。

既然个体层面的协作存在局限,研究团队便将目光转向了群体决策,探索实现“互补性能”(Complementary Performance)的可能性,即人机团队的表现超越任何一方单独表现的理想状态。他们将 8 位医生在 AI 辅助下做出的诊断结果进行整合,通过“多数票决”(majority vote)的方式形成一个集体的最终决策。

这一策略的效果十分显著。数据显示,这个“人+AI”群体的平均诊断准确率达到了 73.3%,不仅显著优于人类专家的独立表现(63.2%),也首次超越了 AI 模型的独立表现(69.3%)。

“这个结果的意义在于,”陈诧姹强调,“它说明在这个问题上,人类和 AI 确实是可以互补的。只有他们能互补,你最后才能看到一个比任何一方单独表现都更好的结果。”

这一发现表明,虽然让单个医生完美地驾驭 AI 存在困难,但通过群体智慧的机制,人类的经验、直觉与 AI 强大的数据分析能力确实可以实现互补,从而达到最佳诊断效果。这为未来 AI 在临床中的应用模式提供了新的思路:或许重点不应仅仅是为单个医生提供一个“超级工具”,而是构建一个人与 AI 深度融合的“协作团队”。

对于如何更好地实现这种互补,陈诧姹认为,未来的方向包括持续优化 AI 模型本身,使其更加精准。同时,更重要的是要增进医生对 AI 的 理解。“你要告诉他们 AI 模型能做到什么样,有哪些病历是 AI 模型特别擅长的,然后哪些病历 AI 模型可能没有那么好。”通过给予医生关于 AI 模型能力边界的清晰认知和数据反馈,能帮助他们建立更合理、更有效的信任。

相关论文相关以《领域专家能否恰当地依赖 AI?一项关于 AI 辅助前列腺癌 MRI 诊断的案例研究》(Can Domain Experts Rely on AI Appropriately? A Case Study on AI-Assisted Prostate Cancer MRI Diagnosis)为题发表于会议 ACM Conference on Fairness, Accountability, and Transparency [1]。芝加哥大学陈诧姹博士是第一作者,芝加哥大学谭宸浩教授担任通讯作者。

参考资料:

1.https://arxiv.org/pdf/2502.03482v1

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
齐达内坦言:皇马王朝靠C罗支撑!但梅西的高度,C罗永远追不上

齐达内坦言:皇马王朝靠C罗支撑!但梅西的高度,C罗永远追不上

体育闲话说
2026-04-25 18:27:16
西部乱套了!数十人冲突,5人面临禁赛!马刺成最大赢家

西部乱套了!数十人冲突,5人面临禁赛!马刺成最大赢家

阿晞体育
2026-04-26 17:51:53
中日实力悬殊下“逆向潮流”的荒诞

中日实力悬殊下“逆向潮流”的荒诞

小眼睛小世界
2026-04-26 09:18:35
战争5年、6篇长文:一个俄罗斯爱国者的悲怆自白!

战争5年、6篇长文:一个俄罗斯爱国者的悲怆自白!

汉唐智库
2026-04-26 00:06:46
颜宁微博发文:我本人曾经至少两篇CNS论文被审稿人偷信息抢发

颜宁微博发文:我本人曾经至少两篇CNS论文被审稿人偷信息抢发

澎湃新闻
2026-04-26 11:18:27
“好拉胯”!深圳一热门演唱会出现舞台事故,网友纷纷避雷!部门公开回应

“好拉胯”!深圳一热门演唱会出现舞台事故,网友纷纷避雷!部门公开回应

南方都市报
2026-04-26 11:55:52
迪马尔科单赛季意甲17次助攻,创有统计以来新高

迪马尔科单赛季意甲17次助攻,创有统计以来新高

懂球帝
2026-04-27 00:48:55
19岁小伙连吃几天小龙虾,剧烈头痛、行走困难!确诊为“横纹肌溶解症”

19岁小伙连吃几天小龙虾,剧烈头痛、行走困难!确诊为“横纹肌溶解症”

环球网资讯
2026-04-26 07:43:11
无法解释的玄学,不要不信

无法解释的玄学,不要不信

三农老历
2026-04-25 12:36:11
14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

阿讯说天下
2026-04-18 11:52:55
四年暴跌120亿,微信是怎么“杀死”口香糖行业的?

四年暴跌120亿,微信是怎么“杀死”口香糖行业的?

流苏晚晴
2026-04-19 20:34:47
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

李橑在北漂
2026-04-02 10:22:26
28号正式开播!央视黄金档再出王炸!配角阵容堪称神仙打架

28号正式开播!央视黄金档再出王炸!配角阵容堪称神仙打架

乡野小珥
2026-04-27 00:33:15
网友拿光明会成立250周年来质疑华晨宇,粉丝被气得不行

网友拿光明会成立250周年来质疑华晨宇,粉丝被气得不行

映射生活的身影
2026-04-25 18:10:22
不吐不快:车展看了9款大6座SUV,设计撞脸成常态,造车像下饺子

不吐不快:车展看了9款大6座SUV,设计撞脸成常态,造车像下饺子

周哥一影视
2026-04-26 11:27:08
再见贝林厄姆!皇马天才回归!颜值高实力强,高层酝酿变革

再见贝林厄姆!皇马天才回归!颜值高实力强,高层酝酿变革

阿泰希特
2026-04-26 15:25:32
不敢相信!一个全明星榜眼,26岁当打之年,摆上货架没人要

不敢相信!一个全明星榜眼,26岁当打之年,摆上货架没人要

球毛鬼胎
2026-04-24 20:29:51
深圳车主爽翻!停车免费直接翻倍,5月起一年省几千

深圳车主爽翻!停车免费直接翻倍,5月起一年省几千

西莫的艺术宫殿
2026-04-26 09:36:24
71.5%!历史性暴跌,以贷养贷的泡沫崩了

71.5%!历史性暴跌,以贷养贷的泡沫崩了

月满大江流
2026-04-16 13:54:38
笑麻!在高架上看到这个真没有绷住,不是亲眼所见,真不敢相信

笑麻!在高架上看到这个真没有绷住,不是亲眼所见,真不敢相信

黄丽搞笑小能手
2026-04-26 05:57:14
2026-04-27 01:39:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16627文章数 514900关注度
往期回顾 全部

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

头条要闻

特朗普内阁又一女部长落马:强迫男下属为其提供性服务

头条要闻

特朗普内阁又一女部长落马:强迫男下属为其提供性服务

体育要闻

森林狼3比1掘金:逆境中杀出了多孙穆?!

娱乐要闻

仅次《指环王》的美剧,有第二季

财经要闻

事关新就业群体,中办、国办发文

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

时尚
教育
游戏
手机
军事航空

比阔腿裤还时髦?今年夏天一定要有“这条裤子”,减龄又松弛

教育要闻

超燃暴击!孩子们为啥都乐翻天了?!这所人附系学校揭秘

LOL最吸金战队诞生!T1主场坐满15000人,LPL解说满脸羡慕

手机要闻

vivo Y600 Pro配备 6.83 英寸 1.5K 护眼屏,新机明天见!

军事要闻

伊朗总统:不会在压力、威胁下进行谈判

无障碍浏览 进入关怀版