网易首页 > 网易号 > 正文 申请入驻

别让AI当你的私人医生!早期诊断错误率高达80%

0
分享至


人们会向AI寻求各种建议,包括那些本该去问医生的问题。然而,下次当你想对着ChatGPT询问脸上的肿块是否是皮肤癌时,请先了解这样一个事实:研究显示,当前主流AI模型在早期鉴别诊断中,超过80%的情况下都会给出错误答案。

由哈佛大学医学生Arya Rao领衔的研究团队,本周在《JAMA Network Open》期刊上发表了一项研究成果。该研究针对21款主流现成AI模型,在29个标准化临床病例情境中展开了系统测试。结果显示,当这些模型获得完整的医疗信息并被要求给出最终诊断时,表现普遍不错,主流模型的准确率高达91%。然而,在早期鉴别诊断阶段——即医生需要在多种可能性之间权衡、逐步排除某些病症的过程中——超过80%的失败率便暴露出来了。

"我们测试的每一个模型,在绝大多数案例中都失败了,"Rao在一封电子邮件中告诉The Register,"那个阶段不确定性最强,而恰恰就是这些系统最薄弱的地方。"

换句话说,这不过是昨日那个让人焦虑到深夜、在WebMD上越查越慌的经历换了一个面孔重演,只是如今被AI加持,反而可能比你自己判断时更容易出错。

"我们的研究结果表明,在没有经过系统性、全面的人工审核的情况下,目前的现成大语言模型不应被用于面向患者的诊断推理,在患者自我诊断场景中同样存在显著局限,"论文共同作者、麻省总医院放射科医生Marc Succi博士在给我们的邮件中如此表示。

"这些模型可能在缺乏严密推理的情况下仍显得信心十足,在鉴别诊断环节尤为如此,"Succi补充道,他还指出,这种表面上的自信可能进一步加剧本就有焦虑情绪的患者的担忧。

Rao也指出,论文中所说的"失败",并不一定意味着AI完全给出了错误答案,只是没能提供完全正确的答案。她表示,若按照每个案例中各项答对比例的原始准确率来衡量,各模型的得分在63%至78%之间,远高于论文中那个更严格的失败率指标所呈现的结果。

这些原始数据显示,"模型通常只答对了一部分,而非全部正确答案——即便按照更严格的失败率定义,它们被视为失败,实际上也往往是部分正确的,"Rao告诉我们。

尽管如此,研究团队仍坚持认为,那个更严格的失败率定义同样值得重视——尤其是在当下,AI正被大力推广为前线医疗智能体,宣称能在将患者转交给人类医生进行进一步诊断之前,先行缩小诊断范围。

"将大语言模型营销为诊断智能体,恰恰在其最不可靠的地方制造了虚假的信心,"研究团队指出,"在生成鉴别诊断和应对不确定性方面持续出现的失误,说明大语言模型尚不能在前线决策中被信任。"

Succi还表示,最终诊断中较高的成功率并不应该让人放心,他警告称,这类数据可能营造出一种对模型能力的误导性安全感。

"真实的临床推理从更早的阶段就开始了,那时的不确定性最高,而这恰恰是模型最薄弱的地方,"Succi说,"即便最终得出了正确答案,错误的鉴别诊断路径也可能导致延误治疗、进行不必要且存在风险的检查、造成高额费用,以及更多其他问题。"

总而言之,下次当你为某个健康问题辗转焦虑时,别急着上网查,除非你是在找医生的联系方式,以便得到一位真正的人类医生作出的专业诊断。AI,还没准备好。

Q&A

Q1:AI在医疗诊断中的准确率到底有多高?

A:研究显示,当AI获得完整医疗信息并作出最终诊断时,主流模型准确率可达91%。但在早期鉴别诊断阶段,超过80%的案例中AI会给出不完全正确的答案。若按原始准确率衡量,各模型得分在63%至78%之间。

Q2:为什么AI的早期鉴别诊断能力比最终诊断差那么多?

A:早期鉴别诊断需要在信息不完整、不确定性最高的阶段,权衡多种可能性并逐步排除部分病症。研究人员指出,AI模型往往在缺乏严密推理的情况下仍表现出过度自信,无法有效处理高度模糊的临床场景,这正是其最薄弱的环节。

Q3:现在可以用大语言模型辅助患者自我诊断吗?

A:目前不建议。研究团队明确指出,现成的大语言模型在没有经过系统性人工审核的情况下,不应用于面向患者的诊断推理。错误的鉴别诊断路径可能导致延误治疗、不必要的医疗操作及高额费用,患者应寻求专业医生的诊断。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
弟弟5岁走失,20年后我去求职,看到对面老板戴父亲遗物当场愣住

弟弟5岁走失,20年后我去求职,看到对面老板戴父亲遗物当场愣住

千秋文化
2026-05-12 20:13:46
A股:紧急提醒2.5亿股民!从6月3日起,A股或将重启反弹浪大行情?

A股:紧急提醒2.5亿股民!从6月3日起,A股或将重启反弹浪大行情?

趋势清风侠
2026-06-02 15:46:46
2026世界杯最凶险小组!德国96%出线概率也白搭?

2026世界杯最凶险小组!德国96%出线概率也白搭?

格斗社
2026-06-02 08:14:08
刘浩存一句话,揭开窦骁何超莲真实关系,奚梦瑶的婚礼不“香”了

刘浩存一句话,揭开窦骁何超莲真实关系,奚梦瑶的婚礼不“香”了

生命之泉的奥秘
2026-06-02 19:07:47
2026世界杯夺冠预测!巴西没希望,阿根廷概率小,最大赢家或是它

2026世界杯夺冠预测!巴西没希望,阿根廷概率小,最大赢家或是它

法老不说教
2026-06-02 21:07:31
禁投美股,难得全球大国中惟一正确

禁投美股,难得全球大国中惟一正确

家传编辑部
2026-05-30 12:24:47
她是文强的妻子,被判刑8年,将弟弟也害了,出狱后她现状如何?

她是文强的妻子,被判刑8年,将弟弟也害了,出狱后她现状如何?

细品名人
2026-06-02 07:08:23
电子眼抓拍有规律!记住7点,2026开车全年不扣分不被罚真的不难

电子眼抓拍有规律!记住7点,2026开车全年不扣分不被罚真的不难

沙雕小琳琳
2026-05-31 14:51:29
法网女单太残酷了:随着斯维托丽娜1-2出局,世界前十仅剩2人

法网女单太残酷了:随着斯维托丽娜1-2出局,世界前十仅剩2人

侧身凌空斩
2026-06-02 20:28:22
因弄坏朋友家沐浴露怕挨打 9岁女童离家出走 失联22年后终团圆

因弄坏朋友家沐浴露怕挨打 9岁女童离家出走 失联22年后终团圆

闪电新闻
2026-06-02 14:33:41
宁德时代官宣钠电池将量产,钠电池有何优劣?会取代锂电池吗?

宁德时代官宣钠电池将量产,钠电池有何优劣?会取代锂电池吗?

之乎者也小鱼儿
2026-06-01 16:19:25
伊朗媒体新发布最高领袖穆杰塔巴·哈梅内伊照片

伊朗媒体新发布最高领袖穆杰塔巴·哈梅内伊照片

环球网资讯
2026-06-02 11:52:10
美国人发现,美国近三十年来最大外交失误,可能就是阻止中国统一

美国人发现,美国近三十年来最大外交失误,可能就是阻止中国统一

流史岁月
2026-05-31 12:00:13
2-0击败强敌,19岁俄罗斯新锐强势晋级法网女单四强,追平最佳战绩

2-0击败强敌,19岁俄罗斯新锐强势晋级法网女单四强,追平最佳战绩

侧身凌空斩
2026-06-02 18:20:57
有性生活和没性生活,身体会出卖你!第三个区别,很多人没想到

有性生活和没性生活,身体会出卖你!第三个区别,很多人没想到

健康科普365
2026-05-30 16:30:29
中国股市唯一赚钱最快思路:持有一只股,保留30%仓位,长期做T!

中国股市唯一赚钱最快思路:持有一只股,保留30%仓位,长期做T!

股经纵横谈
2026-05-15 19:18:34
过于狂妄!迪班萨:如果奇才选我为状元 吹杨需要将3号球衣让出来

过于狂妄!迪班萨:如果奇才选我为状元 吹杨需要将3号球衣让出来

仰卧撑FTUer
2026-06-02 10:43:05
孙铭徽被边缘化广厦强势反弹,3比1,上海回主场夺冠多赚一千万

孙铭徽被边缘化广厦强势反弹,3比1,上海回主场夺冠多赚一千万

姜大叔侃球
2026-06-02 22:02:50
广厦男篮101-93战胜上海,球员评分3满分2优秀1及格

广厦男篮101-93战胜上海,球员评分3满分2优秀1及格

五姑娘台球
2026-06-02 22:09:21
全体致敬!37 岁窦骁高调官宣喜讯,“豪门赘婿” 已经彻底成过去

全体致敬!37 岁窦骁高调官宣喜讯,“豪门赘婿” 已经彻底成过去

凡知
2026-06-01 13:26:35
2026-06-02 22:43:00
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
3473文章数 171关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

小学教师疑因打井纠纷杀害邻居 死者留下两未成年儿子

头条要闻

小学教师疑因打井纠纷杀害邻居 死者留下两未成年儿子

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

数码
旅游
游戏
手机
公开课

数码要闻

华为nova 16系列发布:2999元起 全系配备后置红枫原色镜头

旅游要闻

奶奶,童话是真的!儿童节前一天上海迪士尼短暂的自由,开心!

黑神话后遗症!海外玩家见中式动作一律默认悟空新作

手机要闻

折叠屏“iPhone Ultra”或配备液态金属铰链 原型机已送测运营商

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版