网易首页 > 网易号 > 正文 申请入驻

别让AI当你的私人医生!早期诊断错误率高达80%

0
分享至


人们会向AI寻求各种建议,包括那些本该去问医生的问题。然而,下次当你想对着ChatGPT询问脸上的肿块是否是皮肤癌时,请先了解这样一个事实:研究显示,当前主流AI模型在早期鉴别诊断中,超过80%的情况下都会给出错误答案。

由哈佛大学医学生Arya Rao领衔的研究团队,本周在《JAMA Network Open》期刊上发表了一项研究成果。该研究针对21款主流现成AI模型,在29个标准化临床病例情境中展开了系统测试。结果显示,当这些模型获得完整的医疗信息并被要求给出最终诊断时,表现普遍不错,主流模型的准确率高达91%。然而,在早期鉴别诊断阶段——即医生需要在多种可能性之间权衡、逐步排除某些病症的过程中——超过80%的失败率便暴露出来了。

"我们测试的每一个模型,在绝大多数案例中都失败了,"Rao在一封电子邮件中告诉The Register,"那个阶段不确定性最强,而恰恰就是这些系统最薄弱的地方。"

换句话说,这不过是昨日那个让人焦虑到深夜、在WebMD上越查越慌的经历换了一个面孔重演,只是如今被AI加持,反而可能比你自己判断时更容易出错。

"我们的研究结果表明,在没有经过系统性、全面的人工审核的情况下,目前的现成大语言模型不应被用于面向患者的诊断推理,在患者自我诊断场景中同样存在显著局限,"论文共同作者、麻省总医院放射科医生Marc Succi博士在给我们的邮件中如此表示。

"这些模型可能在缺乏严密推理的情况下仍显得信心十足,在鉴别诊断环节尤为如此,"Succi补充道,他还指出,这种表面上的自信可能进一步加剧本就有焦虑情绪的患者的担忧。

Rao也指出,论文中所说的"失败",并不一定意味着AI完全给出了错误答案,只是没能提供完全正确的答案。她表示,若按照每个案例中各项答对比例的原始准确率来衡量,各模型的得分在63%至78%之间,远高于论文中那个更严格的失败率指标所呈现的结果。

这些原始数据显示,"模型通常只答对了一部分,而非全部正确答案——即便按照更严格的失败率定义,它们被视为失败,实际上也往往是部分正确的,"Rao告诉我们。

尽管如此,研究团队仍坚持认为,那个更严格的失败率定义同样值得重视——尤其是在当下,AI正被大力推广为前线医疗智能体,宣称能在将患者转交给人类医生进行进一步诊断之前,先行缩小诊断范围。

"将大语言模型营销为诊断智能体,恰恰在其最不可靠的地方制造了虚假的信心,"研究团队指出,"在生成鉴别诊断和应对不确定性方面持续出现的失误,说明大语言模型尚不能在前线决策中被信任。"

Succi还表示,最终诊断中较高的成功率并不应该让人放心,他警告称,这类数据可能营造出一种对模型能力的误导性安全感。

"真实的临床推理从更早的阶段就开始了,那时的不确定性最高,而这恰恰是模型最薄弱的地方,"Succi说,"即便最终得出了正确答案,错误的鉴别诊断路径也可能导致延误治疗、进行不必要且存在风险的检查、造成高额费用,以及更多其他问题。"

总而言之,下次当你为某个健康问题辗转焦虑时,别急着上网查,除非你是在找医生的联系方式,以便得到一位真正的人类医生作出的专业诊断。AI,还没准备好。

Q&A

Q1:AI在医疗诊断中的准确率到底有多高?

A:研究显示,当AI获得完整医疗信息并作出最终诊断时,主流模型准确率可达91%。但在早期鉴别诊断阶段,超过80%的案例中AI会给出不完全正确的答案。若按原始准确率衡量,各模型得分在63%至78%之间。

Q2:为什么AI的早期鉴别诊断能力比最终诊断差那么多?

A:早期鉴别诊断需要在信息不完整、不确定性最高的阶段,权衡多种可能性并逐步排除部分病症。研究人员指出,AI模型往往在缺乏严密推理的情况下仍表现出过度自信,无法有效处理高度模糊的临床场景,这正是其最薄弱的环节。

Q3:现在可以用大语言模型辅助患者自我诊断吗?

A:目前不建议。研究团队明确指出,现成的大语言模型在没有经过系统性人工审核的情况下,不应用于面向患者的诊断推理。错误的鉴别诊断路径可能导致延误治疗、不必要的医疗操作及高额费用,患者应寻求专业医生的诊断。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈忠和:69岁不显老,与女儿来往不多,他为大龄儿子的婚事操心

陈忠和:69岁不显老,与女儿来往不多,他为大龄儿子的婚事操心

细品名人
2026-04-18 07:21:48
陈涛一把好牌打稀烂!姜至鹏疑对老实队长口吐莲花 球迷:对口型

陈涛一把好牌打稀烂!姜至鹏疑对老实队长口吐莲花 球迷:对口型

刀锋体育
2026-04-18 10:41:59
北影节红毯:高圆圆美的惊心动魄,被周冬雨吓了一跳,高叶太敢穿

北影节红毯:高圆圆美的惊心动魄,被周冬雨吓了一跳,高叶太敢穿

糊咖娱乐
2026-04-17 11:24:40
大面积闭店!深圳“奶茶一姐”为何输给了河南草根兄弟?

大面积闭店!深圳“奶茶一姐”为何输给了河南草根兄弟?

帅真商业
2026-04-15 18:58:55
中国敢不敢登船查美国运往台湾的军火,美国在赌中国不敢。

中国敢不敢登船查美国运往台湾的军火,美国在赌中国不敢。

安安说
2026-04-18 11:11:26
小仙女要“打拳”,她直接把全身涂黑:你们的拳,打空了

小仙女要“打拳”,她直接把全身涂黑:你们的拳,打空了

红色少女主播
2026-04-17 23:17:45
维特根斯坦的颠覆性启示:为何很多人无法洞察本质?

维特根斯坦的颠覆性启示:为何很多人无法洞察本质?

高天SEKH
2026-04-17 11:19:17
骑士官宣关键球员将缺席对阵猛龙的比赛,哈登公开发声

骑士官宣关键球员将缺席对阵猛龙的比赛,哈登公开发声

海阔山遥YAO
2026-04-18 09:35:47
吃相太难看!莫氏鸡煲爆火后,恶心一幕出现,终走上呆呆妹的老路

吃相太难看!莫氏鸡煲爆火后,恶心一幕出现,终走上呆呆妹的老路

以茶带书
2026-04-15 17:30:12
发现一个残酷真相:被美军抓走的马杜罗,已经被彻底遗忘了?

发现一个残酷真相:被美军抓走的马杜罗,已经被彻底遗忘了?

小樾说历史
2026-04-17 11:52:02
入住成都凯悦嘉轩酒店屋里藏了只蝙蝠 旅客手臂现伤口连打11针疫苗 医生:属狂犬病三级暴露

入住成都凯悦嘉轩酒店屋里藏了只蝙蝠 旅客手臂现伤口连打11针疫苗 医生:属狂犬病三级暴露

信网
2026-04-17 18:11:18
3-0大冷门,中超倒数第一碾压中超第3,52岁于根伟率队迎首胜

3-0大冷门,中超倒数第一碾压中超第3,52岁于根伟率队迎首胜

侧身凌空斩
2026-04-17 21:57:54
赖清德亲自下令叫停,“陆委会”改口堵死恢复两岸直航的口子!

赖清德亲自下令叫停,“陆委会”改口堵死恢复两岸直航的口子!

荆楚寰宇文枢
2026-04-17 22:57:42
干得漂亮!巴基斯坦战机硬核巡航德黑兰,以绝对武力威慑以色列!

干得漂亮!巴基斯坦战机硬核巡航德黑兰,以绝对武力威慑以色列!

慕名而来只为你
2026-04-18 11:11:09
炸锅!人民币历史性逆袭!原油结算占 41%,超越欧元打破美元霸权

炸锅!人民币历史性逆袭!原油结算占 41%,超越欧元打破美元霸权

混沌录
2026-04-17 13:22:05
看上去像“公务员”,其实连编制都没有的6个职业

看上去像“公务员”,其实连编制都没有的6个职业

细说职场
2026-04-12 17:02:40
陪玩陪睡已过时!继关晓彤事件、注射不明物后,娱乐圈再曝潜规则

陪玩陪睡已过时!继关晓彤事件、注射不明物后,娱乐圈再曝潜规则

叨唠
2026-04-17 21:04:39
我国肝癌高发,茶叶是背后的祸因?医生劝告:3种茶才是帮凶

我国肝癌高发,茶叶是背后的祸因?医生劝告:3种茶才是帮凶

岐黄传人孙大夫
2026-04-12 06:30:03
中国速度震惊西方!欧美高管访华后集体焦虑?真相太扎心

中国速度震惊西方!欧美高管访华后集体焦虑?真相太扎心

大卫聊科技
2026-04-17 14:06:36
巨石强森曝光祖父照片:真人版毛伊原型是他

巨石强森曝光祖父照片:真人版毛伊原型是他

影视情报室
2026-04-17 08:42:31
2026-04-18 11:48:49
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
3319文章数 170关注度
往期回顾 全部

科技要闻

传Meta下月拟裁8000 大举清退人力为AI腾位

头条要闻

牛弹琴:特朗普迎来最兴奋的一天 三个细节信息量很大

头条要闻

牛弹琴:特朗普迎来最兴奋的一天 三个细节信息量很大

体育要闻

时隔25年重返英超!没有人再嘲笑他了

娱乐要闻

刘德华挚友潘宏彬离世 曾一起租房住

财经要闻

"影子万科"2.0:管理层如何吸血万物云?

汽车要闻

奇瑞威麟R08 PRO正式上市 售价14.48万元起

态度原创

本地
时尚
教育
游戏
公开课

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

有些衣服,是穿给自己看的

教育要闻

崇华中学学子开展黄河骑行实践活动,50公里丈量母亲河感悟家国担当

远看GTA近看心之眼!IGN4分"拉作"今秋登主机

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版