网易首页 > 网易号 > 正文 申请入驻

研究称ChatGPT Health在近半数医疗急症中低估病情延误诊治

0
分享至

一项最新发表在《自然·医学》的研究发现,OpenAI 面向医疗场景推出的聊天机器人 ChatGPT Health 在为病例分级(分诊)时,常常低估医疗急症的严重程度。 研究团队向该系统输入了 60 个基于真实世界的医疗案例,并将其给出的分诊建议与三名临床医生依据指南和经验做出的判断进行对比。


结果显示,在被医生认定应立即前往急诊科的病例中,ChatGPT Health 有 51.6% 被判定为“可以在 24 至 48 小时内看医生”,也就是所谓“低分级”。 被归入急症的情况包括糖尿病酮症酸中毒、即将发生呼吸衰竭等若不及时救治将导致死亡的严重疾病。 研究第一作者、纽约市西奈山医院泌尿科讲师 Ashwin Ramaswamy 指出,任何受过一定训练的医生都会认为,这类患者必须立即送往急诊科,而聊天机器人似乎在“等待病情严重到无可否认”时才会建议去急诊。 不过,对于症状极为典型的卒中等急症,ChatGPT Health 在本研究中则实现了 100% 的准确分级。

该研究还考察了系统在不同人口学特征下的表现:每个病例被制作成 16 种变体,改变患者的性别、种族等信息,但根据设计,无论变体如何,结论都应相同。 研究未发现因性别或种族变化而导致结果系统性偏差的证据。

研究也发现,ChatGPT Health 在非紧急病例上则存在相反的问题:与医生相比,它对 64.8% 的非急症病例给出了“过度分级”,例如要求一名仅有三天喉咙痛、在家庭护理即可的患者在 24 至 48 小时内就诊。 Ramaswamy 表示,他很难看出该模型在不同场景下做出这些建议的内在逻辑,称其风险判断“与临床风险有点倒挂、近乎相反”。

在涉及自杀意念或自残风险的情境中,ChatGPT Health 的表现同样不稳定。 OpenAI 的政策规定,当用户表达自杀倾向时,聊天机器人应引导其拨打美国全国自杀与危机热线 988,ChatGPT Health 也遵循同样机制。 但在这项研究中,系统有时会在并不需要时建议拨打 988,而在确有必要时却未能给出这一建议。

针对研究结论,OpenAI 发言人表示,公司欢迎有关人工智能在医疗领域应用的研究,但认为这项研究的设计并不代表 ChatGPT Health 的典型使用方式或预期使用场景。 按照 OpenAI 的说法,ChatGPT Health 的交互模式是鼓励用户持续追问,以提供更多背景信息,而非依赖它对单一描述作出一次性判断。 目前 ChatGPT Health 仍仅向有限用户开放,OpenAI 正继续改进模型的安全性和可靠性,尚未全面推广。 官方资料同时强调,该产品“并非用于诊断或治疗”,而是建立在更安全的平台上,允许用户上传更为敏感的个人医疗信息。

OpenAI 今年 1 月公布的报告显示,全球已有逾 4000 万人使用 ChatGPT 回答健康相关问题,每周约有近 200 万条对话与医疗保险有关,其中绝大部分健康咨询发生在医生正常坐诊时间之外,且每周超过 50 万条消息来自距离医院车程 30 分钟以上的地区。 研究者指出,AI 工具对这些人而言极具吸引力,因为获取成本低、问答次数没有限制,用户可以上传所有想要讨论的文件和细节。 在 Ramaswamy 看来,不少人寻求的已不只是建议,更是一种“医疗陪伴者”式的交互体验。

不过,多位未参与研究的专家提醒,不应高估当前聊天机器人的医疗能力。 加州大学洛杉矶分校健康系统的内科医生 John Mafi 表示,任何会影响生命安全的 AI 医疗产品在大规模推广前,都必须通过严格的随机对照试验来证明利大于弊。 专家们普遍认为,聊天机器人在很多场景下可以提供有用的健康信息,但目前仍难以替代医生的面诊判断。

杜克大学生物统计与计算机科学系助理教授 Monica Agrawal 指出,外界对大型语言模型的训练数据和训练方式仍缺乏透明了解,现有许多评估指标(例如在执照考试中的高分)并不能直接代表其真实行医能力。 她还提到,大型语言模型具有“迎合性”,倾向于附和用户的观点,即便这些观点不准确,这可能强化患者原有的误解和偏见。 Mafi 则补充说,AI 工具是“被设计出来取悦你的”,但医生有时必须说出患者并不愿听的话。

在是否可以安全依赖聊天机器人提供医疗建议的问题上,Ramaswamy 的看法是,至少在当前阶段答案是否定的,尤其在急症情形更不应依赖 AI,而应优先联系医生或急诊服务。 新加坡 AI 研究网络 ARISE 执行主任 Ethan Goh 则认为,在许多具体情境下,AI 确实可以给出安全可行的建议,但关键在于用户要清楚其局限性,不应将其视作医生的替代品。 专家们强调,未来更安全的方向是将 AI 与医生结合使用,通过医疗机构与科技公司之间更紧密的合作,对工具进行持续的监管和改进。

Ramaswamy 表示,如果模型能力不断提升,在偏远地区或医疗资源匮乏的全球卫生场景中,建立“患者—AI—医生”三方协作关系,可能给患者带来实实在在的好处。 但在此之前,如何在真正影响生命的决策前,对这些系统进行足够严格的评估与约束,仍是摆在医疗和科技行业面前的一道难题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美驻日大使:如果中国不按美国的意愿行事,就让十四亿人陷入饥荒

美驻日大使:如果中国不按美国的意愿行事,就让十四亿人陷入饥荒

荆楚寰宇文枢
2025-09-28 21:58:22
大家断崖式衰老都是在多少岁? 网友的回答很扎心了,满是无奈

大家断崖式衰老都是在多少岁? 网友的回答很扎心了,满是无奈

另子维爱读史
2025-12-26 16:31:13
王毅外长:今后世上再无“中国台湾省”之外的任何模糊称谓。

王毅外长:今后世上再无“中国台湾省”之外的任何模糊称谓。

南权先生
2026-02-02 15:59:44
伊朗战火未熄,急开首次拉美峰会,特朗普高举“美洲之盾”要防谁的矛

伊朗战火未熄,急开首次拉美峰会,特朗普高举“美洲之盾”要防谁的矛

极目新闻
2026-03-05 21:00:25
恭喜!香港知名富商宣布将结婚,在自家四层高豪宅吊威亚求婚成功

恭喜!香港知名富商宣布将结婚,在自家四层高豪宅吊威亚求婚成功

阿策聊实事
2026-03-06 01:38:14
英媒爆出猛料:中国或违反联合国规定,运送超高音速导弹给伊朗!

英媒爆出猛料:中国或违反联合国规定,运送超高音速导弹给伊朗!

始于初见见
2026-03-02 19:33:23
美国恨透了中国北斗,却不敢轻易干扰北斗信号,美在害怕什么?

美国恨透了中国北斗,却不敢轻易干扰北斗信号,美在害怕什么?

阿纂看事
2026-03-04 11:40:53
大摩详解:伊朗战火持续升级 黄金为何不涨反跌?

大摩详解:伊朗战火持续升级 黄金为何不涨反跌?

财联社
2026-03-05 18:22:06
迪丽热巴被困迪拜最新!家属证实她已死里逃生,但麻烦事还在后面

迪丽热巴被困迪拜最新!家属证实她已死里逃生,但麻烦事还在后面

潮鹿逐梦
2026-03-04 18:33:10
淡水悖论:一个令科学家百思不得其解的谜题

淡水悖论:一个令科学家百思不得其解的谜题

魅力科学君
2026-03-04 18:11:29
女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

特约前排观众
2026-02-09 00:05:05
不能二次加热的4种食物!专家提醒:吃不完或倒掉,别乱节俭

不能二次加热的4种食物!专家提醒:吃不完或倒掉,别乱节俭

全球军事记
2026-03-04 10:15:52
恐怖30-0 亚足联认证!下午四点 中国女足获好消息 拿头名更容易

恐怖30-0 亚足联认证!下午四点 中国女足获好消息 拿头名更容易

侃球熊弟
2026-03-06 04:30:03
一个女人,就算没有夫妻间的生理需求,也要跟老公睡在一张床上

一个女人,就算没有夫妻间的生理需求,也要跟老公睡在一张床上

加油丁小文
2026-02-26 07:30:04
全国人大代表方燕:建议禁止性侵未成年罪犯进入中小学校园、幼儿园

全国人大代表方燕:建议禁止性侵未成年罪犯进入中小学校园、幼儿园

闪电新闻
2026-03-05 15:03:02
这居然是黄圣依?差点没认出来,气质大变样,整个人状态焕然一新

这居然是黄圣依?差点没认出来,气质大变样,整个人状态焕然一新

TVB的四小花
2026-03-05 13:58:05
女流直播突然孩子哭闹,被迫过去“垫一口”,网友:不行下播吧

女流直播突然孩子哭闹,被迫过去“垫一口”,网友:不行下播吧

相思赋予谁a
2026-03-05 16:09:12
浙江区划调整建议!余姚升级为区,丽水部分划入温州

浙江区划调整建议!余姚升级为区,丽水部分划入温州

城市生态圈
2026-03-05 13:55:00
厉害了!金价大起大落,南京女子凭57克黄金直接“躺赢”!

厉害了!金价大起大落,南京女子凭57克黄金直接“躺赢”!

次元君情感
2026-03-05 17:38:03
萧敬腾夫妇现身韩国!喝咖啡都要牵着手,一眼就能看出俩人年龄差

萧敬腾夫妇现身韩国!喝咖啡都要牵着手,一眼就能看出俩人年龄差

白面书誏
2026-03-05 15:43:25
2026-03-06 06:23:00
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
66842文章数 70113关注度
往期回顾 全部

健康要闻

转头就晕的耳石症,能开车上班吗?

头条要闻

伊朗:已作好准备应对美国地面行动

头条要闻

伊朗:已作好准备应对美国地面行动

体育要闻

不开玩笑,没人想在季后赛碰上黄蜂

娱乐要闻

谢娜下场撕薛之谦,张杰前女友爆猛料

财经要闻

“十五五”开局之年,这么干!

科技要闻

独家|林俊旸辞职 我们和认识他的人聊了聊

汽车要闻

15.98万元起 第三代领克03大尾翼版上市

态度原创

教育
旅游
房产
公开课
军事航空

教育要闻

27届的老师快把这本书带走!!初期学习+中期提升+后期背诵一次搞定!!

旅游要闻

云南兰坪向阳山坡长出“空中民宿”,两地共建现代农业产业园探路农文旅融合

房产要闻

超猛!又有2800套房源砸出,2026海口安居房,彻底爆发!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

2026年中国国防预算增长7%

无障碍浏览 进入关怀版