网易首页 > 网易号 > 正文 申请入驻

哈佛最新研究: 用 AI大型语言模型看病,80%的初步诊断都是错的

0
分享至

在AI大模型快速发展的今天,很多人在生病或出现症状时的第一反应已经不再是去医院挂急诊,而是求助于ChatGPT或者DeepSeek这类AI聊天机器人。

尽管这些通用聊天机器人在日常生活的很多方面都能成为人类的好助手,但在医学方面,它们还不足以好到能提供精确诊断的程度。

近日,美国哈佛医学院的一个研究团队评估了20几种最先进的AI大型语言模型(LLM)的诊断能力,其中包括ChatGPT、DeepSeek、Gemini和Claude。结果显示,基于患者的初步症状和体征进行“鉴别诊断”(识别可能的疾病)的错误率高达80%。

这项研究进一步显示,在患者提供更多检测结果后,大模型可以将“最终诊断”的失败率降至40%左右。研究人员表示,这意味着AI聊天机器人需要通过充分的患者信息,才能对疾病作出更为精准的诊断,患者无法提供完整的健康检测信息时,AI提供的结果并不可靠。

研究人员还强调:“人工智能尚未达到无需医疗专业人员干预即可为患者做出诊断决策的水平。”

这一研究结果也凸显了人工智能在医疗领域应用时面临的安全挑战。聊天机器人等AI工具若不经过专业人士的严格把关,不仅会误导患者,医学从业者在使用AI作为检索资料的过程中也可能被误导。

上周《自然》杂志就刊登了一篇文章,称出现在网上的两篇假论文中的一种不存在的皮肤疾病,被同行评议的文献引用,并且开始出现在Gemini等最常用的大型语言模型聊天机器人的输出中。这些聊天机器人“一本正经”地将一些患者诊断为这种不存在的疾病,并建议人们去看相关的专科医生。

Gemini是谷歌的一款聊天机器人。一位谷歌发言人表示,此类结果反映了早期大模型发展的局限性。“我们始终对生成式AI的局限性保持透明,并提醒用户仔细核对信息。对于诸如医疗建议这类敏感事项,Gemini建议用户咨询具有资质的专业人士。”

中国科学院院士、复旦大学附属中山医院心内科主任葛均波教授近期多次谈及AI大模型在医疗应用中面临的挑战,其中两个关键问题是患者隐私如何保护,以及AI在医疗过程中一旦出现问题,责任由谁来承担?他表示,目前正在开展的工作包括如何明确AI技术辅助诊疗的边界,强化医生对AI结果的判断能力和责任意识,确保医疗安全。

尽管AI大模型仍在不断完善的过程中,但葛均波仍然相信,在不久的将来,随着AI技术的进步以及算法的提升,AI的能力一定会超过最顶尖的医生,从辅助医生逐步走向具有独立思考能力的诊疗工具。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陪睡只是入门!认干爹、舔手指,背地里的阴暗面完全藏不住了...

陪睡只是入门!认干爹、舔手指,背地里的阴暗面完全藏不住了...

芳华青年
2026-05-18 13:07:54
改名即宣战!美国“大锤行动”代号曝光,对伊动武已进入倒计时?

改名即宣战!美国“大锤行动”代号曝光,对伊动武已进入倒计时?

深析古今
2026-06-03 16:05:06
万科再无合伙人

万科再无合伙人

地产微资讯
2026-06-03 15:59:15
判处14年监禁!涉嫌阴阳合同签小卡!快船老板鲍尔默安然无恙

判处14年监禁!涉嫌阴阳合同签小卡!快船老板鲍尔默安然无恙

篮球教学论坛
2026-06-02 15:53:53
陈妍希申请强制执行后,陈晓在人民日报发文,卓伟曝俩人离婚原因

陈妍希申请强制执行后,陈晓在人民日报发文,卓伟曝俩人离婚原因

小梊搞笑解说
2026-06-03 11:41:20
女生为秀恩爱,偷偷在男友博士论文里编造了第 52 条参考文献,网友:博士男友秒变硕士前男友

女生为秀恩爱,偷偷在男友博士论文里编造了第 52 条参考文献,网友:博士男友秒变硕士前男友

生物学霸
2026-06-02 17:13:59
Arm没比x86便宜:RTX Spark笔记本价格曝光!顶配约3.2万元

Arm没比x86便宜:RTX Spark笔记本价格曝光!顶配约3.2万元

快科技
2026-06-02 18:47:07
潜水员在加勒比海捞到谷歌原型表,泄露渠道比酒吧还魔幻

潜水员在加勒比海捞到谷歌原型表,泄露渠道比酒吧还魔幻

全栈遛狗员
2026-06-02 14:35:24
登顶!欧央行年度报告:黄金超越美债成为全球最大储备资产

登顶!欧央行年度报告:黄金超越美债成为全球最大储备资产

第一财经资讯
2026-06-03 07:32:47
非法收受他人财物,数额特别巨大!“老虎”王莉霞被逮捕、提起公诉

非法收受他人财物,数额特别巨大!“老虎”王莉霞被逮捕、提起公诉

上海法治声音
2026-06-03 15:22:56
今晚19:30,中国男篮对阵塞尔维亚劲旅,年轻球员机会来了

今晚19:30,中国男篮对阵塞尔维亚劲旅,年轻球员机会来了

格斗社
2026-06-03 13:56:45
瞿颖晒与周杰伦打网球:打三场输三场

瞿颖晒与周杰伦打网球:打三场输三场

红星新闻
2026-06-03 15:38:14
“第二个朝鲜”出现了?俄罗斯正在养虎为患,真正慌的是巴基斯坦

“第二个朝鲜”出现了?俄罗斯正在养虎为患,真正慌的是巴基斯坦

原来仙女不讲理
2026-06-03 14:49:33
贵州女子16岁被家人送到湖南嫁给大18岁男子,逃离后与他人生子被判重婚

贵州女子16岁被家人送到湖南嫁给大18岁男子,逃离后与他人生子被判重婚

封面新闻
2026-06-03 11:14:33
吃完嫩的吃老的,山西儿媳出轨公公10年,亲自给丈夫生下一个妹妹

吃完嫩的吃老的,山西儿媳出轨公公10年,亲自给丈夫生下一个妹妹

莫地方
2026-06-02 00:10:26
太惨了!商场80%店关门,武汉一商场从开业爆火到8成空置,引热议

太惨了!商场80%店关门,武汉一商场从开业爆火到8成空置,引热议

火山詩话
2026-06-03 11:47:35
电竞国家队工作人员点名批评朱开!国内电竞停滞的罪人

电竞国家队工作人员点名批评朱开!国内电竞停滞的罪人

游民星空
2026-06-02 20:10:48
为什么现在连初中生都要接送?

为什么现在连初中生都要接送?

阿振观点
2026-06-03 07:26:56
兜转半生落泪!王菲现身谢霆锋演唱会,才懂真爱无畏岁月

兜转半生落泪!王菲现身谢霆锋演唱会,才懂真爱无畏岁月

湘西二当家
2026-06-03 16:01:33
苹果5款新品官宣,6月9日,正式发布

苹果5款新品官宣,6月9日,正式发布

科技堡垒
2026-06-03 09:40:13
2026-06-03 18:12:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
255064文章数 622602关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

神农架一景区被指"圈路收费" 涉事公司最新公告

头条要闻

神农架一景区被指"圈路收费" 涉事公司最新公告

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

依托全域辅助驾驶布局 千里浩瀚助推吉利5月市场大热

态度原创

手机
数码
游戏
艺术
公开课

手机要闻

小米17T系列官宣支持「徕卡Live动态照片」,6月8日发布

数码要闻

SK海力士展出12层堆叠48GB HBM4E内存,引脚速率16Gbps

女流点评《影之刃零》官宣跳票:对玩家是好事!

艺术要闻

二十年前割麦的场景

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版