网易首页 > 网易号 > 正文 申请入驻

AI对医生没用?斯坦福、哈佛重磅研究揭开AI医疗痛点,DeepSeek远远不够!

0
分享至

开年以来,AI火爆医疗圈,超过100家医院官宣接入DeepSeek

然而,在市场预期拉满的同时,一线使用者们却对AI褒贬不一,有医生表示:AI真正起到的作用还很有限。

去年10月,斯坦福大学、哈佛医学院等机构的研究人员在JAMA Network Open上发表了题为Large Language Model Influence on Diagnostic Reasoning: A Randomized Clinical Trial的论文。

该研究针对50名医生进行随机临床试验,结果发现使用大语言模型 (LLM) 并没有显著提高医生的诊断推理能力。

造成这一结果的原因并非是AI不够强大,研究结果显示,AI独立使用的效果要比人类医生以及人类医生+AI更好!

一直以来,人们对AI的定位往往是医生的“好助手”,而该研究却否定了强大的AI模型对医生临床诊断的提升作用,人与AI的结合实际上起到了1+1=1的效果

这一发现不禁让人开始重新审视AI在医疗领域的角色定位,是我们对AI的认知还不够深入全面,还是人类医生与AI之间的协作模式还存在优化空间?

毕竟,医疗领域关乎的是生命健康,容不得丝毫马虎。在期待AI能够为医疗事业带来革新的同时,如何实现AI与人类医生的优势互补,将是未来的关键课题

斯坦福大学医学助理教授Jonathan Chen和斯坦福大学生物医学信息学研究中心博士后Ethan Goh是此次研究的发起人。

Chen拥有计算机科学博士学位,多年前曾是一名程序员,对计算机+医学这一交叉领域地研究已有20多年,而Goh则曾担任内科医生,与谷歌、罗氏、三星等公司合作开发数字医疗产品。

图:Ethan Goh(左)和Jonathan Chen(右)

具体而言,他们招募了50名美国执业医师,包括26名主治医师和24名住院医师,专业涵盖家庭医学、内科和急诊医学。

通过随机分组,其中AI组25人使用大语言模型(GPT-4)+传统资源,传统组25人仅使用传统资源(如UpToDate、Google)

最终,所有参与者共完成 244例诊断(AI组125 例,对照组119 例),由3名资深医师盲审给出评分。

结果显示,AI组中位数得分为76%(IQR 66%-87%),传统组为74%(IQR 63%-84%),调整后差异为2个百分点,诊断性能无显著差异。

时间上,LLM组每例耗时519秒(IQR 371-668),传统组565秒(IQR 456-788),差别也不明显。

是因为AI不够强大吗?答案是否定的,研究人员让AI单独表现时,其得分达92%(IQR 82%-97%),显著高于AI组和传统组

研究人员得出结论:与传统资源相比,大语言模型作为强大的诊断辅助工具却并没有提高医生的表现,AI在临床决策上的潜力有待进一步发掘。

人们往往会认为,只要医生使用AI,就能提升诊疗的准确性与效率。但事实证明,这种假设是错误的。

究其原因,AI的确很强大,但如果医生们并不能熟练掌握,其作用仍然有限。

也正因如此,在文章的最后,研究人员们认为需要“通过重新设计医学教育和实践框架来适应颠覆性的新兴技术”。

在实际工作中,因为不明白如何使用AI而导致效果大打折扣的案例比比皆是。

一项来自麻省理工学院-哈佛大学的联合研究同样指出,AI在图像识别等任务上表现优异,但这些能力未被医生们充分利用。

该研究调查了180名来自美国和越南的放射科医生,结果发现,即便AI的预测准确性高于医生,但医生仍倾向于依赖自身经验或直觉。

这意味着,即使AI是正确的,医生也往往会坚持自己的第一印象,导致他们做出的诊断不太准确。

这暴露出人和AI协同的深层矛盾,如何在医生与AI之间建立起更加和谐的互动关系,成为AI医疗能否真正落地的关键。

这让我想起历史上多起民航空难事故,正是由于飞行员与自动驾驶争夺控制权,最终酿成了不可挽回的结果。

必须承认,自动驾驶极大程度上简化了飞行员的操作,实现了对飞机非常精准的操控,但当电脑结果会和飞行员的判断产生冲突,将直接挑战着航空安全的底线。

而现代民航制度已经发展出一套成熟的方案来应对,通过多层次的安全设计和标准化流程,构建起「人机协同」的决策体系。

同样是人命关天的大事,当AI深入到医疗领域,或许可以学习航空业的经验,在教育培训制度、标准化工作程序、监管框架设计等方面发力,突破信任危机与效率瓶颈。

尽管不少医院均表示已经接入DeepSeek,但大部分医院仅仅是停留在Chatbot(聊天机器人)的形式,其实际效果究竟如何需要打个大大的问号。

尤其是在医疗资源极为稀缺的中国,如果AI不能真正提高效率、解决实际问题,医务工作人员将很快抛弃这些工具,风口之后只会留下一地鸡毛。

DeepSeek的出现,仅仅解决了AI医疗最为初级的问题,其技术价值还没有触及医疗细分场景的核心痛点,而这个则是留给相关公司们的更大机会。

对于当下的AI医疗公司来说,与其在参数、性能上内卷,不如在理解临床需求、匹配实际场景、优化用户体验、提供培训支持等方向上深化,让AI能够融入到医务人员的工作流之中。

未来的成功不在于AI能完成多少项“炫技”,而在于它能否成为诊疗过程中不可分割的智能伙伴。

当DeepSeek完成市场启蒙后,AI医疗真正的战场将在每一次问诊、每一份病历、每一项数据中进行,只有那些最懂患者、最懂医院、最懂中国的公司,才能成为这场深刻的行业革命中的赢家

参考文献:

Hswen Y, Rubin R. An AI Chatbot Outperformed Physicians and Physicians Plus AI in a Trial—What Does That Mean? JAMA. 2025;333(4):273–276.

Agarwal, Nikhil and Moehring, Alex and Rajpurkar, Pranav and Salz, Tobias, Combining Human Expertise with Artificial Intelligence: Experimental Evidence from Radiology (July 2023)

—The End—

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
收评:沪指、深成指均跌超1% 机器人概念逆势爆发

收评:沪指、深成指均跌超1% 机器人概念逆势爆发

财联社
2026-05-15 15:02:22
花20亿养上百位情人,睡十人大床,风流一生临终却落个凄惨结局?

花20亿养上百位情人,睡十人大床,风流一生临终却落个凄惨结局?

历史人文2
2026-04-09 19:16:31
NBA季后赛明天5月16日赛程:骑士PK活塞,CCTV5直播马刺PK森林狼

NBA季后赛明天5月16日赛程:骑士PK活塞,CCTV5直播马刺PK森林狼

薇说体育
2026-05-15 16:04:57
秦岭摩托车男子被撞死,肇事者只能赔18万:162万缺口,谁来填?

秦岭摩托车男子被撞死,肇事者只能赔18万:162万缺口,谁来填?

三农老历
2026-05-15 12:19:06
特朗普突然透露:北京明确表态,不会向伊朗提供军援

特朗普突然透露:北京明确表态,不会向伊朗提供军援

桂系007
2026-05-14 23:59:15
2女共侍1夫,关系却情同姐妹,生前“三人行”,死后三人葬同穴

2女共侍1夫,关系却情同姐妹,生前“三人行”,死后三人葬同穴

史之铭
2026-05-15 01:16:43
美国政府披露特朗普Q1交易:买入英伟达、苹果 减持微软、亚马逊

美国政府披露特朗普Q1交易:买入英伟达、苹果 减持微软、亚马逊

财联社
2026-05-15 15:52:12
不断挑拨制造不和!小玥儿不再退让,一举戳破和马筱梅真实交情

不断挑拨制造不和!小玥儿不再退让,一举戳破和马筱梅真实交情

社会日日鲜
2026-05-15 06:49:29
医学发现:只要血糖在这个范围,不会引发并发症,不要自己害自己

医学发现:只要血糖在这个范围,不会引发并发症,不要自己害自己

冷眼看世界728
2026-05-14 21:45:01
马斯克用中文发贴:我的儿子正在学普通话

马斯克用中文发贴:我的儿子正在学普通话

凤凰网科技
2026-05-14 20:36:05
美国一旦霸权结束,一定会灭亡的三个国家,排第一的果然是它

美国一旦霸权结束,一定会灭亡的三个国家,排第一的果然是它

琴音缭绕回
2026-04-25 07:21:31
孙中山独子孙科:蒋介石三次喊他去台湾他都不去,49年后在大陆的结局让人意外

孙中山独子孙科:蒋介石三次喊他去台湾他都不去,49年后在大陆的结局让人意外

老杉说历史
2026-03-22 22:46:21
北京四季酒店连续三天满房,特朗普要住这了,为何选这个地方?

北京四季酒店连续三天满房,特朗普要住这了,为何选这个地方?

李昕言温度空间
2026-05-13 06:00:20
4-2击败中国女足!朝鲜U17被吐槽:跑不死 肯定改年龄了 以大打小

4-2击败中国女足!朝鲜U17被吐槽:跑不死 肯定改年龄了 以大打小

风过乡
2026-05-15 07:34:12
5人4杰青!全是名校领导,被举报学术造假,评论区怒火彻底压不住

5人4杰青!全是名校领导,被举报学术造假,评论区怒火彻底压不住

谭谈社会
2026-05-14 22:46:49
调整!5月15日晚央视直播CBA半决赛有变,北京首钢连续客场太不利

调整!5月15日晚央视直播CBA半决赛有变,北京首钢连续客场太不利

阿晞体育
2026-05-15 14:58:44
2018年,砸200亿建立西湖大学,扬言5年追上清华,如今实现了吗?

2018年,砸200亿建立西湖大学,扬言5年追上清华,如今实现了吗?

人生录
2026-05-12 18:36:03
香港回归前,英国同美国欲用48枚原子弹铲平中国,老一辈决策太牛

香港回归前,英国同美国欲用48枚原子弹铲平中国,老一辈决策太牛

云霄纪史观
2026-05-15 01:53:01
马斯克晚宴上同框库克,却望向了美女服务员,“表情灵动”引热议

马斯克晚宴上同框库克,却望向了美女服务员,“表情灵动”引热议

译言
2026-05-14 21:18:22
马斯克曾突然变脸,扯下美国遮羞布:没中国,谁敢想造出电动车?

马斯克曾突然变脸,扯下美国遮羞布:没中国,谁敢想造出电动车?

纵拥千千晚星
2026-04-04 19:34:36
2026-05-15 17:32:49
智药局 incentive-icons
智药局
我们更懂药物创新
1170文章数 211关注度
往期回顾 全部

科技要闻

两年联姻一地鸡毛,传苹果OpenAI濒临决裂

头条要闻

银行买"雇员忠诚险"后员工骗走客户393万 欲理赔被拒

头条要闻

银行买"雇员忠诚险"后员工骗走客户393万 欲理赔被拒

体育要闻

德约科维奇买的球队,从第6级联赛升入法甲

娱乐要闻

方媛为何要来《桃花坞6》没苦硬吃?

财经要闻

特朗普的北京时刻

汽车要闻

标杆级乘坐感受 驾驶智界V9需要再细腻一点?

态度原创

数码
房产
教育
健康
旅游

数码要闻

不懂养鱼也能当大神?当贝2S Ultra智能鱼缸深度体验

房产要闻

海口商业也是出息了!“友谊阳光城”,杀入北京最牛商街!

教育要闻

既要学校稳,又要同学好,还要门槛低?这所学校满足你!

专家揭秘干细胞回输的安全风险

旅游要闻

野外露营地如何选?这份安全指南请查收

无障碍浏览 进入关怀版