![]()
【免费】创新多组学队列研究学术论坛
![]()
想象一下,十年后当你走进急诊室,迎接你的除了医护团队,还可能有一位特殊的助手:一套人工智能系统。它能在你候诊时通过自动监测设备收集数据,在医患交流时实时聆听症状描述,随时准备提示医生可能出现的疏漏或建议下一步诊疗方向。这一愿景或许很快将成为现实。最新发表于《Science》杂志的研究显示,一种大型语言模型在复杂、甚至危及生命疾病的诊断中,其表现已频频超过医生——即使在信息有限、节奏紧张的急诊环境下也是如此。在早期急诊病例中,该模型的诊断准确或接近准确的比率约为67%,而医生的对应比率约为50%至55%。
临床决策的多维度测试
研究团队对OpenAI的o1模型进行了多项诊断准确性测试。其中五项任务要求模型阅读人工筛选的病例资料,并给出诊断建议、确定后续步骤或评估特定健康转归概率。在所有任务中,o1的表现均与医生相当或更优。
“模型与人类医生在所有任务中的表现差距如此显著,以至于我们担心没人会相信这个结果,”论文合著者、贝斯以色列女执事医疗中心的内科医生亚当·罗德曼表示。在其中一项评估临床推理能力的任务中(基于对诊断思路和后续步骤的解释能力),o1在98% 的病例中获得了满分,而主治医师的这一比例仅为35%。
模拟真实急诊场景:复杂数据下的挑战
该研究的最后一项测试——被哈佛大学计算机科学家、合著者托马斯·巴克利称为“最重要”的部分——要求模型在患者急诊护理的三个不同时间点进行诊断。患者进入急诊室后,需先向分诊护士描述症状,再由医生评估,最后医生决定治疗方案。每个环节都可能出现差错:患者可能难以清晰描述症状,医生可能同时处理多个高压病例。
研究人员使用了贝斯以色列医院真实急诊患者的病例,并按患者描述病情的三个时间点逐步向o1提供信息。巴克利指出,与其他实验不同,这项测试直接探究了LLM如何与“真实世界中可能不完整或存在偏见的混乱数据”进行交互。
结果显示,在急诊流程早期(患者刚入院、信息有限时),o1做出准确或接近准确诊断的比例达到67%,比处理相同病例的两位医生高出10%以上。即使随着信息增加,这一差距略有缩小,但在后续护理阶段,LLM的表现仍比医生高出2%至10%。
专家评价:现实场景测试意义重大
未参与该研究的丹娜—法伯癌症研究所计算机科学家施雷亚·乔赫里表示:“评估医学人工智能需要在不同临床任务和场景中兼顾深度与广度,而这项研究的作者成功做到了两者兼顾。”但她同时指出,这些AI系统在医疗健康领域的广泛应用,关键在于明确其最可靠的使用情境。
谷歌计算机科学家丹尼尔·麦克达夫也对研究表示赞赏:“看到模型在现实环境中接受测试……令人兴奋。”乔赫里同样认为,作者对o1诊断和推理能力的评估方式“是任何单一实验无法比拟的”。
研究局限与未来展望
尽管结果令人振奋,但研究也存在明显局限。研究未分析LLM在面对超过数小时病程信息时的表现——许多病例需要这样的长时间信息。急诊留院时间相对较短,因此即使是真实世界实验,也无法与其他场景(如住院患者)的诊断过程相比。此外,研究仅向o1提供了文本病例信息,未包含影像等非文本输入——这对于血栓、癌症等许多真实诊断至关重要。研究团队已在开展新实验,要求模型使用更长期、更广泛的真实世界信息评估患者。专家们认为,下一个挑战是确定这些系统能否在受控测试之外改善真实患者的护理。
https://www.science.org/content/article/ai-starting-beat-doctors-making-correct-diagnoses
免费论坛
创新多组学队列研究学术论坛
干细胞前沿创新与临床转化研讨会
第八届上海国际癌症大会
第二届西部单细胞与空间组学论坛
【关于投稿】
转化医学网(360zhyx.com)是转化医学核心门户,旨在推动基础研究、临床诊疗和产业的发展,核心内容涵盖组学、检验、免疫、肿瘤、心血管、糖尿病等。如您有最新的研究内容发表,欢迎联系我们进行免费报道(公众号菜单栏-在线客服联系),我们的理念:内容创造价值,转化铸就未来!
转化医学网(360zhyx.com)发布的文章旨在介绍前沿医学研究进展,不能作为治疗方案使用;如需获得健康指导,请至正规医院就诊。
责任声明:本稿件如有错误之处,敬请联系转化医学网客服进行修改事宜!
微信号:zhuanhuayixue
★ 4月份热门内容 ★
01
葛均波院士领衔!系统阐述心血管衰老的十二大特征与“重返青春”干预策略
02
重磅综述!中国医学科学院吴晨/林东昕/张少森团队描绘食管癌从发病机制到精准治疗的全景图与未来展望
03
Cell重磅发布!科学家发现癌症良恶性转变的关键窗口与拦截新策略
04
重磅研究!上海交通大学医学院附属第九人民医院吴皓团队首次绘制小鼠耳蜗核的高分辨率分子与细胞图谱
05
Nature里程碑研究!西湖大学杨剑&温州医科大学沈贤团队构建迄今为止规模最大的中国人群泛基因组参考图谱
06
清华大学董家鸿院士领衔!首次系统揭示胰腺导管腺癌神经浸润的关键机制,锁定关键药物靶点
点击查看更多热门内容
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.