网易首页 > 网易号 > 正文 申请入驻

复旦大学最新Cell子刊:DeepSeek-R1、GPT-4等大语言模型可增强肺癌筛查的临床决策

0
分享至

撰文丨王聪

编辑丨王多鱼

排版丨水成文

肺癌是全球最具侵袭性和普遍性的癌症之一,2020 年预估新增病例达 220 万例,死亡病例达 180 万例。多数肺癌病例在进展至晚期前无明显症状,而晚期治疗选择往往有限,导致五年生存率低于 10%。

大语言模型(LLM)在临床应用中的探索日益增多,但其生成肺癌筛查管理建议的能力仍不确定。

2025 年 11 月 21 日,复旦大学中山医院谭黎杰教授团队等在 Cell 子刊Cell Reports Medicine上发表了题为:Multi-center benchmarking of large language models for clinical decision support in lung cancer screening 的研究论文。

该研究进行了多中心基准测试,评估了六款大语言模型(LLM)在肺癌筛查临床决策支持中的应用,结果显示,Claude 3 Opus生成的建议可读性最高,而GPT-4的临床准确性最高。此外,GPT-4oDeepSeek-R1,表现与 GPT-4 相当,均优于 GPT-3.5。这些发现表明,大语言模型有可能在不同医疗环境中增强肺癌筛查的临床决策支持。


自美国国家肺癌筛查试验证明年度低剂量计算机断层扫描(LDCT)筛查可显著降低肺癌死亡率后,LDCT 已成为改善预后和生存率的关键策略,尤其对肺癌高危人群而言。LDCT 扫描过程中有时会偶然发现被称为肺结节的小团块(<3厘米)。发现结节后需立即决策:是采取正电子发射断层扫描-CT、活检甚至手术等即时干预措施,还是仅需制定不同间隔期的常规随访方案。此类决策通常由门诊医生完成,因此可能受益于专业的临床决策支持系统。

大语言模型(LLM)是基于数十亿来自文章、书籍和其他互联网内容的单词训练而成的人工智能系统。在过去两年中,越来越多的研究探索了 LLM 在支持诊断和治疗决策方面的巨大潜力。在肺癌领域,LLM 已被用于回答非专业人士的肺癌相关问题、对自由文本 CT 报告进行数据挖掘以及评估肺结节患者的纵向 CT 图像。最近有两项研究评估了开源大语言模型DeepSeek-R1在临床决策中的表现,结果表明,其与 OpenAI 的GPT-4o等领先的专有大语言模型不相上下。然而,这些研究仅限于从医学教科书和学术期刊中获取的病例报告,因此在实际临床应用方面存在不足。

在这项最新研究中,研究团队开展了一项多中心的横断面研究,旨在评估大语言模型(LLM)是否适合作为决策支持工具,为首次低剂量计算机断层扫描(LDCT)中偶然发现肺结节的患者提供常规癌症筛查的管理建议,而这是肺癌筛查临床管理中的一个紧迫挑战。

为了尽可能真实地模拟癌症筛查场景,研究团队从三家不同的医疗机构收集了 LDCT 报告。将这些报告翻译成英文并去除所有患者可识别信息后,准备了 148 份匿名的 LDCT 报告以供大语言模型(LLM)使。在评估阶段,研究团队系统地评估了四种广泛使用的 LLM——GPT-3.5GPT-4Claude 3 SonnetClaude 3 Opus——在这些医院中的可读性、准确性以及一致性。为了与该领域的最新进展保持一致,研究团队还使用一家医院的 LDCT 报告对两种最先进(SOAT)模型——专有的GPT-4o及开源的DeepSeek-R1进行了探索性分析。

评估结果显示,Claude 3 Opus生成的建议可读性最高,而GPT-4达到了最高的临床准确性。重要的是,这些大语言模型对来自不同医院的报告之间的性能差异并不显著,这突显了这些大语言模型对报告模板变化的稳健性以及在不同医疗环境中的实用性。在探索性分析中,两款最先进(SOAT)模型——专有的GPT-4o及开源的DeepSeek-R1,表现与 GPT-4 相当,均优于 GPT-3.5。

该研究的亮点:

  • 多中心横断面研究对六种大语言模型(LLM)在肺癌筛查中的表现进行基准测试;

  • 真实世界的低剂量计算机断层扫描(LDCT)报告评估了 LLM 在管理建议方面的表现;

  • GPT-4 准确度最高,而 Claude 3 Opus 的可读性最佳;

  • GPT-4o 和 DeepSeek-R1 的表现与 GPT-4 相当,并且优于 GPT-3.5。


总的来说,这些发现表明,大语言模型(LLM)有可能在不同医疗环境中增强肺癌筛查的临床决策支持。

论文链接

https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(25)00538-5


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
郑丽文访陆被三重压力夹击,卢秀燕拆台、民进党构陷、美国逼宫

郑丽文访陆被三重压力夹击,卢秀燕拆台、民进党构陷、美国逼宫

白色得季节
2026-04-02 03:36:34
陈亚男订婚后不再伪装,拒为朱小伟生子,再婚要求高到离谱

陈亚男订婚后不再伪装,拒为朱小伟生子,再婚要求高到离谱

荒野老五
2026-04-02 01:27:36
一男孩下体疼痛仅消炎治疗,一周后确诊睾丸扭转致一侧切除 医生:要争抢“黄金时间窗”

一男孩下体疼痛仅消炎治疗,一周后确诊睾丸扭转致一侧切除 医生:要争抢“黄金时间窗”

红星新闻
2026-04-01 19:53:37
里子面子都丢了,森林北自曝身体出了问题,汪峰的体面被撕碎

里子面子都丢了,森林北自曝身体出了问题,汪峰的体面被撕碎

素衣读史
2025-11-19 16:09:14
韩国:3月30日起,对北京14个城市中国居民签发十年多次往返签证

韩国:3月30日起,对北京14个城市中国居民签发十年多次往返签证

南权先生
2026-04-01 15:42:41
为什么宁换总理也不革命?亿万人的困局!

为什么宁换总理也不革命?亿万人的困局!

红色少女主播
2026-04-02 00:01:19
凌晨6点的裁员邮件,甲骨文3万人被“一键辞退”,26年老员工直言:这种做法真让人觉得恶心、懦弱

凌晨6点的裁员邮件,甲骨文3万人被“一键辞退”,26年老员工直言:这种做法真让人觉得恶心、懦弱

CSDN
2026-04-01 17:19:50
搞笑,乔尔·恩比德认为他打奇才队的伤情报告只是愚人节玩笑

搞笑,乔尔·恩比德认为他打奇才队的伤情报告只是愚人节玩笑

好火子
2026-04-02 04:07:37
世界杯:男单16强签位出炉!王楚钦再战小勒布伦,温瑞博碰林昀儒

世界杯:男单16强签位出炉!王楚钦再战小勒布伦,温瑞博碰林昀儒

越岭寻踪
2026-04-02 00:39:06
50万级销冠极氪9X疯狂收割BBA用户!极氪3月交付新车29318辆 暴增90%

50万级销冠极氪9X疯狂收割BBA用户!极氪3月交付新车29318辆 暴增90%

快科技
2026-04-01 16:28:14
彻底摊牌!雄鹿更衣室炸了,波蒂斯公开逼宫字母哥,真忍无可忍啊

彻底摊牌!雄鹿更衣室炸了,波蒂斯公开逼宫字母哥,真忍无可忍啊

球童无忌
2026-04-01 13:14:47
突发!2026 房价迎来报复性反弹,市场彻底炸锅

突发!2026 房价迎来报复性反弹,市场彻底炸锅

新浪财经
2026-04-01 12:01:30
眼见着朱立伦另立党中央,卢秀燕着急了:发出三支箭,射向郑丽文

眼见着朱立伦另立党中央,卢秀燕着急了:发出三支箭,射向郑丽文

娱乐圈的笔娱君
2026-03-31 17:57:14
银行不会明说的潜规则:存款超55万,你就有资格谈条件!

银行不会明说的潜规则:存款超55万,你就有资格谈条件!

坠入二次元的海洋
2026-04-01 12:04:21
伊朗副议长:目前最高领袖未批准任何谈判

伊朗副议长:目前最高领袖未批准任何谈判

财联社
2026-04-01 17:30:06
南宋小尼姑思春 ,大胆写下一首“云雨词”,男人读后都脸红

南宋小尼姑思春 ,大胆写下一首“云雨词”,男人读后都脸红

长风文史
2026-04-01 12:35:21
打!赔光1770亿也要打?以色列最新民调:75%民众要求打到底

打!赔光1770亿也要打?以色列最新民调:75%民众要求打到底

梁讯
2026-03-29 14:09:20
印度专家:中印若开战将改变战争模式,印度10天内必败

印度专家:中印若开战将改变战争模式,印度10天内必败

软妹酸奶
2026-03-31 16:51:27
原油,直线大跳水!黄金、欧洲股市集体拉升!中东,传来大消息!

原油,直线大跳水!黄金、欧洲股市集体拉升!中东,传来大消息!

证券时报e公司
2026-04-01 15:39:29
中方雪中送炭,26万桶柴油到货,不到24小时,中国给马科斯提个醒

中方雪中送炭,26万桶柴油到货,不到24小时,中国给马科斯提个醒

史料布籍
2026-04-01 11:27:13
2026-04-02 04:39:00
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科学研究
9131文章数 145039关注度
往期回顾 全部

科技要闻

甲骨文血洗3万人,47人团队仅留3人

头条要闻

特朗普计划夺取伊朗浓缩铀:空运挖掘设备 修建飞机跑道

头条要闻

特朗普计划夺取伊朗浓缩铀:空运挖掘设备 修建飞机跑道

体育要闻

NBA扩军,和篮球无关?

娱乐要闻

张婉婷已决定离婚 找律师讨论婚变事宜

财经要闻

电商售械三水光针 机构倒货or假货猖獗?

汽车要闻

三电可靠 用料下本 百万公里的蔚来ES6 拆开看

态度原创

健康
艺术
本地
数码
公开课

干细胞抗衰4大误区,90%的人都中招

艺术要闻

太壕了!为了一场演唱会,BIG给拉丁天后夏奇拉建5万人临时场馆

本地新闻

从学徒到世界冠军,为什么说张雪的底气在重庆?

数码要闻

小米路由器BE7000获1.1.38版本升级,新增专属网络等功能

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版