网易首页 > 网易号 > 正文 申请入驻

Cancer Cell | 大语言模型赋能肿瘤精准医学:临床治疗推荐准确率达93%

0
分享至


撰文 | 水王星

肿瘤精准医学的核心是基于患者基因组生物标志物、癌症类型及治疗史制定个性化治疗方案,这一模式的落地高度依赖临床医生对海量分子靶向疗法及监管批准信息的精准把控。然而,近年来FDA批准的分子靶向疗法呈爆发式增长,仅2024至2025年间,MOAlmanac数据库收录的FDA批准疗法相关关联就增长了近3 倍,同时临床指南、期刊文献、监管机构官网等证据来源高度分散,部分新批准疗法缺乏广泛宣传,导致临床医生尤其是非肿瘤基因组专业的医师难以及时跟进最新诊疗进展,知识缺口可能延误最佳治疗时机。传统大语言模型(Large language models,LLM) 虽在临床文本总结、医学考试等场景中展现出接近医师的能力,却受限于训练数据的知识截止期和领域针对性不足, 面对精准肿瘤学中动态更新的知识,常出现推荐滞后、准确性不足等问题,难以直接应用于临床决策 。

近日,来自美国丹娜-法伯癌症研究所、哈佛医学院及麻省理工学院博德研究所等机构的 Eliezer Van Allen 团队,在 Cancer Cell 期刊发表题为 A context-augmented large language model for accurate precision oncology medicine recommendations 的研究论文。该团队开发了一套基于检索增强生成(retrieval-augmented generation,RAG) 技术的LLM框架,通过深度整合MOAlmanac这一专家精选的临床基因组数据库,实现了动态补充最新临床证据的功能,无需修改模型内部权重即可持续更新治疗推荐依据。 该框架在234条2024年版MOAlmanac合成查询中达成95%的精确匹配准确率,在 81条来自15位临床肿瘤学家的真实世界查询中准确率高达93%,为精准肿瘤学临床决策提供了高效、可扩展且高度可靠的智能支持工具 。


该研究的核心突破在于构建了一套适配精准肿瘤学需求的全流程优化方案,从知识补充、数据格式到检索机制均实现针对性创新。在知识动态更新层面,RAG 技术通过实时检索MOAlmanac数据库中的FDA批准疗法信息,完美弥补了传统 LLM知识滞后的缺陷。当2025年版MOAlmanac新增大量疗法关联后,框架仍能通过数据库同步实现高效推荐,而无需重新训练模型。在数据格式优化上,研究团队对比了非结构化数据 (如药物说明书的 “适应症与用法” 章节文本) 与结构化数据 (人工整理的生物标志物, 疗法和癌症类型关联条目) 的增强效果,发现结构化数据能更精准捕捉三者间的复杂逻辑,使模型在前列腺癌同源重组修复基因 (homologous recombination repair,HRR) 基因突变相关治疗推荐中,精确匹配准确率从非结构化数据增强的4%、纯LLM的0%提升至63%,同时在 35种癌症类型、64种基因组生物标志物的广泛场景中保持稳定性能。检索机制方面,团队创新采用混合检索策略,先通过语义检索筛选出Top50相关上下文,再利用 Okapi BM25算法进行词汇相似度重排,通过自适应系数平衡语义与词汇相关性,最终在真实世界查询中较单一语义检索提升3%-9%的准确率,平均多生成4个部分正确的治疗推荐。

研究通过系统实验揭示了多项关键发现,为LLM在精准肿瘤学的应用提供了重要参考。在提示词优化阶段,团队测试了四种策略:基础提示词、范围限制提示词、系统角色提示词及组合提示词,发现基础提示词 (“请以指定 JSON 格式提供每条治疗方案…… 查询:{prompt}”) 表现最优,在Mistral NeMo 12B模型中达成82.9%的部分匹配准确率,显著优于其他三种策略 (69.7%-79.9%) ,且这一优势在GPT-4o、GPT-4o mini等7种不同规模LLM中均保持一致,其中GPT-4o 在基础提示词策略下实现89.3%的部分匹配准确率,成为后续实验的首选模型。在模型性能验证中,结构化数据增强的优势贯穿始终:在2025年版MOAlmanac 的651条合成查询中,结构化RAG-LLM的精确匹配准确率虽因数据量扩张降至 59%,但仍显著高于非结构化增强 (约 47%) 和纯 LLM (62%-89% 区间下限) ,且精准度、F1 分数分别提升约 90% 和 69%;同时,增加检索上下文数量 (从 10 条增至 25 条) 进一步优化了模型表现。在真实世界场景中,框架展现出强大的实用性:针对21条验证查询和81条测试查询,涵盖肺癌、乳腺癌和前列腺癌等多种常见肿瘤及罕见癌症,混合检索策略均实现最优性能,尤其在处理复杂临床场景 (如联合治疗方案推荐、罕见生物标志物匹配) 时,能有效捕捉细粒度治疗决策依据。此外,研究还探索了框架的泛化能力,整合 CIViC 数据库后,虽整体准确率较 MOAlmanac 增强 (53%-76%) 有所下降 (37%-62%) ,但在10条涉及超适应症或研究性疗法的查询中,表现优于MOAlmanac增强模型,证实了框架在不同数据库适配中的灵活性。

该研究构建的RAG-LLM框架具有重要的临床价值与广阔的应用前景。首先,它有效解决了精准肿瘤学知识碎片化的痛点,将分散于不同来源的FDA批准信息、生物标志物关联证据整合为统一查询入口,减少医生在多个平台间切换检索的时间成本。其次,框架降低了精准肿瘤学的应用门槛,无需复杂计算资源即可部署,尤其能为非学术机构的肿瘤科医生提供专业支持。再者,框架具备高度灵活的适配性,可在FDA与EMA等不同地区监管标准间切换,未来整合区域数据库后有望实现全球范围内的个性化推荐,同时通过bias审计、嵌入校准等方式,可进一步提升不同患者群体间的公平性。值得注意的是,研究也指出了当前的局限性,如部分乳腺癌联合治疗方案推荐不完全、对无FDA批准疗法的场景可能误推荐超适应症药物等,未来可通过整合临床指南、临床试验数据、电子健康记录,以及优化嵌入模型、引入思维链提示词等方式持续完善。


https://doi.org/10.1016/j.ccell.2025.12.017

制版人: 十一

学术合作组织

(*排名不分先后)



战略合作伙伴

(*排名不分先后)



转载须知

【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。

BioArt

Med

Plants

人才招聘

近期直播推荐

点击主页推荐活动

关注更多最新活动!


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
很受伤!75岁上海阿婆一脚踩空,全身多处骨折!公交车“靠站距离”引发争议

很受伤!75岁上海阿婆一脚踩空,全身多处骨折!公交车“靠站距离”引发争议

新民晚报
2026-04-15 18:18:17
曝畸形儿传闻后,阚清子再传坏消息,把娱乐圈的人情冷暖展露无疑

曝畸形儿传闻后,阚清子再传坏消息,把娱乐圈的人情冷暖展露无疑

可乐谈情感
2026-04-16 00:55:18
出轨的女人,你陪男人睡,不是因为你的美,是因为你的天真和廉价

出轨的女人,你陪男人睡,不是因为你的美,是因为你的天真和廉价

加油丁小文
2026-03-25 08:30:09
多个省级政府领导班子调整

多个省级政府领导班子调整

上观新闻
2026-04-14 17:04:07
崔始源演「振动器意外」被喷上热搜,400万围观网友集体懵圈

崔始源演「振动器意外」被喷上热搜,400万围观网友集体懵圈

影视情报室
2026-04-13 08:18:09
乔致庸临终告诫后人:一个家族想要富过三代,秘诀只有三个字

乔致庸临终告诫后人:一个家族想要富过三代,秘诀只有三个字

千秋文化
2026-03-28 21:09:01
樊振东退出世乒赛 日媒惋惜:他也不可能参加洛奥 实力远超其他人

樊振东退出世乒赛 日媒惋惜:他也不可能参加洛奥 实力远超其他人

风过乡
2026-04-15 07:48:17
深圳104-96胜新疆,CBA最新排名:深圳升至第3

深圳104-96胜新疆,CBA最新排名:深圳升至第3

范动舍长
2026-04-16 02:07:26
《漫天星光是她用死亡为我铺陈的天路》孟明葵辛迟宋曼曼小说

《漫天星光是她用死亡为我铺陈的天路》孟明葵辛迟宋曼曼小说

隔壁老王爱生活
2026-01-31 07:06:06
刘亦菲把运动纯欲风穿绝了,这件蓝泳衣细节太会拿捏

刘亦菲把运动纯欲风穿绝了,这件蓝泳衣细节太会拿捏

橙星文娱
2026-03-17 17:04:05
丹麦把旅居台湾民众居留证国籍、出生地登记改为中国,国台办回应

丹麦把旅居台湾民众居留证国籍、出生地登记改为中国,国台办回应

新京报
2026-04-15 11:21:58
外国人扎堆来中国看病:住院3天账单4万美元,被欧美医疗逼疯了!

外国人扎堆来中国看病:住院3天账单4万美元,被欧美医疗逼疯了!

古事寻踪记
2026-04-15 07:21:44
国防部话音刚落,东部战区就来真的了!台海方向,有些人该失眠了

国防部话音刚落,东部战区就来真的了!台海方向,有些人该失眠了

闫树军论评
2026-04-14 18:35:59
爱马仕股票开盘时暂停交易

爱马仕股票开盘时暂停交易

每日经济新闻
2026-04-15 15:15:30
被亲家欺负、争遗产被赶出家、为儿子演戏铺路,王馥荔谣言太离谱

被亲家欺负、争遗产被赶出家、为儿子演戏铺路,王馥荔谣言太离谱

揽星河的笔记
2026-04-15 16:26:41
张帅三盘惜败诺斯科娃,WTA500斯图加特站女单一轮游

张帅三盘惜败诺斯科娃,WTA500斯图加特站女单一轮游

王稱吃吃喝喝
2026-04-16 00:20:54
病从脚底生!身体有疾,脚上的8个症状,都是给你的警惕信号!

病从脚底生!身体有疾,脚上的8个症状,都是给你的警惕信号!

常笑健康
2026-03-13 15:32:32
火箭对湖人前瞻:东契奇伤情未明,里夫斯恢复训练能否出战?

火箭对湖人前瞻:东契奇伤情未明,里夫斯恢复训练能否出战?

舞指如飞
2026-04-16 01:23:44
印度惨遭羞辱:250万吨尿素全球招标,竟无人问津,中企集体缺席

印度惨遭羞辱:250万吨尿素全球招标,竟无人问津,中企集体缺席

通鉴史智
2026-04-15 11:43:12
中年女人,大多放不下这3个秘密,男人别不懂

中年女人,大多放不下这3个秘密,男人别不懂

热心市民小黄
2026-04-16 00:28:24
2026-04-16 03:23:00
BioArtMED
BioArtMED
BioArt旗下科普媒体
4719文章数 2468关注度
往期回顾 全部

科技要闻

ChatGPT十亿用户又怎样?Anthropic直接贴脸

头条要闻

法国全票通过 “将不义之财归还中国”

头条要闻

法国全票通过 “将不义之财归还中国”

体育要闻

三球准绝杀戴大金链:轰30+10自我救赎

娱乐要闻

谢娜现身环球影城,牵手女儿温馨有爱

财经要闻

业绩失速的Lululemon:"健康"人设崩塌?

汽车要闻

空间丝毫不用妥协 小鹏GX首发评测

态度原创

手机
艺术
游戏
亲子
本地

手机要闻

一加Ace6至尊版再次被确认:魔改天玑9500+165Hz屏,本月发布!

艺术要闻

看!波兰超模阿里亚纳的惊艳写真,身材让人心动不已!

《GTA6》抢劫玩法泄露引热议!NPC与警察全面升级

亲子要闻

孕妇200买水果被骂后续:已终止妊娠,男方崩溃砸东西,网友炸锅

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

无障碍浏览 进入关怀版