网易首页 > 网易号 > 正文 申请入驻

Cancer Cell | 大语言模型赋能肿瘤精准医学:临床治疗推荐准确率达93%

0
分享至


撰文 | 水王星

肿瘤精准医学的核心是基于患者基因组生物标志物、癌症类型及治疗史制定个性化治疗方案,这一模式的落地高度依赖临床医生对海量分子靶向疗法及监管批准信息的精准把控。然而,近年来FDA批准的分子靶向疗法呈爆发式增长,仅2024至2025年间,MOAlmanac数据库收录的FDA批准疗法相关关联就增长了近3 倍,同时临床指南、期刊文献、监管机构官网等证据来源高度分散,部分新批准疗法缺乏广泛宣传,导致临床医生尤其是非肿瘤基因组专业的医师难以及时跟进最新诊疗进展,知识缺口可能延误最佳治疗时机。传统大语言模型(Large language models,LLM) 虽在临床文本总结、医学考试等场景中展现出接近医师的能力,却受限于训练数据的知识截止期和领域针对性不足, 面对精准肿瘤学中动态更新的知识,常出现推荐滞后、准确性不足等问题,难以直接应用于临床决策 。

近日,来自美国丹娜-法伯癌症研究所、哈佛医学院及麻省理工学院博德研究所等机构的 Eliezer Van Allen 团队,在 Cancer Cell 期刊发表题为 A context-augmented large language model for accurate precision oncology medicine recommendations 的研究论文。该团队开发了一套基于检索增强生成(retrieval-augmented generation,RAG) 技术的LLM框架,通过深度整合MOAlmanac这一专家精选的临床基因组数据库,实现了动态补充最新临床证据的功能,无需修改模型内部权重即可持续更新治疗推荐依据。 该框架在234条2024年版MOAlmanac合成查询中达成95%的精确匹配准确率,在 81条来自15位临床肿瘤学家的真实世界查询中准确率高达93%,为精准肿瘤学临床决策提供了高效、可扩展且高度可靠的智能支持工具 。


该研究的核心突破在于构建了一套适配精准肿瘤学需求的全流程优化方案,从知识补充、数据格式到检索机制均实现针对性创新。在知识动态更新层面,RAG 技术通过实时检索MOAlmanac数据库中的FDA批准疗法信息,完美弥补了传统 LLM知识滞后的缺陷。当2025年版MOAlmanac新增大量疗法关联后,框架仍能通过数据库同步实现高效推荐,而无需重新训练模型。在数据格式优化上,研究团队对比了非结构化数据 (如药物说明书的 “适应症与用法” 章节文本) 与结构化数据 (人工整理的生物标志物, 疗法和癌症类型关联条目) 的增强效果,发现结构化数据能更精准捕捉三者间的复杂逻辑,使模型在前列腺癌同源重组修复基因 (homologous recombination repair,HRR) 基因突变相关治疗推荐中,精确匹配准确率从非结构化数据增强的4%、纯LLM的0%提升至63%,同时在 35种癌症类型、64种基因组生物标志物的广泛场景中保持稳定性能。检索机制方面,团队创新采用混合检索策略,先通过语义检索筛选出Top50相关上下文,再利用 Okapi BM25算法进行词汇相似度重排,通过自适应系数平衡语义与词汇相关性,最终在真实世界查询中较单一语义检索提升3%-9%的准确率,平均多生成4个部分正确的治疗推荐。

研究通过系统实验揭示了多项关键发现,为LLM在精准肿瘤学的应用提供了重要参考。在提示词优化阶段,团队测试了四种策略:基础提示词、范围限制提示词、系统角色提示词及组合提示词,发现基础提示词 (“请以指定 JSON 格式提供每条治疗方案…… 查询:{prompt}”) 表现最优,在Mistral NeMo 12B模型中达成82.9%的部分匹配准确率,显著优于其他三种策略 (69.7%-79.9%) ,且这一优势在GPT-4o、GPT-4o mini等7种不同规模LLM中均保持一致,其中GPT-4o 在基础提示词策略下实现89.3%的部分匹配准确率,成为后续实验的首选模型。在模型性能验证中,结构化数据增强的优势贯穿始终:在2025年版MOAlmanac 的651条合成查询中,结构化RAG-LLM的精确匹配准确率虽因数据量扩张降至 59%,但仍显著高于非结构化增强 (约 47%) 和纯 LLM (62%-89% 区间下限) ,且精准度、F1 分数分别提升约 90% 和 69%;同时,增加检索上下文数量 (从 10 条增至 25 条) 进一步优化了模型表现。在真实世界场景中,框架展现出强大的实用性:针对21条验证查询和81条测试查询,涵盖肺癌、乳腺癌和前列腺癌等多种常见肿瘤及罕见癌症,混合检索策略均实现最优性能,尤其在处理复杂临床场景 (如联合治疗方案推荐、罕见生物标志物匹配) 时,能有效捕捉细粒度治疗决策依据。此外,研究还探索了框架的泛化能力,整合 CIViC 数据库后,虽整体准确率较 MOAlmanac 增强 (53%-76%) 有所下降 (37%-62%) ,但在10条涉及超适应症或研究性疗法的查询中,表现优于MOAlmanac增强模型,证实了框架在不同数据库适配中的灵活性。

该研究构建的RAG-LLM框架具有重要的临床价值与广阔的应用前景。首先,它有效解决了精准肿瘤学知识碎片化的痛点,将分散于不同来源的FDA批准信息、生物标志物关联证据整合为统一查询入口,减少医生在多个平台间切换检索的时间成本。其次,框架降低了精准肿瘤学的应用门槛,无需复杂计算资源即可部署,尤其能为非学术机构的肿瘤科医生提供专业支持。再者,框架具备高度灵活的适配性,可在FDA与EMA等不同地区监管标准间切换,未来整合区域数据库后有望实现全球范围内的个性化推荐,同时通过bias审计、嵌入校准等方式,可进一步提升不同患者群体间的公平性。值得注意的是,研究也指出了当前的局限性,如部分乳腺癌联合治疗方案推荐不完全、对无FDA批准疗法的场景可能误推荐超适应症药物等,未来可通过整合临床指南、临床试验数据、电子健康记录,以及优化嵌入模型、引入思维链提示词等方式持续完善。


https://doi.org/10.1016/j.ccell.2025.12.017

制版人: 十一

学术合作组织

(*排名不分先后)



战略合作伙伴

(*排名不分先后)



转载须知

【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。

BioArt

Med

Plants

人才招聘

近期直播推荐

点击主页推荐活动

关注更多最新活动!


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
心海:一片无法抵达却永存的潮汐

心海:一片无法抵达却永存的潮汐

疾跑的小蜗牛
2026-01-19 22:09:40
经纪人回应梁小龙去世原因:他不喝酒,不是睡梦中心梗

经纪人回应梁小龙去世原因:他不喝酒,不是睡梦中心梗

红星新闻
2026-01-19 21:36:00
专家孟晓苏呼吁:“要叫停法拍房。有些法拍房折价50%,连带周边房价全面下跌

专家孟晓苏呼吁:“要叫停法拍房。有些法拍房折价50%,连带周边房价全面下跌

张晓磊
2026-01-18 11:22:45
巨额年终奖!64万元/人!

巨额年终奖!64万元/人!

中国基金报
2026-01-19 17:38:24
大衣哥跳楼身亡、赵本山灵堂、宋佳知三当三,造谣的越来越离谱了

大衣哥跳楼身亡、赵本山灵堂、宋佳知三当三,造谣的越来越离谱了

黄谋仕
2025-12-20 17:54:00
伊朗外交官叛逃瑞士,政权信任危机曝光

伊朗外交官叛逃瑞士,政权信任危机曝光

桂系007
2026-01-18 23:33:45
自助餐为什么吃不回本?内部员工透露:进门开始,你就已经被套路

自助餐为什么吃不回本?内部员工透露:进门开始,你就已经被套路

平说财经
2026-01-19 16:48:32
伊朗再次强烈警告美军,美以胆敢袭击伊朗,将处决数万名游行群众

伊朗再次强烈警告美军,美以胆敢袭击伊朗,将处决数万名游行群众

黑洞观星
2026-01-19 18:18:20
原来有这么多不体面但挣钱的小生意!原来都是闷声发大财啊!

原来有这么多不体面但挣钱的小生意!原来都是闷声发大财啊!

另子维爱读史
2025-12-06 22:09:07
269元!小米新品又卖爆了,一个搞定华为、苹果全家桶

269元!小米新品又卖爆了,一个搞定华为、苹果全家桶

雷科技
2026-01-19 16:21:53
口碑反转!王菲没想到,负债累累的李亚鹏,如今却让自己“难堪”

口碑反转!王菲没想到,负债累累的李亚鹏,如今却让自己“难堪”

白面书誏
2026-01-19 17:22:22
几乎全是假货!利润高达2400%,为何消费者还前赴后继争相购买?

几乎全是假货!利润高达2400%,为何消费者还前赴后继争相购买?

八斗小先生
2025-11-29 13:00:49
A股:周一夜晚传来2大核弹级消息!明天很可能会迎更大级别大行情?

A股:周一夜晚传来2大核弹级消息!明天很可能会迎更大级别大行情?

股市皆大事
2026-01-19 18:52:30
国家统计局:2025年,全国居民人均可支配收入43377元,比上年名义增长5.0%,扣除价格因素,实际增长5.0%

国家统计局:2025年,全国居民人均可支配收入43377元,比上年名义增长5.0%,扣除价格因素,实际增长5.0%

每日经济新闻
2026-01-19 10:13:21
日专家曾警告:一旦爆发战争,日军将对中国军舰发起“三重打击”

日专家曾警告:一旦爆发战争,日军将对中国军舰发起“三重打击”

鸟儿太能吃
2026-01-19 23:20:54
为什么不能“倒水冲厕”?很多人不懂,看似节俭实则隐患很大!

为什么不能“倒水冲厕”?很多人不懂,看似节俭实则隐患很大!

妙招酷
2026-01-04 23:16:42
乐趣:一种发掘者的自觉

乐趣:一种发掘者的自觉

疾跑的小蜗牛
2026-01-19 22:01:37
藏的太深了!没想到莎莎手链和生日戒指是同一系列,还都有编码

藏的太深了!没想到莎莎手链和生日戒指是同一系列,还都有编码

白宸侃片
2026-01-19 07:30:52
北约历史性一幕发生,77年来首次;德国总理决定:马上带人去中国

北约历史性一幕发生,77年来首次;德国总理决定:马上带人去中国

时尚的弄潮
2026-01-20 00:30:32
西班牙首相宣布为高铁事故遇难者举行三天哀悼

西班牙首相宣布为高铁事故遇难者举行三天哀悼

澎湃新闻
2026-01-20 01:26:08
2026-01-20 02:19:00
BioArtMED
BioArtMED
BioArt旗下科普媒体
4248文章数 2466关注度
往期回顾 全部

科技要闻

这一仗必须赢!马斯克死磕芯片"9个月一更"

头条要闻

除吴孟达、梁小龙外 十多位周星驰电影中的配角已离世

头条要闻

除吴孟达、梁小龙外 十多位周星驰电影中的配角已离世

体育要闻

错失英超冠军奖牌,他却在德甲成为传奇

娱乐要闻

吴磊起诉白珊珊诽谤,白珊珊称被盗号

财经要闻

公章争夺 家族反目 双星为何从顶端跌落?

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

旅游
教育
房产
亲子
公开课

旅游要闻

什刹海后海冰场明日营业,仅支持现场购票

教育要闻

2026成都最新转学政策来了,家长们请注意

房产要闻

中旅・三亚蓝湾发布会揭秘自贸港好房子高阶形态

亲子要闻

宝妈必学,孩子不懂对侵犯说不,任何人都有可能是坏人!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版