Cancer Cell | 大语言模型赋能肿瘤精准医学：临床治疗推荐准确率达93%|肿瘤学|欧洲肿瘤内科学会

Cancer Cell | 大语言模型赋能肿瘤精准医学：临床治疗推荐准确率达93%

2026-01-19 14:35:16　来源: BioArtMED

上海举报

分享至

撰文 | 水王星

肿瘤精准医学的核心是基于患者基因组生物标志物、癌症类型及治疗史制定个性化治疗方案，这一模式的落地高度依赖临床医生对海量分子靶向疗法及监管批准信息的精准把控。然而，近年来FDA批准的分子靶向疗法呈爆发式增长，仅2024至2025年间，MOAlmanac数据库收录的FDA批准疗法相关关联就增长了近3 倍，同时临床指南、期刊文献、监管机构官网等证据来源高度分散，部分新批准疗法缺乏广泛宣传，导致临床医生尤其是非肿瘤基因组专业的医师难以及时跟进最新诊疗进展，知识缺口可能延误最佳治疗时机。传统大语言模型（Large language models，LLM）虽在临床文本总结、医学考试等场景中展现出接近医师的能力，却受限于训练数据的知识截止期和领域针对性不足，面对精准肿瘤学中动态更新的知识，常出现推荐滞后、准确性不足等问题，难以直接应用于临床决策。

近日，来自美国丹娜-法伯癌症研究所、哈佛医学院及麻省理工学院博德研究所等机构的 Eliezer Van Allen 团队，在 Cancer Cell 期刊发表题为 A context-augmented large language model for accurate precision oncology medicine recommendations 的研究论文。该团队开发了一套基于检索增强生成（retrieval-augmented generation，RAG）技术的LLM框架，通过深度整合MOAlmanac这一专家精选的临床基因组数据库，实现了动态补充最新临床证据的功能，无需修改模型内部权重即可持续更新治疗推荐依据。该框架在234条2024年版MOAlmanac合成查询中达成95%的精确匹配准确率，在 81条来自15位临床肿瘤学家的真实世界查询中准确率高达93%，为精准肿瘤学临床决策提供了高效、可扩展且高度可靠的智能支持工具。

该研究的核心突破在于构建了一套适配精准肿瘤学需求的全流程优化方案，从知识补充、数据格式到检索机制均实现针对性创新。在知识动态更新层面，RAG 技术通过实时检索MOAlmanac数据库中的FDA批准疗法信息，完美弥补了传统 LLM知识滞后的缺陷。当2025年版MOAlmanac新增大量疗法关联后，框架仍能通过数据库同步实现高效推荐，而无需重新训练模型。在数据格式优化上，研究团队对比了非结构化数据（如药物说明书的 “适应症与用法” 章节文本）与结构化数据（人工整理的生物标志物, 疗法和癌症类型关联条目）的增强效果，发现结构化数据能更精准捕捉三者间的复杂逻辑，使模型在前列腺癌同源重组修复基因（homologous recombination repair，HRR) 基因突变相关治疗推荐中，精确匹配准确率从非结构化数据增强的4%、纯LLM的0%提升至63%，同时在 35种癌症类型、64种基因组生物标志物的广泛场景中保持稳定性能。检索机制方面，团队创新采用混合检索策略，先通过语义检索筛选出Top50相关上下文，再利用 Okapi BM25算法进行词汇相似度重排，通过自适应系数平衡语义与词汇相关性，最终在真实世界查询中较单一语义检索提升3%-9%的准确率，平均多生成4个部分正确的治疗推荐。

研究通过系统实验揭示了多项关键发现，为LLM在精准肿瘤学的应用提供了重要参考。在提示词优化阶段，团队测试了四种策略：基础提示词、范围限制提示词、系统角色提示词及组合提示词，发现基础提示词（“请以指定 JSON 格式提供每条治疗方案…… 查询：{prompt}”）表现最优，在Mistral NeMo 12B模型中达成82.9%的部分匹配准确率，显著优于其他三种策略（69.7%-79.9%），且这一优势在GPT-4o、GPT-4o mini等7种不同规模LLM中均保持一致，其中GPT-4o 在基础提示词策略下实现89.3%的部分匹配准确率，成为后续实验的首选模型。在模型性能验证中，结构化数据增强的优势贯穿始终：在2025年版MOAlmanac 的651条合成查询中，结构化RAG-LLM的精确匹配准确率虽因数据量扩张降至 59%，但仍显著高于非结构化增强（约 47%）和纯 LLM （62%-89% 区间下限），且精准度、F1 分数分别提升约 90% 和 69%；同时，增加检索上下文数量（从 10 条增至 25 条）进一步优化了模型表现。在真实世界场景中，框架展现出强大的实用性：针对21条验证查询和81条测试查询，涵盖肺癌、乳腺癌和前列腺癌等多种常见肿瘤及罕见癌症，混合检索策略均实现最优性能，尤其在处理复杂临床场景（如联合治疗方案推荐、罕见生物标志物匹配）时，能有效捕捉细粒度治疗决策依据。此外，研究还探索了框架的泛化能力，整合 CIViC 数据库后，虽整体准确率较 MOAlmanac 增强（53%-76%）有所下降（37%-62%），但在10条涉及超适应症或研究性疗法的查询中，表现优于MOAlmanac增强模型，证实了框架在不同数据库适配中的灵活性。

该研究构建的RAG-LLM框架具有重要的临床价值与广阔的应用前景。首先，它有效解决了精准肿瘤学知识碎片化的痛点，将分散于不同来源的FDA批准信息、生物标志物关联证据整合为统一查询入口，减少医生在多个平台间切换检索的时间成本。其次，框架降低了精准肿瘤学的应用门槛，无需复杂计算资源即可部署，尤其能为非学术机构的肿瘤科医生提供专业支持。再者，框架具备高度灵活的适配性，可在FDA与EMA等不同地区监管标准间切换，未来整合区域数据库后有望实现全球范围内的个性化推荐，同时通过bias审计、嵌入校准等方式，可进一步提升不同患者群体间的公平性。值得注意的是，研究也指出了当前的局限性，如部分乳腺癌联合治疗方案推荐不完全、对无FDA批准疗法的场景可能误推荐超适应症药物等，未来可通过整合临床指南、临床试验数据、电子健康记录，以及优化嵌入模型、引入思维链提示词等方式持续完善。

https://doi.org/10.1016/j.ccell.2025.12.017

制版人：十一

学术合作组织

（*排名不分先后）

战略合作伙伴

（*排名不分先后）

转载须知

【原创文章】BioArt原创文章，欢迎个人转发分享，未经允许禁止转载，所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利，违者必究。

BioArt

Med

Plants

人才招聘

近期直播推荐

点击主页推荐活动

关注更多最新活动！

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.