*仅供医学专业人士阅读参考
面对传统分子检测的临床瓶颈,AI深度学习展现出作为高效辅助工具的潜力。
肺癌是全球第二常见的恶性肿瘤,也是癌症相关死亡的首要原因。其中,非小细胞肺癌(NSCLC)约占全部肺癌病例的85%[1]。随着分子检测技术的快速发展,ALK、EGFR、ROS1、KRAS等驱动基因陆续被发现,推动了靶向治疗时代的到来。尽管分子分型在精准治疗中发挥着关键作用,但传统分子检测方法(如NGS、FISH、IHC)仍存在取材受限、检测周期长、成本较高等问题,难以满足临床中快速、普适的分子诊断需求。
近年来,人工智能(AI)及深度学习技术的迅猛发展,为这一难题提供了新的解决思路。越来越多研究发现,常规的苏木精-伊红(H-E)染色病理切片,全切片图像可用于预测肿瘤的分子特征,从而实现对驱动基因状态的智能识别和筛查。
近期,
Translational Lung Cancer Research发表了一项 研究 , 通过系统综述与荟萃分析方法,整合了近年来利用深度学习模型从 H-E 染色 全切片图像预测 NSCLC驱动基因突变的相关证据,旨在评估其诊断准确性及临床应用潜力,为未来精准病理学的发展提供循证依据。
研究方法
研究团队从Embase、Medline、Web of Science、Cochrane、LILACS等数据库检索文献,辅以手工检索与Google Scholar滚雪球检索以补充资料。纳入标准为:使用H-E全切片图像并以深度学习模型预测NSCLC相关驱动基因的原始研究,且报告关键诊断指标,如综合受试者工作特征曲线下面积(AUROC)、敏感性、特异性等;仅纳入英文或西班牙文文献[1]。
提取内容包括模型架构、数据来源、全切片图片数量、补丁大小、预处理方法、训练/验证方案及TP/FP/FN/TN等指标。研究质量通过2024年CLAIM检查表评估,并对频次足够的基因采用荟萃分析汇总AUROC、敏感性与特异性,同时进行敏感性分析和异质性探讨以评估结论稳健性。
研究结果
▌文献检索与总体纳入情况
通过系统检索,共获得6,872篇潜在相关文献,并在去重及筛选后,最终纳入23项符合标准的研究进行分析。这些研究发表于2018年至2025年间,显示出近年来AI在病理学领域的研究热度持续上升。其中,2021年至2024年间的发表量明显上升,反映出深度学习模型在预测NSCLC分子改变方面已成为新的研究热点。
▌研究分布与数据来源
从地域分布来看,在纳入的研究中,约1/3来自中国和美国,其余研究分别来自德国、日本、法国、加拿大、波兰和以色列等国家,这体现出该领域的研究具有明显的国际化趋势。
在数据来源方面,65%的模型基于癌症基因组图谱(TCGA)数据库训练,其余则采用机构自建或商业数据库。然而,仅有5项研究进行了外部验证,提示模型的跨数据集泛化能力仍需进一步验证。
▌深度学习模型类型与技术特征
卷积神经网络(CNN)是最常用的算法框架,其中InceptionV3、ResNet、EfficientNet和DenseNet等架构使用频率最高,占比超过70%。此外,部分研究引入了视觉变换器、多实例学习及自监督学习等新兴技术,用以提升模型的特征提取与泛化能力。
在图像预处理方面,主流方法包括背景去除、颜色归一化及伪影过滤;少数研究采用生成对抗网络(GAN)进行数据增强,以提高模型的稳健性。总体来看,模型复杂度和训练数据量与预测性能呈正相关。
▌关键基因预测性能
荟萃分析结果显示,不同驱动基因的预测准确性存在一定差异。其中,ALK融合的预测表现最为突出,总体敏感性为80%(95% CI,53%–94%),特异性为85%(95% CI,39%–98%),AUROC超过0.8,显示出较高的辨识能力。EGFR突变的预测结果亦较为理想,敏感性为80%(95% CI,72%–86%),特异性为77%(95% CI,69%–83%),提示模型在识别EGFR突变样本方面具备良好的一致性和稳定性。
![]()
图1.深度学习模型预测ALK融合的敏感性与特异性
![]()
图2.深度学习模型预测EGFR突变的敏感性与特异性
模型对TP53突变的预测能力相对居中,敏感性与特异性均约为70%(95% CI,65%–75%)。对于KRAS与STK11等基因,AUROC值介于0.61至0.69之间,预测性能有限;而BRAF突变的平均敏感性仅为51%,为所有基因中最低,提示模型对该突变类型的识别仍存在明显不足。
![]()
图3.深度学习模型预测TP53突变的敏感性与特异性
总体来看,ALK和EGFR相关模型的预测性能最为稳定,显示出在临床分子筛查中的潜在应用价值。这可能与其突变所导致的细胞形态学变化较为显著有关,使得模型能够从病理图像中捕捉到可识别的特征模式。相比之下,KRAS、STK11及BRAF等突变在组织学层面的形态差异较弱,且受样本量和数据异质性影响较大,导致模型的学习效果和泛化能力受到一定限制。
此外,不同研究中所采用的算法结构、数据预处理策略以及训练样本规模的差异,也可能是造成各基因预测性能差异的重要因素。值得注意的是,部分研究利用多实例学习或自监督学习策略对模型进行优化后,EGFR和ALK的预测性能均有明显提升,提示模型架构与训练机制的改进是未来提升AI病理诊断精度的关键方向。
▌模型表现与可解释性分析
性能优异的模型多采用迁移学习或自监督学习策略,能够在外部验证集上保持较高的泛化性能。部分研究使用可解释人工智能(xAI)方法,直观显示模型在组织切片中关注的关键区域,发现AI识别的特征区域与病理专家关注的形态学模式具有一致性,这为模型的临床可用性提供了支持。
▌研究质量与敏感性分析
根据CLAIM(2024版)质量评估标准,所有纳入研究的质量评分均超过70%,方法学总体可靠。敏感性分析结果表明,当排除表现最佳模型后,EGFR与ALK预测性能略有下降,但总体趋势保持稳定,提示结果具有较高的稳健性。
讨论与启示
本研究系统探讨了深度学习模型在基于组织病理学图像预测NSCLC驱动基因突变方面的研究进展,并通过荟萃分析综合评估了其诊断性能。结果显示,深度学习模型能够在常规H-E染色切片上识别肿瘤的分子特征,尤其在ALK融合和EGFR突变预测方面表现出较高的准确性。这一发现为肺癌的精准诊断提供了新的思路,也揭示了AI在病理学领域的巨大潜力。相较于传统的分子检测技术,AI的病理分析不仅能够降低检测成本、缩短诊断周期,还能在样本量有限或无法进行分子实验的情况下提供辅助性分子分型结果。
然而,本研究亦揭示出当前领域存在的诸多挑战与局限。首先,大多数模型仍依赖于公共数据库,缺乏多中心、真实世界的外部验证,导致其在不同人群及不同病理制片标准下的泛化能力仍需进一步验证。其次,各研究间在数据预处理流程、模型架构、图像分辨率以及性能评价指标方面差异较大,缺乏统一的技术与质量控制标准,这在一定程度上制约了研究结果的可比性与临床应用。此外,尽管部分研究采用热力图或显著性分析方法展示模型的关注区域,但如何将这些图像特征与病理学形态学依据建立稳定对应关系,仍需深入探索。
未来,AI在肺癌病理分子预测领域的发展应聚焦于多模态整合与临床验证。一方面,结合影像组学、基因组学及临床信息的综合模型有望进一步提升预测精度与稳健性;另一方面,应加强大样本、多机构合作研究,推动模型在真实世界场景下的验证与优化。同时,xAI技术的持续进步将有助于提高临床医生对AI模型的信任度与使用意愿,促进AI病理学工具在精准诊疗体系中的落地应用。
参考文献:
[1] Parra-Medina R, Guerron-Gomez G, Mendivelso-González D, et al. Deep learning in histopathology images for prediction of oncogenic driver molecular alterations in lung cancer: a systematic review and meta-analysis. Transl Lung Cancer Res. 2025 May 30;14(5):1756-1769.
*此文仅用于向医疗卫生专业人士提供科学信息,不代表平台立场。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.