ARTEMIS模型整合DNA甲基化主效应与交互作用,精准预测乳腺癌生存。
乳腺癌是全球女性中最常被诊断的癌症之一,也是癌症相关死亡的主要原因,其异质性强,预后受多种遗传与表观遗传因素影响[ 1]。尽管治疗手段不断进步,但患者生存率仍不理想[ 2]。DNA甲基化作为关键的表观遗传调控机制,通过影响基因表达在肿瘤发生中发挥重要作用[ 3]。此外,基因-基因(G×G)交互作用已被证实能显著影响复杂疾病的进展并提升预测模型的精度[ 4]。然而,现有大多数乳腺癌预后模型仅关注预测变量的主效应,忽略了G×G交互作用的重要性,且普遍存在样本量不足、缺乏独立验证等问题。
为解决上述局限,近期,一项研究利用来自多个独立队列的DNA甲基化数据与临床信息,开发并独立验证一个结合表观遗传生物标志物主效应及G×G交互作用的新型乳腺癌预后预测模型——ARTEMIS。本文对其主要内容进行梳理,以飨读者。
![]()
图1 研究标题
![]()
图2 研究概览
研究方法
研究设计与数据来源
研究从TCGA和GEO数据库获取了9个独立国际队列的乳腺癌组织DNA甲基化数据及癌旁正常组织数据。其中,四个具备完整临床信息(年龄、病理T分期、病理M分期、淋巴结状态、雌激素受体ER状态)和生存数据且样本量大于50的队列(TCGA, n=774;GSE72245, n=118;GSE37754, n=62;GSE75067, n=188)被用于模型的开发与验证。
生物标志物筛选与模型构建策略
研究采用创新的“3-D”建模策略:
双重效应类型:同时考虑CpG位点的主效应和G×G交互效应。
双重筛选步骤:在训练集(TCGA)中发现显著关联的CpG位点,随后在内部测试集(GSE72245)中进行验证,要求效应方向一致。
双重建模步骤:在TCGA队列中使用前向逐步回归确定最终模型变量,随后在三个独立测试集(GSE72245, GSE37754, GSE75067)中固定系数进行验证。
最终模型整合了2个具有主效应的CpG位点和6对具有G×G交互效应的CpG位点,以及关键的临床协变量。
模型评价与系统综述
在模型性能从三个方面评估:
区分能力:通过时间依赖性ROC曲线下面积(AUC)和一致性指数(C-index)衡量。
校准性能:通过期望与观察事件比(E/O ratio)评估。
临床效用:通过决策曲线分析(DCA)计算净收益(NB)和干预净减少率(NR)。
此外,研究遵循PRISMA和CHARMS指南,对截至2024年7月的乳腺癌预后预测模型进行了系统综述,以比较ARTEMIS与现有模型的性能。
![]()
图3 研究设计、统计分析及系统综述流程图
研究结果
模型的风险分层能力
根据ARTEMIS评分中位数将患者分为高风险组和低风险组。在训练集和所有测试集中,高风险组的总生存期均显著低于低风险组(训练集TCGA:HR = 9.98, 95% CI: 5.29–18.81;内部测试集GSE72245:HR = 3.56, 95% CI: 1.59–7.99;外部测试集GSE37754:HR = 3.91, 95% CI: 1.65–9.29;GSE75067:HR = 1.59, 95% CI: 1.06–2.40)(图4a-d)。当按评分百分位数进一步细分时,观察到明显的剂量反应关系,评分最高的组(>90th)死亡风险是评分最低组(<25th)的15.43倍(HR = 15.43, 95% CI: 9.57–24.88)(图4e-f)。
![]()
图4 基于ARTEMIS评分的乳腺癌患者Kaplan-Meier生存曲线
模型的区分与校准性能
ARTEMIS在预测3年和5年总生存率方面表现出色。在训练集(TCGA)中,3年和5年AUC分别为0.892和0.873。在内部及外部测试集中,AUC也保持在高水平(图5a-d)。荟萃分析显示,合并的3年AUC为0.844 (95% CI: 0.805–0.883),5年AUC为0.816 (95% CI: 0.775–0.857),合并C-index为0.803 (95% CI: 0.776–0.830)(图5e-g)。校准曲线显示预测生存率与实际观察值高度一致,合并E/O比值接近1(3年:1.060;5年:1.090)。
![]()
图5 ARTEMIS模型在不同队列中预测3年及5年生存率的ROC曲线及荟萃分析
模型的临床效用
决策曲线分析表明,与仅基于临床因素的基准模型相比,ARTEMIS能带来更高的临床净收益。例如,在阈值概率为0.4时,ARTEMIS对3年生存的净收益(NB)为19‰,而基准模型为7‰;对5年生存的NB,ARTEMIS为62‰,基准模型为29‰(图6a, c)。同时,ARTEMIS能显著减少不必要的临床干预(3年NR: 69.21%;5年NR: 56.01%)(图6b, d)。研究还提供了可视化的列线图以方便临床个体化预测(图6e)。
![]()
图6 决策曲线分析(DCA)展示临床效用及ARTEMIS列线图
系统综述证实ARTEMIS优势
系统综述共纳入209个已发表的乳腺癌预后模型(图5)。对比发现,ARTEMIS在预测准确性(AUC和C-index)、外推性能(在多个独立队列中验证)和样本量(总n=1142)三个方面综合表现最优(表1)。大多数现有模型(77.99%)基于mRNA,且未充分考虑临床变量和G×G交互作用。
![]()
图7 乳腺癌预后预测模型系统综述的文献筛选流程图
表1 ARTEMIS与其它报告了AUC和C-index的模型性能对比表
![]()
生物信息学分析与在线工具
对ARTEMIS中表观遗传预测因子对应的基因进行功能分析,发现其富集于多种癌症相关通路。基因网络分析揭示了这些基因与免疫检查点基因之间存在功能联系。进一步分析表明,ARTEMIS中的表观遗传评分与肿瘤免疫微环境特征显著相关,提示该模型在指导免疫治疗方面具有潜力。为促进临床应用,研究者开发了免费的在线工具(http://bigdata.njmu.edu.cn/ARTEMIS/),用户可通过输入临床变量和特定CpG位点的甲基化值,计算个体患者的ARTEMIS评分及预测生存率。
研究结论
本研究成功开发并独立验证了首个同时整合表观遗传生物标志物主效应及G×G交互作用的乳腺癌预后预测模型ARTEMIS。该模型在多个独立队列中展现出优异的区分能力、校准性能和临床效用,能够有效识别高危患者,辅助临床决策以优化干预策略。通过大规模系统综述,研究证实ARTEMIS在预测准确性、泛化能力和样本量方面优于现有大多数模型。
本研究的优势在于其创新的3-D建模策略、严格的独立验证流程以及便捷的在线工具。同时仍存在一定的局限性:目前主要聚焦于泛癌相关CpG位点、对长期(>10年)预测性能的评估尚有限,且模型建立基于线性假设的Cox回归。未来可通过纳入更多分子标志物、扩大样本量以及探索机器学习方法进一步提升模型性能。
总之,ARTEMIS是一个高效、稳健且实用的乳腺癌预后预测工具,为实现乳腺癌的精准医疗提供了有力的支持。
参考文献:
1.Siegel RL, et al. Cancer statistics, 2023. CA Cancer J Clin. 2023 Jan;73(1):17-48.
2.Waks AG, et al. Breast Cancer Treatment: A Review. JAMA. 2019 Jan 22;321(3):288-300.
3.Sharma S, et al. Epigenetics in cancer. Carcinogenesis. 2010 Jan;31(1):27-36.
4.Zhang R, et al. Independent Validation of Early-Stage Non-Small Cell Lung Cancer Prognostic Scores Incorporating Epigenetic and Transcriptional Biomarkers With Gene-Gene Interactions and Main Effects. Chest. 2020 Aug;158(2):808-819.
审批编号: CN-170923 有效期至: 2026-11-03
本材料由阿斯利康提供,仅供医疗卫生专业人士参考
*“医学界”力求所发表内容专业、可靠,但不对内容的准确性做出承诺;请相关各方在采用或以此作为决策依据时另行核查。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.