网易首页 > 网易号 > 正文 申请入驻

机器学习与列线图模型有望提升伴血管与神经“双重浸润”非转移性胃癌的预后预测能力

0
分享至

*仅供医学专业人士阅读参考

将列线图与先进的机器学习技术结合形成混合模型能够提升患者个体化管理水平,有望为伴“双重浸润”的胃癌病例临床决策提供参考。

胃癌仍然是全球重大的健康问题。得益于医疗技术的创新,包括内镜、手术、放疗、化疗和免疫治疗在内的多种有效治疗手段已显著改善了胃癌患者的预后。在这些治疗方式中,根治性切除术作为一种彻底切除肿瘤的手术方法,是可切除非转移性胃癌患者的首选治疗方案。对于手术切除而言,血管和神经浸润的存在是重要预后指标之一,然而,精确预测伴“双重浸润”胃癌病例的预后仍然是一项艰巨挑战。为满足这些复杂病例对预后预测的迫切需求,近期一项研究采用机器学习等技术构建预测模型 [1]。该模型的结果与列线图及第8版AJCC TNM分期系统进行了比较,显示预测准确性显著提升。基于精准医学原则,这些列线图与风险分层模型有望优化胃癌术后治疗策略,为个性化照护提供路线,从而潜在提升患者结局。

患者与方法

数据来源与研究人群

研究数据收集始于2005年5月1日,持续至2022年12月31日。胃癌诊断均经组织学确认,患者具备详细临床病理学信息。收集符合特定标准患者的随访数据,排除患有全身性肿瘤、临床信息不完整或有既往恶性肿瘤史的患者。肿瘤分期基于AJCC第8版TNM分类。研究方法流程见图1。参与者被随机分配到训练队列(70%患者)用于算法开发,以及验证队列(30%患者)用于测试。人口学资料采用频数、百分比、均数和标准差进行描述。


图1 胃癌训练队列和验证队列的研究人群入组流程图

预测变量

机器学习和列线图模型的变量涵盖了常用的数据类别,包括人口统计学、实验室检查结果、手术细节、肿瘤属性、蛋白质组学数据和病理报告。研究分析了多种可能与手术结局相关的因素,涵盖性别、患者手术时年龄、血管和神经浸润存在与否、肿瘤分期(pT分期)、阳性淋巴结数目、Lauren分型、肿瘤最大直径、胃切除术式、肿瘤生物标志物表达(AE1/AE3, CK20, CDX-2, SATB-2, SYN, CGA, CD56, PTEN, FHIT, MLH1, PMS2, Her-2, MSH2, MSH6)以及无复发生存期(RFS)。

研究终点

本研究模型预测的主要终点是RFS,定义为从手术到疾病复发(包括局部和远处复发)或任何原因死亡的时间。

机器学习模型

本研究中采用了三种先进的生存机器学习算法,包括随机生存森林(RSF)、决策生存树(DST)和极限梯度提升(XG Boosting)。为了优化这些算法的性能,研究在广泛的参数设置范围内进行了随机搜索,随后采用十倍交叉验证方法来准确估计模型性能,目标是最大化一致性指数(c-index)。

列线图开发

本研究旨在通过整合经Cox回归分析确定的变量,构建能够准确预测RFS的列线图。为确保这些列线图的可靠性,研究团队对多个RFS相关参数进行了Cox回归分析,并重复该过程10,000次以进行验证。

模型性能、拟合度与验证评估

采用区分度、校准度和决策曲线分析(DCA)评估模型性能。校准度用于评估模型预测事件的准确性,通过Brier评分确定。此外,还进行了敏感性分析以探讨数据集大小与模型性能的关系。

研究结果

队列特征

本研究共纳入559例患者。值得注意的是,男性胃癌发病率约为女性的五倍,这一趋势在训练队列和验证队列中均观察到。患者群体的平均年龄在训练队列中为58.94 ± 10.11岁,在验证队列中为58.81 ± 9.74岁。平均肿瘤最大直径在训练队列中为5.92 ± 2.51 cm,在验证队列中为5.92 ± 2.37 cm。中位随访时间为61个月(IQR:12–120个月),共记录到184例(32.9%)患者发生复发事件。训练队列和验证队列的复发率分别为32.2%和34.5%。尽管存在这些细微差异,两组的总生存期和RFS率具有可比性。所有研究变量在训练队列和验证队列中分布均衡,P值均大于0.05,表明数据集平衡良好。患者分布情况为:训练队列388例,验证队列171例,反映了临床病理特征、随访时间和蛋白质组学特征的均衡性。

机器学习模型评估与验证

机器学习模型表现出不同程度的区分能力,其中随机生存森林(RSF)表现最佳,c-index为0.791,其次是XG Boosting(0.788)和决策生存树(DST)模型(0.728)。曲线下面积(AUC)分析证实了机器学习模型增强的判别能力,RSF再次领先(AUC为0.861),其次是XG Boosting(0.852)和DST(0.771)。考虑到患者病情不断变化的性质,研究评估了模型在不同时间点的性能。观察到预测准确性随时间推移逐渐减弱。对于所有机器学习模型,c-index在60个月时达到峰值,同时预测误差最小,尤其是RSF和XG Boosting。使用综合Brier评分评估了60个月内的模型校准度,结果显示所有模型均具有值得称赞的校准度,评分极低(均<0.1),表明模型在预测中随时间推移保持了可靠的稳定性。

在所有模型中,预测伴“双重浸润”胃癌RFS的前三个重要特征保持一致:阳性淋巴结数目、肿瘤最大直径和年龄。鉴于RSF模型的卓越准确性,研究分析集中于此模型。结果显示,阳性淋巴结数目、肿瘤最大直径和年龄是RSF模型中最重要的预测特征。此外,敏感性分析表明,若从模型中排除阳性淋巴结数目,将导致平均c-index下降0.06。

研究通过决策曲线分析(DCA)探讨了不同模型的效用。结果表明,DST模型提供的收益相对较低。相比之下,RSF模型在训练队列和验证队列中均显示出最显著的净收益优势。RSF模型在风险阈值介于0.2至0.5之间的表现尤其令人印象深刻——校准曲线说明了所有机器学习模型的预测结果与实际结果之间存在强烈的对应关系。

机器学习模型的敏感性分析

为确定构建有效预测模型所需的最佳样本量,研究进行了敏感性分析,以探讨数据集大小如何影响模型性能。结果显示,对于两个队列,随着训练样本量的变化,准确度分数存在波动。在评估的模型中,与RSF和DST相比,XG Boosting在敏感性分析中均提供了最高的性能。同样明显的是,训练队列的敏感度分数均高于验证队列。例如,对于XG Boosting,训练队列的敏感度分数范围为0.81至0.87,验证队列为0.68至0.76。类似地,DST在训练队列的敏感度分数范围为0.82至0.95,验证队列为0.64至0.67。相比之下,RSF在训练队列的敏感度分数范围为0.85至0.88,验证队列为0.69至0.75。此外,随着样本量的增加,显示机器学习模型的预测准确性有所提高,这表明更多的数据会带来更稳定的模型性能。

设计与验证用于预测RFS的列线图模型

研究构建了一个列线图,用于评估影响胃癌患者RFS的决定因素。该列线图整合了通过RSF算法确定的九个关键变量,包括患者性别、年龄、阳性淋巴结数目、胃切除术式、肿瘤位置、分子标志物CD56和FHIT的表达谱、Ki67水平以及肿瘤最大直径。将这些因素整合到列线图模型中,有助于准确预测3年和5年RFS概率。该模型整合了多种预后因素,可用于估算患者在特定时间点(如3年、5年)的RFS概率,在训练组中对列线图性能的评估显示其具有较强预测能力,C-index为0.654(95% CI: 0.615-0.692),超过了AJCC第8版TNM分期(C-index: 0.543, 95% CI: 0.517–0.569)。内部和外部校准曲线显示预测结果与观察结果之间存在稳健的相关性。内部验证期间的时依ROC分析再次确认了列线图卓越的判别能力,3年RFS的AUC值为0.686(95%CI: 0.69-0.801),5年RFS的AUC值为0.749(95%CI: 0.666–0.838)。外部验证也产生了有希望的结果,3年RFS的AUC值为0.635(95% CI: 0.559–0.761),5年RFS的AUC值为0.644(95% CI: 0.519–0.824)。

决策分析曲线比较了列线图与AJCC第8版TNM分期在预测5年和3年RFS方面的临床效用。列线图的内部验证C-index为0.644(95% CI: 0.606–0.682),优于AJCC第8版TNM分期(C-index: 0.543, 95% CI: 0.517–0.569)。外部验证也显示了列线图的优越性,C-index为0.626(95% CI: 0.564–0.689),而AJCC第8版TNM分期为0.542(95% CI: 0.509–0.575)。这些更高的C-index值凸显了列线图卓越的预测准确性。

基于列线图预测RFS的风险分层系统评估

研究使用复杂的列线图技术对每位患者进行分类和评分,以确定其疾病复发风险。X-tile软件在初始的405例患者队列中确定了最佳的RFS评分截断值。随后的Log-rank检验分析阐明了不同风险类别之间生存结局的差异。应用预后列线图有助于分配总体评分,从而以165.66为阈值,将559名参与者清晰地划分为低风险组和高风险组。低风险组(评分≤165.66)包括训练集89例和验证集40例,而高风险组(评分>165.66)包括训练集299例和验证集131例。总队列、训练队列和验证队列的RFS生存曲线p值均 < 0.001,表明结果具有统计学显著性。在整个队列、训练队列和验证队列中,低风险组的中位生存期分别为77个月、77个月和51个月,而高风险组分别为24个月、24个月和24个月。风险类别之间预后的显著差异进一步证明了风险分层模型的有效性。

总结与讨论

研究结果表明,RSF算法展现出优异的预测准确性,优于其他算法方法。该模型在使用RSF技术时辨别患者结局的能力,显示出超越其他机器学习模型的区分度水平。这种增强的性能可能归因于独特的“双重浸润”特征,它模拟了血管和神经浸润同时存在的情况,这种情况通常预示着较差的临床生存结局,且其预后难以准确预测。当将RSF与传统机器学习模型进行比较时,很明显基于列线图的方法在识别高危患者方面具有显著优势。该工具为临床医生提供了宝贵的资产,提供了可以指导术后监测策略和个性化治疗干预的深刻见解。

机器学习和列线图方法在预测医学结局方面各有优劣。具体而言,机器学习算法在准确性和区分能力方面表现出色,但往往无法有效识别风险最高的患者。相反,列线图模型擅长进行风险分层,但缺乏机器学习技术的精确性。综合来看,最佳策略或许是利用两种方法的互补性:机器学习模型(如RSF)能提供更高的预测精度,而列线图则更适用于临床环境中的快速风险分层。二者结合使用,可为临床决策提供更全面的信息。

尽管前景广阔,但必须考虑当前研究的局限性。一个重要的局限性是模型仅使用单一医疗机构的数据进行开发和验证。这可能会限制模型的更广泛适用性。为了解决这个问题,需要在多个医疗中心验证我们的发现,以确定模型的稳健性。此外,研究未按疾病分期进行亚组分析,可能影响模型在不同阶段患者中的预测精度。最后,必须指出的是,本研究中探索的所有肿瘤标志物仅进行了定性分析,缺乏定量分析。在未来的研究中,根据患者的疾病阶段进行分层将有助于优化模型的预测能力。

参考文献:

[1]Hao Z, et al. Harnessing the machine learning and nomogram models: elevating prognostication in nonmetastatic gastric cancer with "double invasion" for personalized patient care. Eur J Med Res. 2025 Jun 23;30(1):517.

审批编号:CN-171212 有效期至:2026-11-07
本材料由阿斯利康提供,仅供医疗卫生专业人士参考

*此文仅用于向医疗卫生专业人士提供科学信息,不代表平台立场。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
阿根廷23岁1.9米中锋迎来国家队首秀 本赛季法甲12场9球排第1

阿根廷23岁1.9米中锋迎来国家队首秀 本赛季法甲12场9球排第1

智道足球
2025-11-15 09:20:41
尘埃落定!曾医生事件处理结果公布,“撤职留岗”引发舆论两极化

尘埃落定!曾医生事件处理结果公布,“撤职留岗”引发舆论两极化

史行途
2025-11-12 17:10:24
又一则励志新闻翻车了!

又一则励志新闻翻车了!

清书先生
2025-10-21 15:51:40
毛新宇少将担任副部长!妻子刘滨担任扇子协会会长

毛新宇少将担任副部长!妻子刘滨担任扇子协会会长

李昕言温度空间
2025-11-09 14:50:17
高圆圆又穿紧身裙,“蜜蜂臀”让人移不开目光,一般人没这好身材

高圆圆又穿紧身裙,“蜜蜂臀”让人移不开目光,一般人没这好身材

蓓小西
2025-11-15 09:42:24
新加坡总统公开警告中国,要想世界和平,中国得放弃一样东西!

新加坡总统公开警告中国,要想世界和平,中国得放弃一样东西!

南权先生
2025-11-14 16:17:25
巴菲特大规模买入AI,这是信号

巴菲特大规模买入AI,这是信号

贩财局
2025-11-15 13:40:39
关晓彤因为王安宇,绿了鹿晗!?

关晓彤因为王安宇,绿了鹿晗!?

八卦疯叔
2025-11-15 10:24:34
高市早苗涉台错误言论,在日本国内遭到多方质疑

高市早苗涉台错误言论,在日本国内遭到多方质疑

环球时报新闻
2025-11-15 14:08:40
薄一波晚年反省,当年不该支持此人上台,他给国家带来大麻烦

薄一波晚年反省,当年不该支持此人上台,他给国家带来大麻烦

扬平说史
2025-11-06 20:22:42
2025年全球游客访问量最高的国家/地区

2025年全球游客访问量最高的国家/地区

常涤非观点
2025-11-13 09:11:17
“拿金条砸特朗普,果然…”

“拿金条砸特朗普,果然…”

观察者网
2025-11-15 22:25:55
没收太子集团比特币带崩加密货币,特朗普家族损失已超过太子集团

没收太子集团比特币带崩加密货币,特朗普家族损失已超过太子集团

我不叫阿哏
2025-11-15 02:11:15
为什么朝鲜、巴基斯坦、柬埔寨集体对中国变脸?

为什么朝鲜、巴基斯坦、柬埔寨集体对中国变脸?

南权先生
2025-11-13 15:50:24
中国和俄罗斯投弃权票

中国和俄罗斯投弃权票

政知新媒体
2025-11-15 12:38:29
韩国U22主帅:本场是友谊赛,更期待和中国队在正式比赛交锋

韩国U22主帅:本场是友谊赛,更期待和中国队在正式比赛交锋

懂球帝
2025-11-15 22:33:26
霍震霆也没想到,44岁的儿媳郭晶晶再次官宣喜讯,让整个阔太圈都沉默了

霍震霆也没想到,44岁的儿媳郭晶晶再次官宣喜讯,让整个阔太圈都沉默了

科学发掘
2025-11-15 06:59:22
“买得起,用不起”,如果不是很有钱,劝你别买这5种电器

“买得起,用不起”,如果不是很有钱,劝你别买这5种电器

巢客HOME
2025-11-13 08:35:03
西方对俄罗斯的制裁手段已经用尽,扎哈罗娃表示内心毫无波澜!

西方对俄罗斯的制裁手段已经用尽,扎哈罗娃表示内心毫无波澜!

长安一片月
2025-11-14 22:35:54
正负值+17!轰13+3+4,谢泼德没让我失望,乌度卡赛后说出心里话

正负值+17!轰13+3+4,谢泼德没让我失望,乌度卡赛后说出心里话

巴叔GO聊体育
2025-11-15 12:41:25
2025-11-16 02:51:00
医学界肿瘤频道 incentive-icons
医学界肿瘤频道
医学界旗下子账号
12608文章数 75950关注度
往期回顾 全部

健康要闻

血液科专家揭秘白血病七大误区

头条要闻

大量日本民众围堵首相官邸 大喊:高市早苗下台

头条要闻

大量日本民众围堵首相官邸 大喊:高市早苗下台

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

钟嘉欣婚变风波升级!被骗婚?

财经要闻

小米之“惑”

科技要闻

撕掉流量外衣,小米还剩什么?

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

亲子
教育
家居
艺术
军事航空

亲子要闻

娃想学习不费劲?4 种家常健脑菜安排!补 DHA 提记忆超管用

教育要闻

天塌了啊:英国大学又开始搞大裁员了!

家居要闻

现代简逸 寻找生活的光

艺术要闻

她的笔下女子如此动人,晚年却名声扫地!

军事要闻

解密福建舰电磁弹射背后的硬核支撑

无障碍浏览 进入关怀版