网易首页 > 网易号 > 正文 申请入驻

文献精读:开发基于机器学习的HCC早期诊断预测模型

0
分享至

*仅供医学专业人士阅读参考

eHCC-pred模型将HCC早期诊断的准确率从78.15%提升至97%。

肝细胞癌(HCC)的诊断通常依赖于影像学检查或组织活检。尽管大多数HCC病例在影像学上具有特异性表现,但仍有约10%的肿瘤(在直径为1-2cm的肿瘤中,这一比例可高达30%)缺乏典型的影像学特征[1]。在临床上怀疑HCC但影像学特征不典型的情况下,不应推迟进行活检或安排复查。若复查结果仍然不明确,则应进行活检[2]。然而,活检样本若采集位置不精确,可能导致误诊(即假阴性结果)。对于从非肿瘤(如肝硬化或正常)组织中采集到的HCC活检样本,小活检样本的诊断假阴性率大约在30%-50%[3,4]。因此,开发新的分子标志物对于早期HCC的诊断尤为关键,特别是在活检样本位置可能存在偏差的情况下。

近期,一项研究利用大样本数据,结合最小冗余最大相关性(mRMR)和最大相关性最大距离(MRMD)两种特征选择方法,并融合八种基于机器学习的算法,开发出一种用于HCC早期预测的模型(eHCC-pred)。该模型将HCC早期诊断的准确率从78.15%提升至97%,有望在个体化水平上稳定地应用于临床实践,助力HCC的早期诊断。该模型可于http://www.dulab.com.cn/eHCC-pred/免费获取[5]。医学界整理该研究内容如下,以供参考。

研究方法

本项研究采用了来自三个公共数据库(GEO、ICGC和TCGA)的46个数据集,共计5586个组织样本,其中包含4045个肝细胞癌(HCC)样本、416个未发生HCC的肝硬化(CwoHCC)样本、334个伴有HCC的肝硬化(CwHCC)样本以及791个未发生HCC的正常肝组织(NwHCC)样本。

GEO数据库的44个转录组数据集包含3431个HCC样本、416个CwoHCC样本、334个CwHCC样本和741个NwHCC样本。数据通过Affymetrix、Agilent和Illumina平台检测,Affymetrix芯片数据集经RMA方法处理,Agilent和Illumina芯片数据集使用预处理数据。ICGC和TCGA数据集分别包含243个和371个HCC样本,以及50个NwHCC样本。研究还使用了HPA数据库下载的2902个分泌基因数据。

研究结果

1.HCC预测模型的推导

本研究的整体分析流程如图1所示。首先,基于988个HCC样本和332个CwoHCC样本的基因表达谱,分别获得了25,341,086对和20,559,429对稳定的基因对。在这两组基因对中,有5765对基因对在HCC组织和CwoHCC组织之间表现出稳定的逆转关系。接着,通过筛选2902个分泌基因中的基因对,最终获得了242对基因对,这些基因对中的基因i和基因j均为分泌基因。随后,基于包含242个特征(基因对)的新数据集提取了最佳特征。

图1. 整体分析流程

表1展示了基于准确率、F1分数适应函数和AUC值对不同预测模型分类性能的比较。表1的结果表明,包括mRMR + KNN、mRMR + SVM、mRMR + LR、mRMR + XGBoost、mRMR + LMT、MRMD + KNN、MRMD + SVM、MRMD + LR和MRMD + LMT在内的九种预测模型,在所有性能指标上均表现优异,准确率、F1分数和AUC值均达到1。

在这九种预测模型中,mRMR + KNN和mRMR + SVM的基因对数量最少,仅包含11对基因对(表2)。

2.HCC预测模型的验证

使用独立数据集(包括测试集、GEO数据集、ICGC数据集和TCGA数据集)对各种算法的性能进行了验证。如表3所示,对于3057个HCC样本和84个CwoHCC样本,MRMD + SVM预测模型(包含28对基因对)在独立数据集中获得了最高的准确率和F1分数,其准确率、F1分数和AUC值分别为0.9834、0.9915和0.9278。而mRMR + SVM预测模型(包含11对基因对)在独立数据集中获得了最高的AUC值0.9384,高于其他预测模型。因此,在后续分析中重点关注这三个预测模型。他们在活检样本和手术样本中的详细验证结果如表4所示。

  • 活检样本

在测试集(29个HCC样本和48个CwoHCC样本)中,mRMR + SVM预测模型和mRMR + KNN预测模型均实现了1的敏感性和1的特异性,而MRMD + SVM预测模型的敏感性为1,特异性为0.8542。在GEO活检数据集中(GSE121248, GSE47197),mRMR + SVM预测模型正确分类了96.18%的HCC样本,mRMR + KNN预测模型正确分类了66.41%的HCC样本,而MRMD + SVM预测模型对131个HCC样本的分类准确率达到了100%。

  • 手术样本

在测试集(220个HCC样本和36个CwoHCC样本)中,mRMR + SVM预测模型和mRMR + KNN预测模型的敏感性和特异性均为1,而MRMD + SVM预测模型的敏感性为1,特异性为0.8889。

这些结果表明,在使用活检样本时,mRMR + SVM预测模型、mRMR + KNN预测模型和MRMD + SVM预测模型均能够准确区分HCC和CwoHCC。

3.与现有预测模型的比较

对于1800个HCC样本,Ao教授团体开发的模型、本研究团队既往开发的模型以及本次提出的mRMR + SVM预测模型和MRMD + SVM预测模型的准确度分别为0.6639、0.7656、0.8428和0.9872。对于1931个HCC样本,Ao方法的准确度为0.6572,本研究团队既往方法的准确度为0.7815,而mRMR + SVM预测模型和MRMD + SVM预测模型的准确度分别提高到0.8503和0.97。上述结果表明,mRMR + SVM预测模型和MRMD + SVM预测模型在与现有预测模型相比,表现更为优越。

最终,本研究成功开发了一种基于机器学习的HCC早期诊断预测模型eHCC-pred。该模型集成了两种不同的机器学习预测算法:MRMD + SVM和mRMR + SVM,将HCC早期识别的准确率从78.15%提升至97%,将为临床医生提供了更为精确的工具,以期在HCC的早期阶段就进行有效的干预和治疗。

医生站网页版上线啦

无需下载便可浏览更多外科资讯

参考文献:

[1]Llovet JM, Kelley RK, Villanueva A, et al. Hepatocellular carcinoma. Nat Rev Dis Primers. 2021 Jan 21;7(1):6. doi: 10.1038/s41572-020-00240-3. Erratum in: Nat Rev Dis Primers. 2024 Feb 12;10(1):10.

[2]Marrero JA, Kulik LM, Sirlin CB, et al. Diagnosis, Staging, and Management of Hepatocellular Carcinoma: 2018 Practice Guidance by the American Association for the Study of Liver Diseases. Hepatology. 2018 Aug;68(2):723-750.

[3]Forner A, Llovet JM, Bruix J. Hepatocellular carcinoma. Lancet. 2012 Mar 31;379(9822):1245-55.

[4]Villanueva A, Minguez B, Forner A, et al. Hepatocellular carcinoma: novel molecular approaches for diagnosis, prognosis, and therapy. Annu Rev Med. 2010;61:317-28.

[5]Zhang ZM, Huang Y, Liu G, et al. Development of machine learning-based predictors for early diagnosis of hepatocellular carcinoma. Sci Rep. 2024 Mar 4;14(1):5274.

审批编号:CN-150407 有效期至:2025-12-18

本材料由阿斯利康提供,仅供医疗卫生专业人士参考

此文仅用于向医疗卫生专业人士提供科学信息,不代表平台立场。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈法拉同时登上时尚杂志不同地区封面——自我实力的又一次展现

陈法拉同时登上时尚杂志不同地区封面——自我实力的又一次展现

雅儿姐游世界
2026-02-14 13:30:21
倪萍:父亲到死我都没喊他一声“爸”,母亲的仇恨教育刻骨铭心

倪萍:父亲到死我都没喊他一声“爸”,母亲的仇恨教育刻骨铭心

白面书誏
2025-11-22 17:18:59
全国上千万满族人,满语满文怎么还这么快就要消亡了?

全国上千万满族人,满语满文怎么还这么快就要消亡了?

历史按察使司
2026-02-14 08:00:03
上海大叔55岁未婚,住垃圾堆却要穿名牌,打开冰箱后才知啥叫生活

上海大叔55岁未婚,住垃圾堆却要穿名牌,打开冰箱后才知啥叫生活

寒士之言本尊
2025-09-08 23:20:45
菲律宾博主为流量吃剧毒魔鬼蟹,2天后身亡,尸体嘴唇呈深蓝色

菲律宾博主为流量吃剧毒魔鬼蟹,2天后身亡,尸体嘴唇呈深蓝色

狸猫之一的动物圈
2026-02-14 11:42:30
59岁宋祖英现身活动状态惊艳!短发利落大气,黑色套装优雅端庄

59岁宋祖英现身活动状态惊艳!短发利落大气,黑色套装优雅端庄

琴声飞扬
2026-02-12 11:51:25
库里致敬保罗:只想说声恭喜,这是一段不可思议的职业生涯

库里致敬保罗:只想说声恭喜,这是一段不可思议的职业生涯

懂球帝
2026-02-14 12:55:04
4 大新升级!新 iPhone 官宣:2月19日,即将发布

4 大新升级!新 iPhone 官宣:2月19日,即将发布

科技堡垒
2026-02-14 10:29:51
1万人看傻!花滑超级冷门:世界第1噩梦2次摔倒+3次跳空 仅排第8

1万人看傻!花滑超级冷门:世界第1噩梦2次摔倒+3次跳空 仅排第8

风过乡
2026-02-14 08:10:07
别被马斯克忽悠了!星链撑不起人类通讯,中国通信基建才是底气

别被马斯克忽悠了!星链撑不起人类通讯,中国通信基建才是底气

像梦一场a
2026-02-13 20:20:26
59年,左大玢指出毛主席念错自己名字,主席笑道:回去问问你爸爸

59年,左大玢指出毛主席念错自己名字,主席笑道:回去问问你爸爸

叹为观止易
2026-02-03 14:15:30
联合国前主席称:中国人的风俗,世界上没有一个国家能够学得来

联合国前主席称:中国人的风俗,世界上没有一个国家能够学得来

原来仙女不讲理
2026-02-13 17:31:20
美媒最佳新秀TOP5!杨瀚森交易筹码压线入选 康神弗拉格双星争ROY

美媒最佳新秀TOP5!杨瀚森交易筹码压线入选 康神弗拉格双星争ROY

锅子篮球
2026-02-13 21:18:08
33岁内马尔官宣当爷爷!4娃3母情史混乱,绯闻频登热搜引热议

33岁内马尔官宣当爷爷!4娃3母情史混乱,绯闻频登热搜引热议

罗氏八卦
2026-02-13 18:55:03
1955年一将军嫌军衔太低,大闹总政处,扬言:粟裕都得叫我老排长

1955年一将军嫌军衔太低,大闹总政处,扬言:粟裕都得叫我老排长

抽象派大师
2025-12-16 17:52:39
就在刚刚!官宣第7位主帅下课!广东更换主场,场均29分外援回CBA

就在刚刚!官宣第7位主帅下课!广东更换主场,场均29分外援回CBA

老吴说体育
2026-02-13 23:33:46
中国再次抛售美债,不会再救美元,特朗普只能承认自己犯下大错

中国再次抛售美债,不会再救美元,特朗普只能承认自己犯下大错

独坐山巅前
2026-02-13 20:35:22
中央戏剧学院王鑫主动投案,从通报里可以读出什么?

中央戏剧学院王鑫主动投案,从通报里可以读出什么?

推石头的林律师
2026-02-13 17:54:29
你见过最土的土豪有多土?网友:你这明显是短剧看多了

你见过最土的土豪有多土?网友:你这明显是短剧看多了

带你感受人间冷暖
2026-02-11 11:21:06
2月13日译名发布:“火烈鸟”导弹

2月13日译名发布:“火烈鸟”导弹

参考消息
2026-02-13 13:48:41
2026-02-14 14:47:00
医学界外科频道 incentive-icons
医学界外科频道
欢迎关注“医学界外科频道”
2876文章数 10304关注度
往期回顾 全部

科技要闻

独家探访蔡磊:答不完的卷子 死磕最后一程

头条要闻

百果园一根甘蔗87元被吐槽贵 店员:黄金手撕甘蔗按斤卖

头条要闻

百果园一根甘蔗87元被吐槽贵 店员:黄金手撕甘蔗按斤卖

体育要闻

一年怒亏2个亿,库里和安德玛的“孽缘”

娱乐要闻

吴克群变“吴克穷”助农,国台办点赞

财经要闻

春节抢黄金,谁赚到钱了?

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

本地
手机
数码
时尚
公开课

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

手机要闻

别让闹钟打扰假期 iPhone用户别忘调假期闹钟

数码要闻

英特尔发布32.0.101.8509版WHQL显卡驱动:拓展XeSS3多帧生成支持

穿上这些鞋拥抱春天

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版