网易首页 > 网易号 > 正文 申请入驻

哈佛团队研发HPV-DeepSeek,已启动更大规模临床验证

0
分享至

HPV-DeepSeek 是什么?乍一看,你可能觉得这是不是和中国的 DeepSeek 公司有什么关系?事实上,这是一群科学家于近期打造的一款液体活检检测方法,该方法可以在无症状个体出现症状的 10 年前就能检测出人乳头瘤病毒(HPV,Human Papillomavirus)相关的口咽癌,日前相关论文发表于《美国国家癌症研究所期刊》。

我们无法得知研究人员在为这一技术命名时是否从国内的 DeepSeek 模型汲取了灵感,但对于熟悉这一模型的国人来说,可能看到 HPV-DeepSeek 这一名称会感到多了几分亲切。然而,该技术确实是一项国外技术,其由美国哈佛医学院助理教授、博德研究所副研究员、麻省眼耳医院头颈外科肿瘤科主治外科医生和麦克托特头颈癌中心首席研究院丹尼尔·L·法登(Daniel L.Faden)率队完成。


(来源:https://oto.hms.harvard.edu/people/daniel-l-faden)

通过针对这类癌症进行早期诊断,HPV-DeepSeek 不仅可以提高治疗成功率,还能减少使用激进疗法。这一成果首次证明“HPV+口咽癌”的精准早期检测是可行的,通过血液样本可以更早地检测出癌症,为筛选 HPV 相关的口咽癌带来了新机会。


(来源:https://youtu.be/y-n_-JuK89M)

据了解,HPV-DeepSeek 依靠全基因组测序来识别从肿瘤中分离并在血液中循环的 HPV DNA 微小片段。该团队的早期研究表明,这一检测方法在患者初次就诊时,其诊断癌症的特异性和敏感性均可达到 99%,对于癌症早期检测的敏感性高达 79%,优于现有的诊断方法。

为了确定 HPV-DeepSeek 能否在患者确诊的很久之前就检测出 HPV 相关口咽癌,研究人员针对来自麻省总医院布莱根生物库的 56 样本进行了测试,其中 28 个样本来自多年后患上 HPV 相关口咽癌的个体,另外 28 个样本来自健康对照者。在 28 份后来患上癌症的患者血液样本中,研究人员从其中的 22 份中检测到了 HPV 肿瘤 DNA,而所有 28 份对照样本的检测结果均为阴性,这表明此次检测方法具有高度的特异性。对于距离患者确诊时间较近时所采集的血液样本,这一检测方法能够更好地检测出其中的 HPV DNA。在一份距离患者确诊 7.8 年之前采集的血液样本中,研究人员也检测出了阳性成果。

利用机器学习,研究人员进一步提高了这一方法的测试能力,使得其能准确识别出 28 例癌症病例中的 27 例,甚至能从患者确诊 10 年之前收集的样本中识别出癌症。

具体来说,研究人员利用 306 例“HPV+口咽癌”病例和对照组数据训练并验证了一个机器学习模型。结果显示,早期检测的敏感性提升 96%,最长可以提前 10 年。研究人员表示,这可能是迄今为止基于循环肿瘤 DNA(ctDNA,Circulating Tumor DNA)的癌症早期检测中最长的检测时间。

期间,他们采用了二元机器学习方法,借此将样本分类为 HPV 阳性口咽鳞状细胞癌和非 HPV 阳性口咽磷状细胞癌。在建模之前,研究人员通过采取标准数据预处理技术,针对数值特征进行了最小-最大归一化处理。在选择这些数值特征时,他们主要基于 HPV-DeepSeek 的五个输出指标:第一个指标是独特的 HPV 对齐读数,第二个指标是基因组覆盖率,第三个指标是平均片段长度,第四个指标是片段长度偏度,第五个指标是片段长度峰度。

通过此,研究人员排除了一些其他特征,比如高危 HPV 单核苷酸多态性、PIK3CA 突变和病毒整合事件,之所以将这些特征排除在外,是因为它们的可靠注释需要较高的测序覆盖率,而这在预诊断样本中是不可行的。

在独立机器学习训练与测试列队中,研究人员将 80% 的样本用于训练,将 20% 的样本用于测试。借此训练了多种可解释模型架构,包括随机森林(Random Forest)、AdaBoost 和朴素贝叶斯(Naive Bayes)。模型性能指标包括准确率、精确率、召回率、宏观 F1 分数、特异性、阴性预测值和受试者工作特征曲线下面积(AUC-ROC,Area Under the Receiver Operating Characteristic Curve)。

在适用的情况下,研究人员使用 10 折交叉验证在训练集上进行超参数调优。针对基于决策树的模型,研究人员对其进行了可视化,以便能够识别关键预测因子。在对模型进行调优之后,研究人员对模型进行了最终确定,并针对保留的测试集进行了 Bootstrap 重采样,以便生成模型性能指标的经验 95% 置信区间。

然后,研究人员使用分层 K 折生成了交叉验证和测试集的 AUC-ROC 曲线。为了解释模型,研究人员使用了沙普利加性解释(SHAP,SHapley Additive Explanations)技术,它能够估计每个输入特征对于个体预测的贡献。

SHAP 值指标能够显示输入特征在所有测试样本中的影响方向和影响大小,借此得到了每个特征的平均 SHAP 值和模型之间的总体重要性排名。需要说明的是,机器学习模型具有等效的性能和重叠的置信区间,同时研究人员选择了朴素贝叶斯作为代表模型。

研究人员在论文中指出,机器学习显著改善了距离时间较远的样本的分类能力,这种提升主要源于以下两个方面。首先,能够针对独特读数数量和基因组覆盖百分比这两个主要特征进行差异化加权,而非采用稀释试验来确定固定阈值。其次,能够在特定模型中引入片段组学特征。


(来源:https://academic.oup.com/jnci/advance-article-abstr)

研究中,研究人员还将 HPV-DeepSeek 与通过 ddPCR(目前用于检测 ctHPVDNA 的临床标准护理)进行的 ctHPVDNA 检测进行了比较,借此发现 HPV-DeepSeek 能够显著提高早期检测敏感性和最长提前时间。

除此之外,HPV-DeepSeek 还具备一些其他优势,比如能够同时检测所有的 HPV 基因型,能够检测和注释大量预后和支持性诊断特征。结合该检测的总体高敏感性和特异性,这表明针对“HPV+口咽鳞状细胞癌”的单一或组合的基于血液的早期检测方法在技术上是可行的。

基于循环肿瘤 DNA 的早期检测方法确实有望显著改善癌症早期诊断,并且尤其适用于目前缺乏筛查手段的癌种。当前,大多数癌症类型由于在确诊时缺乏筛查,导致患者在接受治疗时往往已经拖至晚期甚至开始出现临床症状。而患者直到癌症晚期才得到诊断,就会导致生存率下降、医疗成本增加以及病损加重。

HPV 是美国大约 70% 口咽癌患者的病因,口咽癌也是与 HPV 病毒相关的最常见癌症类型。目前,这类癌症的发病率呈现出逐年上升的趋势。其他一些 HPV 相关癌症已经拥有成熟的筛选方案,但是此前尚未出现检测 HPV 相关口咽癌的检测方法。

对于 HPV 相关口咽癌患者来说,他们往往在肿瘤已经扩散到数十亿个细胞、引发症状并已经扩散到附近淋巴结时才被诊断出来。研究人员表示,当患者出现癌症症状才来到医院时,这时所需要接受的治疗可能会带来严重的终身副作用。因此,开发能够更早发现这类癌症的筛查工具,能够让患者更早地接受治疗和改善预后。

而本次研究还使用了后来发展为“HPV+口咽鳞状细胞癌”的无症状个体和人群对照的血浆样本,结合 HPV-DeepSeek 这一新型超灵敏多特征的液体活检技术,证明对于敏感和特异的基于血液的“HPV+口咽鳞状细胞癌”早期检测来说,HPV-DeepSeek 可以将检测时间提前到患者在临床上被确认患癌的 10 年之前,这为 HPV 相关口咽癌提供基于血液的早期检测测试带来了新机会。

目前,研究人员正在美国国立卫生研究院资助的第二项盲法研究中继续验证本次方法,涉及到使用美国国家癌症研究所的前列腺癌、肺癌、结直肠癌和卵巢癌的数百个样本,预计将能惠及更多患者。



参考资料:

相关论文https://academic.oup.com/jnci/advance-article-abstract/doi/10.1093/jnci/djaf249/8248381?redirectedFrom=fulltext

https://oto.hms.harvard.edu/people/daniel-l-faden

https://scitechdaily.com/breakthrough-blood-test-detects-head-and-neck-cancer-up-to-10-years-before-symptoms/

https://faden-lab.mgh.harvard.edu/newest-manuscript-findings-featuring-hpv-deepseek-and-early-detection-of-hpvopc-up-to-10-years-before-diagnosis/

https://www.massgeneralbrigham.org/en/about/newsroom/press-releases/blood-test-identifies-hpv-associated-head-and-neck-cancers

https://youtu.be/y-n_-JuK89M

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
台当局为收买人心竟不惜动用财政,给每位居民发放2300元人民币

台当局为收买人心竟不惜动用财政,给每位居民发放2300元人民币

霹雳炮
2025-11-01 20:59:09
蓝营要变天?郑丽文登机前,朱立伦选择跟进,黄国昌或也将登陆!

蓝营要变天?郑丽文登机前,朱立伦选择跟进,黄国昌或也将登陆!

小影的娱乐
2025-11-01 14:52:05
大乐透疯了吧!18注一等奖井喷,河南独揽10注,单注658万

大乐透疯了吧!18注一等奖井喷,河南独揽10注,单注658万

王晓爱体彩
2025-11-02 05:47:01
王传福投出深水炸弹,比亚迪王炸新车一炮而红

王传福投出深水炸弹,比亚迪王炸新车一炮而红

象视汽车
2025-11-02 07:00:05
中美言和荷兰惨遭遗弃,国王亲自率企业团访华,请中国手下留情

中美言和荷兰惨遭遗弃,国王亲自率企业团访华,请中国手下留情

梁讯
2025-11-01 14:32:15
关于中超最后一轮上海海港、申花、津门虎球迷心中期待的最佳剧情

关于中超最后一轮上海海港、申花、津门虎球迷心中期待的最佳剧情

越岭寻踪
2025-11-01 07:12:49
活久见!山东一宝马汽车“穿棉袄”,网友:天冷,别冻着我的活爹

活久见!山东一宝马汽车“穿棉袄”,网友:天冷,别冻着我的活爹

火山诗话
2025-11-01 13:41:41
非要和小两口睡一张床的婆婆,12刀剁掉了儿媳的头,江苏真事儿

非要和小两口睡一张床的婆婆,12刀剁掉了儿媳的头,江苏真事儿

左堤路小车神
2023-11-22 19:55:20
这才是美军机坠海的真正原因?特朗普不再遮掩,中方在等求助信号

这才是美军机坠海的真正原因?特朗普不再遮掩,中方在等求助信号

林子说事
2025-11-01 05:01:50
浙江1米75男生只有110斤,反复腹痛一年被误会“装病”,医生凭一个细节揪出罕见病!

浙江1米75男生只有110斤,反复腹痛一年被误会“装病”,医生凭一个细节揪出罕见病!

FM93浙江交通之声
2025-11-02 06:05:42
“教授8万副教授7万博士6万”:部分高校职称晋升现“金钱游戏”,教师横向课题考核催生造假产业链

“教授8万副教授7万博士6万”:部分高校职称晋升现“金钱游戏”,教师横向课题考核催生造假产业链

红星新闻
2025-10-31 21:35:21
1979年,贺子珍到中南海参观,来到毛主席卧室后,突然哭出了声音

1979年,贺子珍到中南海参观,来到毛主席卧室后,突然哭出了声音

大运河时空
2025-10-08 23:23:41
河南中牟灭门惨案‖发小杀害妻儿3人,平时经常喊他吃饭…

河南中牟灭门惨案‖发小杀害妻儿3人,平时经常喊他吃饭…

恪守原则和底线
2025-10-31 18:41:22
与去年排名相同,北京国安与山东泰山分别锁定中超第四第五

与去年排名相同,北京国安与山东泰山分别锁定中超第四第五

懂球帝
2025-11-01 18:10:40
暨南大学附属医院发生甲等医疗事故!

暨南大学附属医院发生甲等医疗事故!

医脉圈
2025-10-31 12:13:33
钱再多有什么用?从主持人到“精神病”,48岁李维嘉现状令人唏嘘

钱再多有什么用?从主持人到“精神病”,48岁李维嘉现状令人唏嘘

山河月明史
2025-09-27 10:10:56
尹锡悦出庭受审,因检察官直呼金建希名字大怒:至少后面加个“夫人”吧

尹锡悦出庭受审,因检察官直呼金建希名字大怒:至少后面加个“夫人”吧

闪电新闻
2025-11-01 15:27:20
王艺迪单骑闯关!苦战7局胜张本美和:女单4强诞生,日本全军覆没

王艺迪单骑闯关!苦战7局胜张本美和:女单4强诞生,日本全军覆没

全言作品
2025-11-02 05:02:46
随着大勒布伦4-2逆转达科,男单四强全部诞生,半决赛对阵出炉!

随着大勒布伦4-2逆转达科,男单四强全部诞生,半决赛对阵出炉!

小彭美识
2025-11-02 06:01:56
“最惨超女”黄雅莉:没工作没积蓄,已生子,住5㎡三室一厅,活成了城市版李子柒。

“最惨超女”黄雅莉:没工作没积蓄,已生子,住5㎡三室一厅,活成了城市版李子柒。

老吴教育课堂
2025-11-01 09:37:56
2025-11-02 08:03:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15806文章数 514254关注度
往期回顾 全部

科技要闻

事关安世半导体,商务部最新发声!

头条要闻

4200万美国人吃饭成问题 有人让孩子吃饭自己喝水撑着

头条要闻

4200万美国人吃饭成问题 有人让孩子吃饭自己喝水撑着

体育要闻

NBA球员,必须吃夜宵

娱乐要闻

王家卫这波录音,撕烂了遮羞布

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

教育
时尚
房产
健康
公开课

教育要闻

2026高考报名,这八处变化一定要了解!

伊姐周六热推:电视剧《树影迷宫》;电视剧《锦月令》......

房产要闻

实力破圈!这个豪宅交付,正在定义海口品质样本!

核磁VS肌骨超声,谁更胜一筹?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版