网易首页 > 网易号 > 正文 申请入驻

Nature | 微软研究院/华盛顿大学等合作推出基于真实世界数据的数字病理学全切片AI模型

0
分享至

数字病理学利用高分辨率图像和自动化分析技术,可显著提升癌症诊断的准确性和效率,并且支持远程会诊和便捷的数据存储检索,对病例回顾和研究具有重要价值。然而,这一领域也面临着处理十亿像素图像的计算挑战,并且传统模型忽略了切片的全局背景信息。

微软 研究院 、华盛顿大学和 Providence Genomics公司合作进行了 一项数字病理学研究,以克服在癌症诊断领域全面实施人工智能(AI)的一些障碍

基于Providence卫生网络的171189张全切片中的13亿张病理图像数据,研究团队构建了一个全切片病理AI基础模型Prov-GigaPath,可以读取整个切片的模式,以提高对患者特定癌症突变及其亚型的预测,以及肿瘤微环境可能对不同疗法的影响。分析显示,Prov-GigaPath可以准确地完成17个典型病理任务和9个亚型任务,包括预测泛癌基因突变,并优于其他数字病理方法。总之,Prov-GigaPath是一种开放权重的基础模型,可在各种数字病理任务中实现最先进的性能,证明了真实世界数据和全切片建模的重要性。近日,该研究成果发表在Nature上,文章题为“A whole-slide foundation model for digital pathology from real-world data”。

Providence Genomics首席分析和研究官Ari Robicsek表示:“这项变革性的工作是专注于克服三大挑战的结果,这三大挑战阻碍了已有的计算病理学模型在临床环境中的广泛应用:缺乏真实世界数据、无法整合全切片建模以及缺乏可访问性。”

为应对上述三大挑战,研究团队开发了Prov-GigaPath模型。

01

Prov-GigaPath概述

首先,Prov-GigaPath在来自Providence卫生网络的大型数字病理学数据集Prov-Path上进行了预训练。 该数据集涵盖28个癌症中心的3万多名患者,包括31种主要组织类型的171,189个全切片的13亿个病理图像。 就数据量而言,Prov-Path比TCGA大5倍多,就患者数量而言,比TCGA大2倍多。 同时,Prov-Path还包含组织病理学发现、癌症分期、基因组突变谱以及相关的病理学报告数据。

其次,为了捕捉整个切片的局部和全局模式,研究团队提出了一种新型视觉转换器架构GigaPath,用于在千兆像素病理切片上预训练大型病理基础模型。其关键思想是嵌入图像块作为视觉标记,从而将切片变成一长串标记。

为了将GigaPath扩展到具有数万个图像块的切片级学习,GigaPath将新开发的LongNet方法应用于数字病理学。通过一个跨越多GB的高分辨率文件,以前的计算机视觉程序很难理解来自标准切片的大量信息,而且它们是将图像分解成数千个单独的图像块进行分析。为了理解这些信息,研究人员改进了微软的LongNet程序,该程序的操作类似于大型语言模型,但能够处理更长的序列数据。例如,给AI聊天机器人的书面提示可能会被计算机读取为由数十个相互关联令牌组成的序列,而LongNet可以同时处理多达10亿个令牌。

最后,为了加快数字病理学的研究进展,研究团队使Prov-GigaPath完全开放权重,包括源代码和预训练模型权重。

图1.Prov-GigaPath概述

02

Prov-GigaPath改进突变预测

从病理图像预测肿瘤突变可能有助于为治疗选择提供信息并提高个性化药物的利用率。研究团队将Prov-GigaPath与其它方法在5基因突变预测基准上进行了比较(图2)。在泛癌症环境中常见突变的18个生物标志物预测,以及肺腺癌突变预测(EGFR、FAT1、KRAS、TP53和LRP1B)分析中,Prov-GigaPath表现出最好的性能:在18种生物标志物上的AUROC下的macro-area为3.3%,在AUPRC下的macro-area为8.9%;肺腺癌突变预测的平均macro-AUROC为0.626。研究人员还验证了Prov-GigaPath的通用性,发现其与其它方法相比具有类似的优势。此外,在肿瘤突变负荷(TMB)预测中,Prov-GigaPath也获得了最佳性能。

总之,与之前最先进的病理基础模型相比,Prov-GigaPath在各种病理任务上表现出明显的性能提升。

图2.基因突变预测。

03

Prov-GigaPath改善癌症亚型

在9种主要癌症类型中,研究团队分析了Prov-GigaPath是否可以从图像中准确预测癌症亚型(图3)。研究显示,与其它方法相比,Prov-GigaPath在6种癌症类型上取得了显著改进,表明使用LongNet在整个切片中高效、有效地整合超大规模图像块集是有前景的。

图3.癌症分型的比较。

04

Prov-GigaPath的病理学视觉语言预训练潜力

Prov-GigaPath在病理图像上的良好结果进一步激励研究团队探索了其在多模态视觉语言处理中的应用。研究团队通过利用每张切片的相关报告来检查病理图像和文本的切片水平对齐(图4a)。这种自然发生的切片报告可以潜在地揭示更丰富的切片信息,但是建模相当具有挑战性,因为没有单个图像块和文本之间的细粒度对齐信息。研究在持续预训练中使用标准的跨模态对比损失作为视觉编码器,最先进的生物医学语言模型PubMedBERT作为文本编码器(图4b)。

与三种最先进的病理学视觉语言模型相比,Prov-GigaPath在两种癌症类型的所有3个指标上都获得了最佳的zero-shot分类结果(图4c,e),表明LongNet支持的切片级对齐确实很有优势。此外,使用视觉语言预训练的Prov-GigaPath还可以预测基因突变,预示着其未来在研究罕见癌症类型和新突变方面的潜在应用。

图4.图像-文本对齐的比较。

该研究展示了Prov-GigaPath在各种病理学和癌症亚分类任务以及视觉语言处理上的一流性能。Prov-GigaPath模型建立在迄今为止真实世界中最大的AI训练工作之一的基础上,即全切片组织分析,同时整个项目还包括放射学扫描结果、基因组学结果和患者健康记录。

Providence Genomics首席医疗官Carlo Bifulco表示:“通过Prov-GigaPath等AI工具,病理切片中的丰富数据可以揭示出人眼所不能识别的新关系和见解。研究团队下一步将是利用AI模型开发新的诊断应用,包括肿瘤微环境的研究和帮助治疗选择。”

Prov-GigaPath的开发和应用不仅展示了AI在处理和分析大规模病理图像数据方面的强大能力,也为未来的临床诊断带来了前所未有的潜力,推动了癌症诊断的智能化和精确化。 未来数字病理学的发展将继续依赖于大数据和AI技术的深度融合,持续推动癌症等复杂疾病的早期诊断、精准治疗和个性化医疗的发展。

论文原文:

Xu, H., Usuyama, N., Bagga, J. et al. A whole-slide foundation model for digital pathology from real-world data. Nature (2024). https://doi.org/10.1038/s41586-024-07441-w

快点亮"在看”吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一个扎心的真相:35岁以后,人生的残酷程度将乘以10

一个扎心的真相:35岁以后,人生的残酷程度将乘以10

洞见
2026-01-22 21:18:15
苹果突袭官宣!1月24日限时降价,手机稳价,Mac清仓

苹果突袭官宣!1月24日限时降价,手机稳价,Mac清仓

小8说科技
2026-01-23 01:25:38
若能挺过这个冬天,乌克兰将胜券在握

若能挺过这个冬天,乌克兰将胜券在握

近距离
2026-01-22 11:29:02
29岁山东胖姑娘在线征婚,彩礼只要1万7,就三个要求让无数人破防

29岁山东胖姑娘在线征婚,彩礼只要1万7,就三个要求让无数人破防

单手搓核弹
2026-01-22 13:45:48
三四线城市,翻盘了

三四线城市,翻盘了

城市财经
2026-01-12 11:39:42
美财长语出惊人:不怕封锁台海,特朗普抢走台积电是“拯救世界”

美财长语出惊人:不怕封锁台海,特朗普抢走台积电是“拯救世界”

近史博览
2026-01-22 04:28:30
有一种强烈的预感,好事要来临!

有一种强烈的预感,好事要来临!

荷兰豆爱健康
2026-01-21 01:38:28
全球首例!上海瑞金医院医生“唤醒”了失忆的妈妈!阿尔茨海默病或有新解法

全球首例!上海瑞金医院医生“唤醒”了失忆的妈妈!阿尔茨海默病或有新解法

新民晚报
2026-01-21 15:41:44
2025年最终版全球“最强护照”排行榜出炉!日本护照跌至第三位

2025年最终版全球“最强护照”排行榜出炉!日本护照跌至第三位

东京新青年
2025-12-13 18:10:46
男人牢记:搞定女人的“千古定律”,就这三条,百试百灵!

男人牢记:搞定女人的“千古定律”,就这三条,百试百灵!

千秋文化
2026-01-14 21:05:03
芬兰总理奥尔波将访华 中方介绍此访期待

芬兰总理奥尔波将访华 中方介绍此访期待

财联社
2026-01-22 15:46:11
中日破裂,这是53年来对日最强硬的外交表态!

中日破裂,这是53年来对日最强硬的外交表态!

见闻致
2025-11-15 21:21:56
农业农村部:第二轮土地延包试点已有2500多万农户承包地总体顺延

农业农村部:第二轮土地延包试点已有2500多万农户承包地总体顺延

澎湃新闻
2026-01-22 11:37:06
女子遛狗被群殴大反转!警方立案,打人真相曝光,网友力挺肇事者

女子遛狗被群殴大反转!警方立案,打人真相曝光,网友力挺肇事者

揽星河的笔记
2026-01-22 12:49:09
编程这个职业,没多少时间了

编程这个职业,没多少时间了

码农翻身
2026-01-12 08:59:03
一口气搞懂16种酒,吹牛更显学问

一口气搞懂16种酒,吹牛更显学问

混知
2026-01-09 12:27:20
张碧晨成都演出裤腰滑落,观众拍图上热搜,她改穿连体衣没说话

张碧晨成都演出裤腰滑落,观众拍图上热搜,她改穿连体衣没说话

阿废冷眼观察所
2026-01-21 13:20:58
熊绑架刘记,刘记避嫌

熊绑架刘记,刘记避嫌

蜻蜓世音
2026-01-22 20:12:15
普京果然说到做到!4次归还中国领土,最后一次诚意十足还最多

普京果然说到做到!4次归还中国领土,最后一次诚意十足还最多

卷史
2025-12-30 11:56:45
事发南通,网友实名举报,大雪纷飞中,易家桥中学学生被体罚

事发南通,网友实名举报,大雪纷飞中,易家桥中学学生被体罚

寻墨阁
2026-01-22 14:08:38
2026-01-23 04:47:00
测序中国 incentive-icons
测序中国
基因行业领航新媒体
235文章数 16关注度
往期回顾 全部

科技要闻

几千亿只是开胃菜,AI基建还得再砸几万亿

头条要闻

“和平委员会”签约国家名单公布 西欧国家无一参加

头条要闻

“和平委员会”签约国家名单公布 西欧国家无一参加

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

车银优赚800亿 涉嫌逃税200亿!

财经要闻

西贝拿到“救命钱”,然后呢

汽车要闻

配备多块娱乐屏 极氪8X内饰曝光

态度原创

数码
旅游
家居
本地
艺术

数码要闻

2026款华硕a豆14 Air笔记本发布,6999元起

旅游要闻

降温也能赏花海?上海这里太懂浪漫

家居要闻

法式风情 南洋中古居

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

艺术要闻

265米!中集集团全球总部开工,大楼如一幅“山水画”

无障碍浏览 进入关怀版