网易首页 > 网易号 > 正文 申请入驻

科学通报 | 王磊/王书浩团队联合评述通用视觉基础模型在计算病理学的研究进展

0
分享至

近日,北京航空航天大学自动化科学与电气工程学院王磊教授联合团队中日友好医院病理科/透彻未来首席技术官王书浩博士在《科学通报》发表了题为“通用视觉基础模型在计算病理学”的评述论文,系统综述了计算病理学(Computational Pathology, CPath)中视觉基础模型(Vision Foundation Models, VFMs)的构建方法,分析了自监督学习如何赋能模型泛化能力,并展示了其在下游任务中的优异性能。文章探讨了VFMs在多尺度表征、任务适应性等方面的挑战,并展望了多模态与临床高效部署等未来研究方向。


在现代医学,尤其是癌症诊断中,病理科医生是手握“最终裁决权”的关键角色。一块小小的组织切片,在显微镜下蕴藏着海量的细胞形态、组织结构信息,是医生判定良恶、分型分级的金标准。随着数字化浪潮席卷而来,传统的玻璃切片被扫描成全片扫描数字图像(Whole-Slide Image, WSI)。这些WSI可达千兆像素(Gigapixel)级别,其蕴含的数据量远超人眼所能穷尽。计算病理学(Computational Pathology, CPath)利用人工智能(Artificial Intelligence, AI)辅助医生,从“数据的海洋”中挖掘出肉眼难以察觉的诊断线索。然而,传统的监督学习AI模型依赖海量的、由病理专家亲手勾画的像素级标注作为“标准答案”。这也是CPath领域十年来最大“痛点”:标注瓶颈(Annotation Bottleneck)。因缺乏标注而无法训练出最强大的AI模型,严重限制了AI在真实临床环境中的泛化能力与鲁棒性。

学术界曾尝试使用迁移学习来绕过瓶颈,即借用在自然图像(如 ImageNet)上预训练好的模型。但自然图像与病理图像之间存在显著差异,因此这种方法的性能提升受到了限制。真正的突破源自于AI领域的一场范式革命:自监督学习(Self-Supervised Learning, SSL)。SSL 的核心思想是“让数据自己教AI”。它不再依赖病理专家的精细标注,而是利用海量的、未标注的组织病理图像,通过精心设计的“猜谜”任务来学习图像的内在结构和深层特征。正是在这一背景下,视觉基础模型(Vision Foundation Models, VFMs)应运而生。

作为一种普适高效的图像表征新范式,VFMs 旨在从海量、多样化、且通常是无标注的病理数据中学习通用的视觉表征。这种由 SSL 赋能的新范式,在提升数据利用效率、增强模型跨任务与跨领域的泛化能力方面展现出了巨大潜力。CPath 领域的 VFM 研究正处于增长爆发期,新模型和新方法层出不穷。本文对不同的模型的技术路径、优势和局限进行了系统综述,深入算法“内核”,勾勒出一条清晰的演进路径:从“实例判别”出发(早期模型的核心是“对比学习”,学习区分“自己”和“他人”);深化为“语义浓缩”(新一代模型进化为“自蒸馏”和“掩码重建”,模型从自身学习并理解局部纹理);最终迈向“上下文建模”(最新的模型开始解决“近视眼”问题,第一次尝试从“图块”级别跃升到“全切片”级别的上下文理解)。文章旨在为 CPath 研究者提供一份指南,清晰地指出不同技术范式的内在逻辑与演进方向。

文章指出了VFM真正从“学术奇迹”走向“临床现实”所面临的几个关键挑战。一个核心挑战在于SSL范式与病理特性之间的适配性鸿沟。团队分析指出,当前CPath的VFM成功,很大程度上是通用视觉领域先进SSL方法的直接迁移。然而,不同的SSL范式存在明显的任务偏好性:以对比学习为代表的方法(如REMEDIS和CTransPath)擅长学习“全局”高层级语义,因此在“切片级”分类任务中表现出色;但其将整个图块视为单一实例的本质,使其对细粒度信息不敏感。另一方面,以MIM建模范式为代表的方法(如UNI所采用的DINOv2)通过重建任务学习局部纹理,在“分割”等需要精确定位的任务中具有天然优势,但可能对全局判别性特征的捕捉略显不足。因此,将通用SSL范式“生搬硬套”到CPath,而忽略其内在机制与特定病理任务的适配性问题,是当前研究中亟需反思的。这种挑战并不仅仅停留在算法层面。计算与存储资源的双重瓶颈同样严峻。VFMs是“吞金兽”,如文章表1所示,其训练动辄需要数十块顶级GPU(如A100 80GB)并行数周。这不仅是“训练瓶颈”,将许多算力有限的学术机构排除在外;“部署瓶颈”更为严峻。单个WSI存储可达数GB,VFM推理也需要高显存GPU,这在许多基层医疗机构中并非标准配置。这一从训练到推理的全链路资源依赖,是VFMs走向临床应用的根本障碍。

此外,文章还探讨了计算病理学未来多模态融合的发展需求,一个更强大的病理基础模型需要融合病理图像(形态)、基因测序(遗传)和电子病历(临床)等信息。然而,当前的多模态模型(如PLIP, CONCH)仍处于非常初级的阶段,其核心瓶颈在于缺乏高质量、大规模的病理视觉-语言配对数据集。未来,数字病理的全面推进和电子病历的普及,将为构建更大规模、更高质量的多模态数据集提供坚实基础,有望从根本上解决当前的数据瓶颈。

北京航空航天大学自动化科学与电气工程学院王磊教授和中日友好医院病理科/透彻未来首席技术官王书浩博士为文章通讯作者。北京航空航天大学自动化科学与电气工程学院博士生付哲铭为文章第一作者。该研究得到了中国国家高水平医院临床研究专项资金、北京市“AI+健康”培育创新项目、北京市“科技新星”计划以及2023 年度中国青海省科技项目的资助。


文章信息

付哲铭,笪倩,王伟,等.通用视觉基础模型在计算病理学的研究进展. 科学通报, 2026.

https://www.sciengine.com/doi/10.1360/CSB-2025-5045.


转载、投稿请留言

| 关注科学通报 | 了解科学前沿

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
澎湃回声|男子无偿献血十年要求免诊查费遭拒,自贡卫健委:两单位已道歉

澎湃回声|男子无偿献血十年要求免诊查费遭拒,自贡卫健委:两单位已道歉

澎湃新闻
2026-04-14 17:06:27
涉霍尔木兹海峡,中方最新回应

涉霍尔木兹海峡,中方最新回应

环球时报国际
2026-04-14 16:16:36
刚刚!许家印当庭认罪!2万亿巨债谁来买单?

刚刚!许家印当庭认罪!2万亿巨债谁来买单?

澳洲红领巾
2026-04-14 14:18:38
炸裂!布朗尼雄起!彻底完胜NBA状元郎

炸裂!布朗尼雄起!彻底完胜NBA状元郎

篮球实战宝典
2026-04-14 20:58:53
尹锡悦双眼通红地望着金建希,金建希没看他

尹锡悦双眼通红地望着金建希,金建希没看他

天真无牙
2026-04-14 17:44:27
“你喊那么大声干嘛?”00后强势回怼领导,场面一度失控!

“你喊那么大声干嘛?”00后强势回怼领导,场面一度失控!

一丝不苟的法律人
2026-04-14 10:37:26
李修贤谈万梓良现状:酒吧驻场不丢人,为人仗义,事业婚姻都不顺

李修贤谈万梓良现状:酒吧驻场不丢人,为人仗义,事业婚姻都不顺

以茶带书
2026-04-14 16:39:49
120家门店倒闭了一半?又一个海鲜自助“大撤退”

120家门店倒闭了一半?又一个海鲜自助“大撤退”

蓝鲸新闻
2026-04-13 10:19:47
无视美军封锁禁令,4艘中资油轮准备驶出,054A护卫舰来撑腰

无视美军封锁禁令,4艘中资油轮准备驶出,054A护卫舰来撑腰

素衣读史
2026-04-14 18:59:45
特朗普在白宫点外卖,给了外卖员100美元小费,还问:“这不像是摆拍吧?”

特朗普在白宫点外卖,给了外卖员100美元小费,还问:“这不像是摆拍吧?”

鲁中晨报
2026-04-14 18:24:04
大陆学者正式提出“一国两制”台湾方案的四大统一实践路径

大陆学者正式提出“一国两制”台湾方案的四大统一实践路径

海峡导报社
2026-04-14 15:20:12
梦龙广告被部分网友吐槽“不适”,冲上热搜

梦龙广告被部分网友吐槽“不适”,冲上热搜

南方都市报
2026-04-13 23:28:05
伊朗要求五个中东国家赔偿战争损失

伊朗要求五个中东国家赔偿战争损失

财联社
2026-04-14 06:55:04
许家印当庭认罪!一个帝国的崩塌

许家印当庭认罪!一个帝国的崩塌

李东阳朋友圈
2026-04-14 16:33:40
突发!峰学蔚来大鹏老师离职,网友:把职场那点遮羞布,扯下来了

突发!峰学蔚来大鹏老师离职,网友:把职场那点遮羞布,扯下来了

火山詩话
2026-04-14 16:38:51
最新数据:美国从中国进口的智能手机比例从90%骤降至25%,组装中心加速转移

最新数据:美国从中国进口的智能手机比例从90%骤降至25%,组装中心加速转移

风向观察
2026-04-14 14:25:12
男子开车撞死大伯

男子开车撞死大伯

南方都市报
2026-04-14 11:44:25
上海至重庆一航班发生“重着陆”,民航西南局已介入调查,乘客:飞机重重落地后弹起,两秒钟后再次落地,有失重感和剧烈撞击声

上海至重庆一航班发生“重着陆”,民航西南局已介入调查,乘客:飞机重重落地后弹起,两秒钟后再次落地,有失重感和剧烈撞击声

极目新闻
2026-04-14 18:20:52
大陆公布十项惠台政策,民进党当局拟封杀,港媒:台湾产业界相当失望

大陆公布十项惠台政策,民进党当局拟封杀,港媒:台湾产业界相当失望

海峡导报社
2026-04-13 07:00:15
刘雨鑫吃了6000家餐厅、走遍几十个国家,他的钱其实就3个来源

刘雨鑫吃了6000家餐厅、走遍几十个国家,他的钱其实就3个来源

老吴教育课堂
2026-04-14 07:44:56
2026-04-14 21:27:00
科学通报 incentive-icons
科学通报
科学通报微信公众号
1292文章数 2013关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

女子丧偶后和上海婆婆反目 婆婆出钱买的房打官司输了

头条要闻

女子丧偶后和上海婆婆反目 婆婆出钱买的房打官司输了

体育要闻

带出中超最大黑马!他让球迷们“排队道歉”

娱乐要闻

宋祖儿刘宇宁恋情大反转 正主火速辟谣

财经要闻

许家印认罪,他和恒大还有多少欠债?

汽车要闻

售12.99万起/续航2000km 风云T9L上市

态度原创

艺术
数码
亲子
游戏
健康

艺术要闻

这位美女画家的夏天竟如此梦幻

数码要闻

OPPO Pad 5 Pro旗舰配置官曝,悬浮键盘确认配备全域压感触控板

亲子要闻

相爱十年最好的人生礼物来啦!

EWC电竞世界杯:IG横扫TES!TES将重点放在联赛上?

干细胞抗衰4大误区,90%的人都中招

无障碍浏览 进入关怀版