网易首页 > 网易号 > 正文 申请入驻

科学家研发AI病理学大模型,受训于28个癌症中心3万病人数据,为病理学诊断打造新工具

0
分享至

  “Nature 编辑迅速意识到这是一个里程碑式的科研成果,于是快速处理了稿件。最终这篇论文在5个月内就被接受,远远快于 Nature 平均268天的接受时间。”谈及自己和合作者的最新论文,美国华盛顿大学王晟教授表示。

  图 | 王晟(来源:王晟)

  审稿人也表示,在数字病理学领域这是一个前所未有的工作,非常期待看到它能改变病理学的科研和临床范式。

  研究中,王晟和合作者研发出一个超多参数的病理学大模型,也是全球第一个能针对“整张”病理图片进行建模和分类的模型。

  他们将本次模型在来自28个癌症中心的3万个病人数据上进行训练和验证。

  结果显示,该模型在26个任务中的25个任务上取得最佳效果,证明了其有效性和普适性。

  王晟表示,本次成果是医生的有力助手、普通人的福音、医学院的辅助教材。

  “这项研究的成功让我们对 AI 方法在癌症治疗中的应用充满信心,也将成为癌症治疗领域的新开始。”他说。

  随着技术的进一步发展,本次 AI 模型有望在癌症诊断和治疗中发挥越来越重要的作用,为全球数百万癌症患者带来新的希望。

  预计其将带来以下应用:

  其一,成为医生的有力助手。

  首先,AI 病理学模型将直接应用于各大医院,成为医生进行病理学诊断的初筛工具之一。

  这一模型能够迅速分析病理图像,提供初步诊断意见,帮助病理学家更高效地做出准确诊断。

  这不仅能提高诊断速度,还能减轻病理学家的工作负担,让他们有更多时间处理复杂病例。

  其二,成为普通人的福音。

  在缺乏高水平病理学家的地区或国家,AI 病理学模型将成为一种替代方案。

  普通用户可以直接使用这一模型对他们的病理学图片进行分析,获得可靠的诊断结果。

  这将大大改善医疗资源不足地区的诊断水平,确保更多患者能够及时得到准确的诊断和治疗建议。

  其三,成为医学院的辅助教材。

  培养一个合格的病理学从业者需要大量时间和金钱,而 AI 模型可以作为医学院的辅助教材。

  通过提供大量标注的学习样本,AI 模型可以让医学院学生接触到更多病理学案例,提升他们的学习效率和实践经验。

  总的来说,AI 病理学模型在医生、普通人和医学生三个方面展现了广阔的应用前景。它将推动病理学领域的发展,提高癌症诊断的效率和准确性。

  (来源:Nature)

  让模型不再“看了后面忘了前面”

  据介绍,每年全球因癌症去世的人数超过一千万人,快速并且准确的诊断癌症非常重要。

  病理切片检查是最直观最可靠的诊断肿瘤的方法,也是每一个癌症病人被确诊癌症的必须手段之一。

  病理检查将患病器官直接取下的病灶制成切片,放在显微镜下观察,然后判断是否为恶性肿瘤,预测对应的病理分型,从而决定相关的治疗手段。

  鉴于病理检测的大量需求和繁琐工作量,设计准确的 AI 模型来将上述过程进行自动化,会带来极大的价值。

  病理切片分析过程可以建模为一个图片分类的问题,即给定一个病理切片的图片,用 AI 模型来将图片分类到恶性或者良性的病理分型。

  但是,与传统图片分类模型(例如将动物图片分类到猫或者狗)的不同之处是,病理图片非常大。

  一个普通的病理图片甚至高达10万乘以10万个像素,而传统 AI 图片的分类器一般是针对256*256像素的图进行设计的。

  这么一整张病理图片会占据很大的内存空间,无法完整地放入 AI 模型,进而使用图形处理器(GPU,Graphics Processing Unit)加以训练。

  因此,现有的 AI 模型都无法对“整张”(whole-slide)病理图片进行建模。

  为了解决这个问题,王晟等人发现要对整张10万乘以10万个像素的病理图片进行建模,核心的技术难点解决长文章建模的问题。

  即让模型能够对一个超长的文字序列进行整体建模,而不会出现“看了后面忘了前面”的情况。

  一个病理图片对应的数据规模约等于15万个字的一个长文章。举例来说,让一个人去连续读15万个字的文章,那必然会出现看了后面忘了前面,无法从全局角度去理解这个长文章的情况。

  对 AI 模型来说,难点是相同的,AI 模型也无法完全理解和消化这个长文章。

  因此,长文章建模是自然语言处理领域的一个长久的问题,也是最核心的问题之一。

  近年来,ChatGPT 和 GPT4引起的大模型潮流,让长文章建模问题得到了广泛的关注和研究。

  不同于传统的问答系统,ChatGPT 在回答用户提问的时候,会综合考虑用户与 ChatGPT 之前的对话,而这些对话就会形成一个长文章。

  ChatGPT 的成功很大程度源于对长文章建模的新自然语言处理技术。

  因此,王晟等人将这些在自然语言处理中建模长文章的技术,巧妙地改进和运用于病理图片分类,从而解决了对超大整张病理图片进行建模和分类的难题。

  (来源:Nature)

  三方强强联合,曾经的师生如今共同担任通讯作者

  王晟表示,本次项目由他所在的华盛顿大学、微软研究院、以及美国最大的医疗机构之一美国普罗维登斯癌症研究院共同合作完成的。

  2023年6月,王晟的博士研究生许涵文在微软研究院进行暑期实习,研究课题就是如何对大规模病理图片进行建模。

  这时,ChatGPT 等大模型技术在各个领域崭露头角,但还没有人将其应用于医学病理图片。

  三方经过深入探讨之后发现:应用大模型技术的关键难点在于长文章建模。

  此时,微软研究院发布的 LongNet 模型引起了他们的注意,尽管这个模型从未用于医学领域,但在长文章建模方面表现出色。

  后来,许涵文和他的微软研究院实习导师初步判断:微软研究院的 LongNet 模型能够解决大规模病理图片建模问题。随后,许涵文开展了为期三个月的实验。

  2023年9月,他们获得了初步解决方案,即大尺度病理图片建模问题,可以通过自然语言处理中的长文章建模技术来解决。

  初步方案确定后,他们进行了更深入的验证。并在来自28个癌症中心的31种癌症类型数据上进行测试。

  实验结果显示:本次模型在多个任务上都达到了最佳效果,说明它是一个既通用、又准确的病理学建模方案。

  王晟表示:“项目的成功离不开由世界顶尖 AI 专家和病理学专家组建的跨领域团队。”

  其中,美国普罗维登斯癌症研究院提供了核心数据和医学技术,微软研究院贡献了最先进的 AI 技术和计算资源,王晟所在的华盛顿大学则带来了前沿的 AI 医学研究技术和经验。

  (来源:Nature)

  日前,相关论文以《真实数据数字病理学的整体幻灯基础模型》(A whole-slide foundation model for digital pathology from real-world data)为题发在 Nature[1]。

  许涵文是第一作者,美国普罗维登斯癌症研究院的卡罗·毕弗洛(Carlo Bifulco)教授、王晟、以及微软研究院的潘海峰博士担任共同通讯作者。

  图 | 相关论文(来源:Nature)

  王晟表示:“我与潘博士的合作始于2014年,那时我还是一年级博士生,在位于西雅图的微软研究院做暑期实习,潘博士则是我的实习导师。”

  当时他们都在研究自然语言处理(NLP,Natural Language Processing),王晟是美国伊利诺伊大学香槟分校计算机系的博士生,潘海峰则是微软研究院 NLP 组的研究员。

  彼时,深度学习算法刚刚开始崭露头角,AI 的潮流也尚未兴起,还没有研究人员将 AI 或 NLP 方法应用于医学领域的研究。

  NLP 和医学在当时看来是完全不相关的两个领域。

  然而,潘海峰建议王晟探索研究如何将 NLP 技术应用于解决医学数据问题。

  2014年夏天,他们合作的项目就是利用机器学习和 NLP 中常用的置信传播方法,进行癌症药物作用的因果推断和预测。

  在 AlphaFold 于2020年问世后,AI 制药已成为 AI 领域最热门的应用之一,而他们早在2014年就已经在研究类似的问题。

  这次发表在 Nature 上的论文延续了这一思路,他们利用 ChatGPT 中的长文章建模技术,解决了医学领域中超大病理图片的建模问题。

  “可以说,我们将当下最前沿的生成式 AI 技术应用到了一个全新领域,这也是我们论文的最大创新点。”王晟表示。

  下一步,他们计划将本次 AI 模型推广到其他癌症诊断中的图像数据,例如计算机断层扫描(CT,ComputedTomography)、核磁共振成像和 X 光。

  因为本次提出的是一个通用的医学图像模型架构,因此他们相信这一模型架构同样适用于其他类型的医学图像数据。

  具体来说,他们计划为每种图像数据(如 CT、核磁共振成像、X 光)构建一个大模型,以充分利用这些不同类型的图像信息。

  除此之外,他们还将对基因数据和临床诊断书等其他重要医学数据类型,构建相应的大模型。

  最终,他们的目标是将这些独立的大模型进行整合,创建一个全面的癌症诊断 AI 系统。

  这一系统能够结合图像、基因和临床数据,为癌症诊断和治疗提供全面支持。

  预计这种跨领域、多数据源的 AI 模型有望成为癌症诊断和治疗的有力工具,为医生提供更全面的信息支持,推动医疗研究领域的进一步发展。

  参考资料:

  1.Xu, H., Usuyama, N., Bagga, J.et al.A whole-slide foundation model for digital pathology from real-world data.Nature630, 181–188 (2024). https://doi.org/10.1038/s41586-024-07441-w

  排版:罗以、刘雅坤

责任编辑:郜雪丹_NT5097

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
演员张卫健:被父亲打到窒息,两度丧子后,他做出了最正确的决定

演员张卫健:被父亲打到窒息,两度丧子后,他做出了最正确的决定

飘飘然的娱乐汇
2026-06-24 09:05:09
A股上半年收官!最高年内涨近8倍,这些牛股你买过吗?

A股上半年收官!最高年内涨近8倍,这些牛股你买过吗?

每经牛眼
2026-06-30 15:45:42
提级调查“冻货偏航”,是为了其他货车不必绕行当地

提级调查“冻货偏航”,是为了其他货车不必绕行当地

南方都市报
2026-06-29 07:38:30
彻底沦陷?这个小国快被中国“买”下了,10个移民里,9个是华人

彻底沦陷?这个小国快被中国“买”下了,10个移民里,9个是华人

混沌录
2026-06-27 21:27:20
内马尔讽刺预测巴西出局专家:下届世界杯再接再厉

内马尔讽刺预测巴西出局专家:下届世界杯再接再厉

林子说事
2026-06-30 08:47:00
18岁被王全安选中,20岁登戛纳,后来为啥没人敢用她?

18岁被王全安选中,20岁登戛纳,后来为啥没人敢用她?

不似少年游
2026-05-21 14:26:19
国家队清仓在即!老登股造反!能持续吗?

国家队清仓在即!老登股造反!能持续吗?

睿知睿见
2026-06-30 07:32:45
凌晨2时导弹雨倾泻!伊朗实施大规模报复,美方连夜空袭回击?

凌晨2时导弹雨倾泻!伊朗实施大规模报复,美方连夜空袭回击?

小樾说历史
2026-06-29 13:08:29
丈夫暴雷后,一纸告别,53岁董卿再迎噩耗,淡出央视原因真相大白

丈夫暴雷后,一纸告别,53岁董卿再迎噩耗,淡出央视原因真相大白

史行途
2026-06-30 15:55:42
美国发生大量特斯拉电池被盗事件 价值至少百万美元

美国发生大量特斯拉电池被盗事件 价值至少百万美元

CNMO科技
2026-06-30 16:05:04
摩洛哥花了50年,终于让世界假装西撒哈拉不存在

摩洛哥花了50年,终于让世界假装西撒哈拉不存在

蓝瞰
2026-06-23 21:00:05
打脸黄一鸣!大佬承认孩子身份,私密聊天曝出,王思聪显狼狈

打脸黄一鸣!大佬承认孩子身份,私密聊天曝出,王思聪显狼狈

青梅侃史啊
2026-06-28 07:17:32
泰媒曝光泰王父母结婚照,甜到齁,17岁王后未成年,父母签字同意

泰媒曝光泰王父母结婚照,甜到齁,17岁王后未成年,父母签字同意

水泥土的搞笑
2026-06-30 00:59:46
112名“中国留学生”被调查,亲历者发声

112名“中国留学生”被调查,亲历者发声

中国新闻周刊
2026-06-27 20:24:41
CBA最新消息!山东男篮有意贺希宁,李弘权确定签约

CBA最新消息!山东男篮有意贺希宁,李弘权确定签约

体坛瞎白话
2026-06-30 16:06:06
到2030年江苏GDP格局或将重排:苏州冲向3.6万亿,连云港领先宿迁

到2030年江苏GDP格局或将重排:苏州冲向3.6万亿,连云港领先宿迁

亿通电子游戏
2026-06-30 08:58:33
没有公告,卢卡申科紧急访华,普京有心无力,白俄只有中国能救?

没有公告,卢卡申科紧急访华,普京有心无力,白俄只有中国能救?

顾史
2026-06-30 02:21:37
韩国著名解说员:洪明甫不让孙兴慜和李在城首发是毫无道理的

韩国著名解说员:洪明甫不让孙兴慜和李在城首发是毫无道理的

懂球帝
2026-06-29 16:54:21
胡梅尔斯:德国成绩不佳必须有人负责,一些球员也应主动退出球队

胡梅尔斯:德国成绩不佳必须有人负责,一些球员也应主动退出球队

砚底沉香
2026-06-30 11:14:16
历史惊人的相似,白人与中国三次生死较量,最终都以“灭族”收场

历史惊人的相似,白人与中国三次生死较量,最终都以“灭族”收场

掠影后有感
2026-06-29 10:01:47
2026-06-30 16:40:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16901文章数 515063关注度
往期回顾 全部

科技要闻

iPhone18 Pro遭泄密!印度代工商惹祸

头条要闻

日本裔藤森庆子将成秘鲁总统 其父因贪腐趁访日时流亡

头条要闻

日本裔藤森庆子将成秘鲁总统 其父因贪腐趁访日时流亡

体育要闻

大热倒灶压力给到法国 王楚揭法国队隐患

娱乐要闻

韩红称要退出公益,多位名人挽留

财经要闻

韩国万亿"芯"基建:存储能否成AI时代油田

汽车要闻

谁懂啊家人们!爹味和班味一点都没,这台底盘最硬国产大猎装太上头!

态度原创

本地
家居
时尚
亲子
公开课

本地新闻

贵州小城的新目标:举办“村超”世界杯!

家居要闻

传奇筑 日常诗

“复古波点”又流行回来了!夏天简单穿就很时髦

亲子要闻

各种小动物的宝宝叫什么,小朋友们快问快答,网友:他们怎么懂这么多

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版