网易首页 > 网易号 > 正文 申请入驻

科学家研发AI病理学大模型,受训于28个癌症中心3万病人数据,为病理学诊断打造新工具

0
分享至

  “Nature 编辑迅速意识到这是一个里程碑式的科研成果,于是快速处理了稿件。最终这篇论文在5个月内就被接受,远远快于 Nature 平均268天的接受时间。”谈及自己和合作者的最新论文,美国华盛顿大学王晟教授表示。

  图 | 王晟(来源:王晟)

  审稿人也表示,在数字病理学领域这是一个前所未有的工作,非常期待看到它能改变病理学的科研和临床范式。

  研究中,王晟和合作者研发出一个超多参数的病理学大模型,也是全球第一个能针对“整张”病理图片进行建模和分类的模型。

  他们将本次模型在来自28个癌症中心的3万个病人数据上进行训练和验证。

  结果显示,该模型在26个任务中的25个任务上取得最佳效果,证明了其有效性和普适性。

  王晟表示,本次成果是医生的有力助手、普通人的福音、医学院的辅助教材。

  “这项研究的成功让我们对 AI 方法在癌症治疗中的应用充满信心,也将成为癌症治疗领域的新开始。”他说。

  随着技术的进一步发展,本次 AI 模型有望在癌症诊断和治疗中发挥越来越重要的作用,为全球数百万癌症患者带来新的希望。

  预计其将带来以下应用:

  其一,成为医生的有力助手。

  首先,AI 病理学模型将直接应用于各大医院,成为医生进行病理学诊断的初筛工具之一。

  这一模型能够迅速分析病理图像,提供初步诊断意见,帮助病理学家更高效地做出准确诊断。

  这不仅能提高诊断速度,还能减轻病理学家的工作负担,让他们有更多时间处理复杂病例。

  其二,成为普通人的福音。

  在缺乏高水平病理学家的地区或国家,AI 病理学模型将成为一种替代方案。

  普通用户可以直接使用这一模型对他们的病理学图片进行分析,获得可靠的诊断结果。

  这将大大改善医疗资源不足地区的诊断水平,确保更多患者能够及时得到准确的诊断和治疗建议。

  其三,成为医学院的辅助教材。

  培养一个合格的病理学从业者需要大量时间和金钱,而 AI 模型可以作为医学院的辅助教材。

  通过提供大量标注的学习样本,AI 模型可以让医学院学生接触到更多病理学案例,提升他们的学习效率和实践经验。

  总的来说,AI 病理学模型在医生、普通人和医学生三个方面展现了广阔的应用前景。它将推动病理学领域的发展,提高癌症诊断的效率和准确性。

  (来源:Nature)

  让模型不再“看了后面忘了前面”

  据介绍,每年全球因癌症去世的人数超过一千万人,快速并且准确的诊断癌症非常重要。

  病理切片检查是最直观最可靠的诊断肿瘤的方法,也是每一个癌症病人被确诊癌症的必须手段之一。

  病理检查将患病器官直接取下的病灶制成切片,放在显微镜下观察,然后判断是否为恶性肿瘤,预测对应的病理分型,从而决定相关的治疗手段。

  鉴于病理检测的大量需求和繁琐工作量,设计准确的 AI 模型来将上述过程进行自动化,会带来极大的价值。

  病理切片分析过程可以建模为一个图片分类的问题,即给定一个病理切片的图片,用 AI 模型来将图片分类到恶性或者良性的病理分型。

  但是,与传统图片分类模型(例如将动物图片分类到猫或者狗)的不同之处是,病理图片非常大。

  一个普通的病理图片甚至高达10万乘以10万个像素,而传统 AI 图片的分类器一般是针对256*256像素的图进行设计的。

  这么一整张病理图片会占据很大的内存空间,无法完整地放入 AI 模型,进而使用图形处理器(GPU,Graphics Processing Unit)加以训练。

  因此,现有的 AI 模型都无法对“整张”(whole-slide)病理图片进行建模。

  为了解决这个问题,王晟等人发现要对整张10万乘以10万个像素的病理图片进行建模,核心的技术难点解决长文章建模的问题。

  即让模型能够对一个超长的文字序列进行整体建模,而不会出现“看了后面忘了前面”的情况。

  一个病理图片对应的数据规模约等于15万个字的一个长文章。举例来说,让一个人去连续读15万个字的文章,那必然会出现看了后面忘了前面,无法从全局角度去理解这个长文章的情况。

  对 AI 模型来说,难点是相同的,AI 模型也无法完全理解和消化这个长文章。

  因此,长文章建模是自然语言处理领域的一个长久的问题,也是最核心的问题之一。

  近年来,ChatGPT 和 GPT4引起的大模型潮流,让长文章建模问题得到了广泛的关注和研究。

  不同于传统的问答系统,ChatGPT 在回答用户提问的时候,会综合考虑用户与 ChatGPT 之前的对话,而这些对话就会形成一个长文章。

  ChatGPT 的成功很大程度源于对长文章建模的新自然语言处理技术。

  因此,王晟等人将这些在自然语言处理中建模长文章的技术,巧妙地改进和运用于病理图片分类,从而解决了对超大整张病理图片进行建模和分类的难题。

  (来源:Nature)

  三方强强联合,曾经的师生如今共同担任通讯作者

  王晟表示,本次项目由他所在的华盛顿大学、微软研究院、以及美国最大的医疗机构之一美国普罗维登斯癌症研究院共同合作完成的。

  2023年6月,王晟的博士研究生许涵文在微软研究院进行暑期实习,研究课题就是如何对大规模病理图片进行建模。

  这时,ChatGPT 等大模型技术在各个领域崭露头角,但还没有人将其应用于医学病理图片。

  三方经过深入探讨之后发现:应用大模型技术的关键难点在于长文章建模。

  此时,微软研究院发布的 LongNet 模型引起了他们的注意,尽管这个模型从未用于医学领域,但在长文章建模方面表现出色。

  后来,许涵文和他的微软研究院实习导师初步判断:微软研究院的 LongNet 模型能够解决大规模病理图片建模问题。随后,许涵文开展了为期三个月的实验。

  2023年9月,他们获得了初步解决方案,即大尺度病理图片建模问题,可以通过自然语言处理中的长文章建模技术来解决。

  初步方案确定后,他们进行了更深入的验证。并在来自28个癌症中心的31种癌症类型数据上进行测试。

  实验结果显示:本次模型在多个任务上都达到了最佳效果,说明它是一个既通用、又准确的病理学建模方案。

  王晟表示:“项目的成功离不开由世界顶尖 AI 专家和病理学专家组建的跨领域团队。”

  其中,美国普罗维登斯癌症研究院提供了核心数据和医学技术,微软研究院贡献了最先进的 AI 技术和计算资源,王晟所在的华盛顿大学则带来了前沿的 AI 医学研究技术和经验。

  (来源:Nature)

  日前,相关论文以《真实数据数字病理学的整体幻灯基础模型》(A whole-slide foundation model for digital pathology from real-world data)为题发在 Nature[1]。

  许涵文是第一作者,美国普罗维登斯癌症研究院的卡罗·毕弗洛(Carlo Bifulco)教授、王晟、以及微软研究院的潘海峰博士担任共同通讯作者。

  图 | 相关论文(来源:Nature)

  王晟表示:“我与潘博士的合作始于2014年,那时我还是一年级博士生,在位于西雅图的微软研究院做暑期实习,潘博士则是我的实习导师。”

  当时他们都在研究自然语言处理(NLP,Natural Language Processing),王晟是美国伊利诺伊大学香槟分校计算机系的博士生,潘海峰则是微软研究院 NLP 组的研究员。

  彼时,深度学习算法刚刚开始崭露头角,AI 的潮流也尚未兴起,还没有研究人员将 AI 或 NLP 方法应用于医学领域的研究。

  NLP 和医学在当时看来是完全不相关的两个领域。

  然而,潘海峰建议王晟探索研究如何将 NLP 技术应用于解决医学数据问题。

  2014年夏天,他们合作的项目就是利用机器学习和 NLP 中常用的置信传播方法,进行癌症药物作用的因果推断和预测。

  在 AlphaFold 于2020年问世后,AI 制药已成为 AI 领域最热门的应用之一,而他们早在2014年就已经在研究类似的问题。

  这次发表在 Nature 上的论文延续了这一思路,他们利用 ChatGPT 中的长文章建模技术,解决了医学领域中超大病理图片的建模问题。

  “可以说,我们将当下最前沿的生成式 AI 技术应用到了一个全新领域,这也是我们论文的最大创新点。”王晟表示。

  下一步,他们计划将本次 AI 模型推广到其他癌症诊断中的图像数据,例如计算机断层扫描(CT,ComputedTomography)、核磁共振成像和 X 光。

  因为本次提出的是一个通用的医学图像模型架构,因此他们相信这一模型架构同样适用于其他类型的医学图像数据。

  具体来说,他们计划为每种图像数据(如 CT、核磁共振成像、X 光)构建一个大模型,以充分利用这些不同类型的图像信息。

  除此之外,他们还将对基因数据和临床诊断书等其他重要医学数据类型,构建相应的大模型。

  最终,他们的目标是将这些独立的大模型进行整合,创建一个全面的癌症诊断 AI 系统。

  这一系统能够结合图像、基因和临床数据,为癌症诊断和治疗提供全面支持。

  预计这种跨领域、多数据源的 AI 模型有望成为癌症诊断和治疗的有力工具,为医生提供更全面的信息支持,推动医疗研究领域的进一步发展。

  参考资料:

  1.Xu, H., Usuyama, N., Bagga, J.et al.A whole-slide foundation model for digital pathology from real-world data.Nature630, 181–188 (2024). https://doi.org/10.1038/s41586-024-07441-w

  排版:罗以、刘雅坤

责任编辑:郜雪丹_NT5097

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中央社会工作部:坚决拥护党中央决定

中央社会工作部:坚决拥护党中央决定

新京报
2026-06-28 09:21:39
扎心痛啊!70岁赵雅芝舞台无美颜生图曝光,手臂衰老的状态太真实

扎心痛啊!70岁赵雅芝舞台无美颜生图曝光,手臂衰老的状态太真实

火山詩话
2026-06-28 14:53:04
彝族姑娘查分后转头先喂猪,她心仪的武汉大学回应了!

彝族姑娘查分后转头先喂猪,她心仪的武汉大学回应了!

环球网资讯
2026-06-28 08:09:11
缴费通知:7月1日实施!退休人员也需缴纳

缴费通知:7月1日实施!退休人员也需缴纳

锦绣太原
2026-06-27 18:36:16
韩媒:洪明甫将开发布会总结韩国队表现,并表明未来执教计划

韩媒:洪明甫将开发布会总结韩国队表现,并表明未来执教计划

懂球帝
2026-06-28 16:20:11
巴西VS日本!谁能赢?罗纳尔多给出了1个答案

巴西VS日本!谁能赢?罗纳尔多给出了1个答案

体育哲人
2026-06-27 22:04:01
随着阿根廷3-1,奥地利3-3,世界杯32强全部诞生:亚洲仅2队

随着阿根廷3-1,奥地利3-3,世界杯32强全部诞生:亚洲仅2队

侧身凌空斩
2026-06-28 12:04:42
倒闭潮来袭!一深耕东莞15年、近500员工的大型电子厂宣告解散

倒闭潮来袭!一深耕东莞15年、近500员工的大型电子厂宣告解散

火山詩话
2026-06-28 07:42:30
电影《抓特务》票房扑街,这个时代的观众不喜欢任何人通过电影“夹带私货”

电影《抓特务》票房扑街,这个时代的观众不喜欢任何人通过电影“夹带私货”

明叔杂谈
2026-06-27 20:18:56
因工作矛盾,男子在手机搜索“密闭空间丙烷爆炸”等内容后,凌晨反锁宿舍并排放丙烷气体,欲炸死熟睡工友,但未能点着,最终获刑两年半

因工作矛盾,男子在手机搜索“密闭空间丙烷爆炸”等内容后,凌晨反锁宿舍并排放丙烷气体,欲炸死熟睡工友,但未能点着,最终获刑两年半

都市快报橙柿互动
2026-06-28 17:47:19
广州高校禁止小米汽车入校!车主怒:特斯拉能进,小米为啥不行?

广州高校禁止小米汽车入校!车主怒:特斯拉能进,小米为啥不行?

听心堂
2026-06-28 16:28:35
美媒警告美国只有两条路:要么核战,要么接受中国统一

美媒警告美国只有两条路:要么核战,要么接受中国统一

近史博览
2026-06-28 11:36:45
记者:乌拉圭足协决定取消包机,球员将乘坐普通航班返回

记者:乌拉圭足协决定取消包机,球员将乘坐普通航班返回

懂球帝
2026-06-28 04:02:02
延迟退休舆论降温的背后,不是黄了,是卡住了

延迟退休舆论降温的背后,不是黄了,是卡住了

大道微言
2026-06-28 09:09:49
韩国伊朗出局!亚洲9队参赛,7队被淘汰,亚足联8.5个名额太多了

韩国伊朗出局!亚洲9队参赛,7队被淘汰,亚足联8.5个名额太多了

侃球熊弟
2026-06-28 12:05:35
清远落龙潭女子溯溪玩水遇难后续,实拍细节曝光,野溪真相太吓人

清远落龙潭女子溯溪玩水遇难后续,实拍细节曝光,野溪真相太吓人

社会日日鲜
2026-06-28 08:42:14
四川男子被骗园区后续!姐姐赴泰挖出猛料,多方勾结,根本防不住

四川男子被骗园区后续!姐姐赴泰挖出猛料,多方勾结,根本防不住

辉哥说动漫
2026-06-27 15:39:30
彻底凉凉!黄一鸣案判了,结果大快人心,难怪王思聪不认孩子

彻底凉凉!黄一鸣案判了,结果大快人心,难怪王思聪不认孩子

赵昉是个热血青年
2026-06-27 19:49:44
中国若退出本届亚运会

中国若退出本届亚运会

小马姨
2026-06-28 13:43:53
香港史上首位在日本AV业出道的香港女子被重案组拘捕,出道时曾因“恭贺新闻稿”惊动港府亲自出面辟谣!

香港史上首位在日本AV业出道的香港女子被重案组拘捕,出道时曾因“恭贺新闻稿”惊动港府亲自出面辟谣!

澳门月刊
2026-06-26 15:43:09
2026-06-28 19:04:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16890文章数 515059关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

中央巡视后不久副部级官员任上落马 其上任不到一年半

头条要闻

中央巡视后不久副部级官员任上落马 其上任不到一年半

体育要闻

韩国可算确定被淘汰了

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

两只股票撑起的韩国股市,半年熔断 33 次

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

教育
时尚
房产
手机
家居

教育要闻

赶快检查孩子的手机里有没有这几款违法软件

今天的脸不想营业,但墨镜想

房产要闻

全国高考大放水,300分就能上本科!论上岸率,海南没输过!

手机要闻

与高端、中端有关,荣耀传来三大喜讯

家居要闻

绿意盎然 自然之境

无障碍浏览 进入关怀版