网易首页 > 网易号 > 正文 申请入驻

微软发布医疗时序基座模型:4540亿数据预训练,解决不规则采样

0
分享至

在大模型(LLM)与计算机视觉(CV)争相重塑医疗行业的今天,我们似乎已经拥有了无所不能的数字助手:它们能够像放射科医生一样精准解读CT影像,也能像内科医生一样撰写病历摘要。

但医疗AI世界中,仍有一块关键拼图缺失——那就是理解“生命动态演变”的能力。



△图1.不同模态的医疗数据

正如图1所示,如果将患者的生命历程比作一部电影,现有的AI往往只能捕捉到零散的帧画:

影像(Image)是“快照”:定格的仅仅是某一瞬间的解剖结构;

文本(Text)是“叙述”:往往只是对既往病情的主观回顾;

唯有时间序列(Time Series),才忠实记录了生命体征的连续轨迹。

然而,读懂这条“曲线”远比处理静态图像复杂。为此,微软亚洲研究院推出了专为医疗时序数据设计的通用基座模型——MIRA。

该模型基于4540亿个医疗数据点进行大规模预训练,通过两大核心技术突破了传统模型对规则采样的依赖,旨在解决真实世界医疗数据“不规则、异构性”的难题。

实验表明,MIRA在关键预测任务上的表现超越了现有SOTA模型,并展现出卓越的零样本(Zero-shot)迁移能力。

一起来看具体方案。

真实医疗数据:大模型的“噩梦”

长期以来,医疗时序模型的通用化进程面临诸多挑战,其核心问题在于“理想假设”与“现实数据”的错位

通用深度学习模型通常基于“规则采样”的理想化假设,即数据是整齐划一、均匀分布的。

然而,在真实医疗场景中,尤其是重症监护室(ICU),生命体征的记录往往呈现出“时疏时密”的特点:心跳以秒为单位波动,血压可能以小时为单位记录,而血液检测指标可能需要一天甚至更长时间才能更新一次。

这种多时间尺度交织、采样频率不规则的特性,构成了医疗时序数据最显著的挑战,也是大模型在医疗领域落地应用的核心障碍。



△图2.医疗时间序列数据典型样例

图2医学时间序列数据具有以下特点:①时间间隔不规则,②采样率异质,③由于临床工作流程不标准或仪器按照不到位造成的数据缺失。

传统方法为了让模型处理这些数据,往往不得不采用插值(Imputation)等手段强行对齐。这种做法不仅容易引入人为的“噪声”,还可能丢失原本的时间动力学信息,属于典型的“削足适履”。

而MIRA的提出,正是为了解决这一难题。它不再局限于单一场景训练,而是从海量医疗数据中学习跨场景、跨模态的生理动态模式,成为一个具备卓越迁移能力的通用医疗基座模型。

两大核心技术:读懂不规则律动

面对医疗数据“杂乱无章”的特性,MIRA设计了两大核心技术模块,分别解决了“历史”与“未来”的建模难题。



△图3.MIRA的架构

MIRA的架构如下:①接收不规则时间序列和时间戳作为输入,并应用CT-RoPE进行连续时间编码。②混合专家层根据频率路由到不同的Expert。③Neural ODE模块将潜在状态演化到任意目标时间戳,从而实现灵活的时间感知预测

1.CT-RoPE:给“历史”一把弹性标尺

传统模型处理时间序列习惯用离散的整数索引(1,2,3…)来标记顺序,默认每一步距离相等,忽略了医疗数据中“时疏时密”的真实间隔。

MIRA创新性地提出了连续时间旋转位置编码(CT-RoPE)。它摒弃了离散索引,直接将真实的连续时间戳代入旋转矩阵计算。

这意味着,模型能够精准感知历史记录中任意时间间隔的变化,而不是机械地记录采样次数。

2. Neural ODE:描绘“未来”的连续曲线

人体状态是连续流动的,而非离散跳变。为了精准推演病情走向,MIRA引入了神经常微分方程(Neural ODE)模块。

如果说CT-RoPE是为了读懂过去零散的点,那么Neural ODE就是为了画出未来连续的线。它模拟生物体内部的动力学变化,能基于离散数据推导出连续时间下的潜在状态演化轨迹

这意味着,即使未来的采样时间点不确定,模型也能依循生理规律,给出符合动力学逻辑的合理预测。

实验验证:零样本与高鲁棒性

研究团队在MIMIC-III、MIMIC-IV等多个权威数据集上对MIRA进行了评估。

1. 零样本(Zero-shot)预测突破

最值得关注的是MIRA的迁移能力。在未经过任何特定目标数据集训练的情况下,MIRA直接被部署到全新的医疗场景中。

数据显示,其在分布外(OOD)测试集上的表现,甚至超越了部分专门训练的全监督模型。这说明MIRA学到了生理信号变化的“通用规律”,而不仅仅是拟合了某家医院的数据分布。



△图4.与baseline相比,MIRA out-of-distribution表现

2.极度稀疏数据的“高鲁棒性”

面对缺失值,传统模型往往依赖插值预处理。这种做法不仅引入人为噪声,还可能破坏数据的原始分布特性。

而MIRA得益于Neural ODE,无需任何插值操作即可原生适配。通过建模时间序列的连续动力学特性,MIRA能够直接处理数据中的缺失值,无需额外的预处理步骤。

实验表明,即便在数据极度稀疏(例如仅保留30%观测点)的条件下,MIRA的性能依然保持稳健,并未像传统预测模型那样出现性能的显著下滑。这种对真实世界“脏数据”的适应能力,证明了其在复杂临床环境下的高鲁棒性。



开启医疗AI的“通用基座”时代

MIRA的提出可谓是医疗时序预测向“通用基座”时代迈进的重要探索。通过解决不规则采样和异构数据难题,MIRA为医疗AI摆脱“烟囱式”开发模式提供了可能。

未来,医院或可利用MIRA作为底座,配合少量本地数据微调,快速获得高精度的定制化模型。这为构建更智能的ICU早期预警、慢病管理以及通用AI助手奠定了坚实基础。

论文链接:

https://arxiv.org/abs/2506.07584
项目链接:

https://github.com/microsoft/MIRA

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
你坐火车有过哪些奇葩经历?网友:怪自己那时候太单纯!

你坐火车有过哪些奇葩经历?网友:怪自己那时候太单纯!

夜深爱杂谈
2025-12-21 17:37:52
何庆魁喊话赵本山:你说有事吱声,孙子留学得50万,但我不能张嘴

何庆魁喊话赵本山:你说有事吱声,孙子留学得50万,但我不能张嘴

非常先生看娱乐
2026-01-22 17:58:24
浙江知名主持嫁富商赴美定居,5年生3娃住豪宅

浙江知名主持嫁富商赴美定居,5年生3娃住豪宅

让心灵得以栖息
2026-01-25 19:51:57
年终奖八千同事七万,老板找我续约,我淡定递上离职信他慌了

年终奖八千同事七万,老板找我续约,我淡定递上离职信他慌了

晓艾故事汇
2026-01-06 09:08:51
世界上最旺自己的一个规律:1个字

世界上最旺自己的一个规律:1个字

知和大叔
2026-01-15 23:51:48
泰游客赴哈尔滨旅行后回国报警,涉事泰国旅行社:系己方与顾客的问题,与中国旅行社无关

泰游客赴哈尔滨旅行后回国报警,涉事泰国旅行社:系己方与顾客的问题,与中国旅行社无关

红星新闻
2026-01-23 12:26:32
董洁在雪地直播卖羊绒大衣 全程没吼没催 只轻声讲设计 两小时卖8亿

董洁在雪地直播卖羊绒大衣 全程没吼没催 只轻声讲设计 两小时卖8亿

草莓解说体育
2026-01-24 00:00:28
中央定调,延迟退休继续实施!公务员和事业单位员工不能向后延?

中央定调,延迟退休继续实施!公务员和事业单位员工不能向后延?

王五说说看
2026-01-18 08:23:52
预言成真?再对日本大动脉下死手,高市最不希望的事已发生

预言成真?再对日本大动脉下死手,高市最不希望的事已发生

谷盟a
2026-01-24 15:24:56
八卦|米娜计划购车!保时捷被嫌狗都不要!辟谣资产过亿:播2小时325还要交税!

八卦|米娜计划购车!保时捷被嫌狗都不要!辟谣资产过亿:播2小时325还要交税!

动物奇奇怪怪
2026-01-25 11:58:24
重磅!利物浦谈欧洲顶级左后卫 英超旧将愿回默西塞德

重磅!利物浦谈欧洲顶级左后卫 英超旧将愿回默西塞德

澜归序
2026-01-26 02:21:41
92岁前法官独居上海养老院,独子留英40年开公司,他竟说不后悔

92岁前法官独居上海养老院,独子留英40年开公司,他竟说不后悔

大鱼简科
2026-01-23 16:41:32
国外留学生的生活有多炸裂?网友:给我这个农村人看笑了

国外留学生的生活有多炸裂?网友:给我这个农村人看笑了

带你感受人间冷暖
2026-01-25 00:20:06
大布婚礼DJ亲证:没见过这样的妈!抢新娘风头,还拉儿子跳那种舞

大布婚礼DJ亲证:没见过这样的妈!抢新娘风头,还拉儿子跳那种舞

新欧洲
2026-01-24 21:21:07
霍诺德玩命攀登101大楼酬劳曝光,回应:尴尬的小数目

霍诺德玩命攀登101大楼酬劳曝光,回应:尴尬的小数目

体育妞世界
2026-01-25 16:35:37
拉“反斩首”防线?国防部首次确认,对赖清德逮捕可直接瓮中捉鳖

拉“反斩首”防线?国防部首次确认,对赖清德逮捕可直接瓮中捉鳖

通文知史
2026-01-24 18:15:03
到嘴的鸭子飞了!曝海港遭截胡,中超抢断王或加盟联赛新土豪

到嘴的鸭子飞了!曝海港遭截胡,中超抢断王或加盟联赛新土豪

体坛鉴春秋
2026-01-25 15:55:02
两位女主播互相爆料,各自都有黑人男友,亲密合照还被曝光

两位女主播互相爆料,各自都有黑人男友,亲密合照还被曝光

新游戏大妹子
2026-01-23 12:30:08
负债117亿!知名汽车巨头宣布破产!这款国产车,将彻底退出中国

负债117亿!知名汽车巨头宣布破产!这款国产车,将彻底退出中国

泠泠说史
2026-01-23 18:15:22
未婚先孕?曝范冰冰现身妇产医院,小心翼翼穿着宽松,腹部疑似隆起

未婚先孕?曝范冰冰现身妇产医院,小心翼翼穿着宽松,腹部疑似隆起

八卦王者
2026-01-23 15:47:04
2026-01-26 03:00:49
量子位 incentive-icons
量子位
追踪人工智能动态
12060文章数 176362关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

时尚
本地
艺术
家居
数码

看了鲁豫对章小蕙的采访,最大感触是这一点

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

艺术要闻

这些肖像看完直呼“爽”!真是好久都没有看到了!

家居要闻

在家度假 160平南洋混搭宅

数码要闻

AMD最强APU更新!锐龙AI Max+ 400详细规格曝光:5.2GHz CPU、3.0GHz GPU

无障碍浏览 进入关怀版