撰文丨王聪
编辑丨王多鱼
排版丨水成文
全世界每年有近 1800 万人死于心血管疾病,占全球死亡总数的 32%。这一惊人数字背后,是实时健康监测技术的迫切需求。然而,传统心血管信号监测面临一个核心矛盾:信号质量与患者舒适度难以兼得。
心血管信号,例如光电容积脉搏波(PPG)、心电图(ECG),还有血压(BP),本质上相互关联且互补,共同反映心血管系统的健康状况。然而,每种技术都有其局限性,可穿戴设备方便但信号易受干扰,医疗级设备精确却难以持续使用。这导致了这些心血管信号在实时监测中的联合应用受到严重限制。
2025 年 12 月 29 日,清华大学朱军、王立元等,在 Nature 子刊Nature Machine Intelligence上发表了题为:Versatile cardiovascular signal generation with a unified diffusion transformer 的研究论文。
该研究开发了一种多模态 diffusion transformer 模型——UniCardio,能够根据已有的心血管信号“补全”缺失或质量较差的信号,其生成的信号在检测异常健康状况和生命体征评估方面与真实信号性能相当,同时确保了对人类专家的可解释性。这些优势使 UniCardio 成为推动人工智能辅助医疗发展的实用且稳健的框架。
![]()
困境:为什么我们需要“AI 补全”技术?
心血管信号本质上是相互关联且互补的,共同反映了心血管系统的健康状况。但在实际监测过程中,我们很少能获得完整、高质量的多模态信号。
可穿戴设备的信号容易受到运动伪影、电源线干扰和肌肉收缩的影响;临床监测则因设备昂贵、患者不适而难以长期持续。即使获得了信号,噪声和中断也使人类专家和自动化算法难以准确解读。
传统方法试图通过任务特定的模型解决个别问题,如去噪、重建间歇信号或特定信号转换。但这些方法未能充分利用不同信号间的互补信息,效果有限。
突破:UniCardio 如何实现信号“补全”?
UniCardio的核心创新在于将多种心血管信号的生成任务统一到一个框架中。这就像是训练一位精通多国语言的翻译,不仅能逐字翻译,还能根据上下文理解并补全缺失的信息。
统一生成框架:研究团队采用了先进的条件扩散模型,通过两个过程实现信号生成:前向过程逐渐向数据添加噪声,将其转化为简单的高斯分布;反向过程则学习在条件信息的引导下迭代重建所需信号。
这种方法的关键优势在于,不同信号模态都可以从同一噪声分布中重建,使得多种心血管信号的恢复和转换能够在共享框架内实现。
专用模型架构:UniCardio 的模型结构精心设计了模态特定编码器、定制 transformer 模块和模态特定解码器。
模态特定编码器使用多尺度卷积神经网络,提取不同时间尺度上的特征表示;定制 transformer 模块则通过任务特定的注意力掩码,精确控制不同模态间的信息流动,确保生成任务只关注相关的条件信息。
持续学习范式:面对多种信号模态组合带来的巨大任务空间,研究团队提出了创新的持续学习范式,分阶段训练模型学习不同数量条件模态下的生成任务。
通过结合学习率调度、训练批次组合和任务特定注意力掩码等策略,有效克服了持续学习中的“灾难性遗忘”问题,使模型能够逐步整合新模态,适应日益复杂的关系。
![]()
性能:生成信号的质量如何?
研究团队在包含 339 小时的三模态记录的数据集上预训练 UniCardio,并在一系列生成任务上评估其性能。
全面超越专业模型:在去噪、插补和转换任务中,UniCardio 明显优于最近的任务特定基线模型。生成的信号在波形形态、频谱特征和临床可解释性方面均表现出色。
特别是在 PPG 插补、ECG 插补、PPG 到 ECG 转换和 PPG 到 BP 转换等具有挑战性的任务上,UniCardio 不仅超越了专门为这些任务设计的模型,而且在使用更多条件模态时,性能还能进一步提升。
参数效率高:UniCardio 的所有任务仅需相对较少的参数即可完成,每种模态只需添加约 0.3M 参数的编码器和解码器,使其非常适合在可穿戴设备上部署。相比之下,使用任务特定方法实现这些功能需要组合多个专用模型,参数开销会增加数十倍。
实践:生成信号真的可用于医疗诊断吗?
一个关键问题是:AI 生成的信号是否足够可靠,可以用于实际的健康监测和医疗诊断?研究团队通过多个真实场景给出了肯定答案。
异常健康状况检测:在 PTB-XL 数据集上,团队评估了 UniCardio 在检测 ST 改变和肥厚性心肌病等异常状况方面的能力。结果显示,去噪后的信号在准确度、灵敏度和特异性方面均达到与真实信号相当的水平。特别是在房颤(AF)检测任务中,UniCardio 能够从可穿戴 PPG 信号生成高质量的 ECG 信号,并插补间歇性 ECG 信号以恢复缺失段,显著提升了房颤检测的准确性。
生命体征评估:在心率评估和血压评估任务中,生成信号同样表现出色。通过从 PPG 信号生成 ECG 信号,UniCardio 显著降低了心率估计的平均绝对误差;在血压估计方面,也实现了对基线模型的明显改进。
临床可解释性:更重要的是,生成的信号显示出典型的异常诊断特征,如心房早搏的早期 P 波和代偿间期,心房颤动的颤动波等。这些特征经过临床医生评估验证,确保了生成信号的临床有效性和可解释性。
扩散过程产生的逐步中间结果还允许专家分析信号在整个生成过程中的演变,进一步增强了可解释性。
未来:AI 生成信号将如何改变医疗监测?
UniCardio 的出现标志着心血管信号处理范式的转变。它不仅仅是单个任务的改进,而是为多模态生理信号生成提供了一个通用、可扩展的基础框架——
个性化健康监测:对于日常健康监测,UniCardio 能够通过自适应信号恢复实现准确数据采集,特别是对易受噪声和中断影响的可穿戴信号。同时,某些无法通过可穿戴传感器获取的心血管信号,也可以由 UniCardio 合成,提供更全面的健康评估。
重症患者监护:对于重症患者,涉及非可穿戴和侵入性程序的长期临床监测会导致显著不适。在这种情况下,模态转换为实时警报提供了有效替代方案,提示必要的临床检查。
更广泛的应用场景:除了心血管健康,UniCardio 还有望应用于心理和认知科学研究,其中生理信号广泛用于评估压力、认知负荷和情绪识别。在这些非危重护理场景中,可穿戴设备是主要记录工具,但通常会产生比控制良好的 ICU 环境更多中断的记录。
UniCardio 代表了多模态生理信号生成的重要进展,通过统一框架解决了心血管信号处理中的关键挑战。其生成信号在多个下游任务中表现出色,参数效率高,推理速度快,非常适合实时监测应用。
随着技术的进一步发展和验证,这类 AI 生成信号技术将不仅改善现有健康监测系统,还将开启个性化医疗和远程患者监测的新时代,让高质量医疗保健服务更加普惠、高效。
论文链接:
https://www.nature.com/articles/s42256-025-01147-y
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.