网易首页 > 网易号 > 正文 申请入驻

脑机启侦 | 浙江大学团队提出SleepVLM(04.03)

0
分享至



长期以来,尽管基于深度学习的自动睡眠分期模型已经达到了人类专家级别的准确率,但它们作为“黑盒”运行,缺乏可解释性,严重阻碍了其在临床的落地应用 。近日,浙江大学科研团队提出了一项突破性成果——SleepVLM。这是首个应用于可解释睡眠分期的视觉语言模型(VLM)。该模型不仅能从多通道多导睡眠图(PSG)波形图像中准确进行睡眠分期,还能基于美国睡眠医学会(AASM)评分标准,自动生成临床医生可读的自然语言推理过程。目前,该研究已在arXiv发布预印本,同时开源了全球首个专家标注脑电睡眠分期推理数据集 MASS-EX。

01 研究背景介绍

睡眠障碍是全球性的重大公共卫生挑战,仅阻塞性睡眠呼吸暂停就在全球影响近十亿成年人 。多导睡眠图(PSG)是诊断睡眠障碍的临床金标准 。在目前的临床实践中,经过培训的睡眠技师需要通过肉眼观察多通道PSG记录,并依据AASM评分手册中的规则对睡眠阶段进行分类 。

过去十年中,深度学习在自动睡眠分期方面取得了巨大进展,性能已逼近甚至达到人类专家水平 。然而,这些模型本质上是黑盒分类器,只能输出预测标签,而无法解释决策过程 。虽然现有的一些可解释AI(XAI)方法(如热力图、注意力可视化等)能指出模型关注了哪些输入区域,但它们无法用临床语言解释“为什么” 。临床医生需要的不是抽象的模型特征,而是基于与他们日常诊断相同的医学词汇和规则系统(AASM)的“临床合理性”解释 。

02 论文概要

针对这一痛点,浙江大学团队提出了 SleepVLM。这是一种规则驱动的视觉语言模型框架,巧妙地将自动分类与临床解释结合在单次前向传播中 。

模拟临床技师的工作流:

■ 波形图像渲染:将多通道PSG信号(如 EEG, EOG, EMG)转换为标准化的多通道波形图像,使模型像人类专家一样“观察”波形形态 。

两阶段训练管道:

实验不仅解决了稳定性问题,还保持了极高的采样精度。

■ 阶段一:波形感知预训练(WPT)。训练模型预测每秒的频带功率和振幅特征,强化其对脑电波形的视觉感知能力 。

■ 阶段二:规则驱动的监督微调(SFT)。向模型输入连续三个epoch的图像(提供上下文),并在系统提示中注入结构化的AASM评分规则,要求模型不仅输出睡眠阶段,还要引用具体的AASM规则并写出完整的推理逻辑 。


SleepVLM 框架概览

左侧为信号处理与波形渲染;中间为两阶段训练管道;右侧展示了同时输出标签、规则与自然语言推理的过程。

03 研究结果分析

研究团队在一个保留测试集(MASS-SS1, n=53)和一个外部临床测试集(ZUAMHCS, n=100)上,对SleepVLM进行了分类性能与推理质量的双维度评估 。

媲美SOTA的分类性能

在MASS-SS1测试集上,SleepVLM取得了Cohen's kappa为0.767的优异成绩;在更具挑战性的外部临床数据集ZUAMHCS上,kappa值依然保持在0.743。与现有的12种基于信号的方法和2种基于图像的方法相比,SleepVLM性能处于第一梯队,并且展现出卓越的跨域鲁棒性(跨域 kappa 仅下降 2.4 个百分点) 。最关键的是,它是唯一一个在保持高准确率的同时提供详细医学解释的模型 。



■ 临床专家认可的高质量推理

除了准确率,由专业睡眠技师对模型生成的推理文本进行了严格的盲评打分(满分 5.0) 。在事实准确性(Factual Accuracy)、证据全面性(Evidence Comprehensiveness)和逻辑连贯性(Logical Coherence)三个维度上,SleepVLM 在两个数据集上的平均得分均超过了 4.0 分(“良好”水平) 。模型能够精准识别Alpha节律、K复合波、睡眠纺锤波等特征,并使用排他性逻辑进行辩证推理 。


SleepVLM 输出示例

模型不仅给出了准确的分期结果,还引用了特定的AASM规则(如W.1, N2.1等),并详细描述了各通道中观察到的生理特征及排他性推导过程。

■ 轻量化与易部署特性

为了满足临床环境的部署需求,团队应用了W4A16量化技术。量化后的模型大小缩减了54.9%(仅3.2GB),推理速度提升了2.2倍,而kappa值的损失不超过1.6个百分点 。这使得SleepVLM完全可以部署在单张消费级 GPU(如 RTX 4090)上,极大地降低了临床应用门槛 。

04 结论与启发展望

SleepVLM打破了长期以来自动睡眠分期领域的“准确率vs.可解释性”困境,确立了一个全新的范式:将自动睡眠分期从“仅输出标签”的预测推向“受规则约束、可审计的临床推理” 。这为未来建立值得信赖的人机协作(Human-AI Collaboration)睡眠医学辅助系统奠定了坚实的基础 。

为了进一步推动可解释睡眠医学的研究,研究团队开源了MASS-EX数据集。该数据集包含了62名受试者的59317个epoch,提供了基于AASM规则的详细专家标注和推理文本,填补了该领域高质量解释性基准数据集的空白 。

来源 | Guifeng Deng, Pan Wang, Jiquan Wang, Shuying Rao, Junyi Xie, Wanjun Guo, Tao Li, Haiteng Jiang. SleepVLM: Explainable and Rule-Grounded Sleep Staging via a Vision-Language Model. 脑机接口社区

浙大科技园启真脑机智能产业化基地是在浙大控股集团领导下,由浙江大学科技园发展有限公司与杭州未来科技城管委会共建,围绕脑机智能产业主体,辐射脑机+生命健康、脑机+智能制造、脑机+新一代信息技术、脑机+新材料等领域的专业化特色产业基地,由杭州启真未来科技发展有限公司负责全面运营。

基地依托浙江大学在脑机智能方面的学科优势,以脑机智能作为核心科技支撑,贯彻浙江大学国家大学科技园“有组织科技成果转化、有靶向科技企业孵化、有体系未来产业培育”的服务体系,致力于打造脑机智能领域具备成果显示度、区域影响力的产业化高地。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为什么说全国城市都应向南宁学习?百万“电驴”与城市共存之道!

为什么说全国城市都应向南宁学习?百万“电驴”与城市共存之道!

A活着
2026-04-03 17:18:49
送分童子?加斯佩里尼对阵国米已16场不胜&9连败

送分童子?加斯佩里尼对阵国米已16场不胜&9连败

懂球帝
2026-04-06 01:35:01
动容!王楚钦这动作让球迷看哭:接受采访时忽然双手撑地 拿命在拼

动容!王楚钦这动作让球迷看哭:接受采访时忽然双手撑地 拿命在拼

风过乡
2026-04-05 07:04:46
台海大桥,一定要慎之又慎:建了之后,很可能收不回成本

台海大桥,一定要慎之又慎:建了之后,很可能收不回成本

触摸史迹
2026-04-05 17:43:22
真正的聪明,是学会“躲”着过日子

真正的聪明,是学会“躲”着过日子

青苹果sht
2026-04-03 05:52:19
“生娃率”持续走低,厦门教授给出建议:不生孩子就下调养老金

“生娃率”持续走低,厦门教授给出建议:不生孩子就下调养老金

大果小果妈妈
2026-04-02 13:16:39
这面相太好了,妥妥旺夫相,膀大腰圆气血足,穿着干净舒服!

这面相太好了,妥妥旺夫相,膀大腰圆气血足,穿着干净舒服!

可乐谈情感
2026-03-29 15:16:24
净利润超2800亿,员工人均年薪113万!这个互联网大佬再次封神

净利润超2800亿,员工人均年薪113万!这个互联网大佬再次封神

毒sir财经
2026-04-03 22:57:23
停手!不要掏耳屎了

停手!不要掏耳屎了

大象新闻
2026-04-03 07:33:05
4天过去,中方准时取消优惠政策,鲁比奥出局,中美恐僵持二十年

4天过去,中方准时取消优惠政策,鲁比奥出局,中美恐僵持二十年

爱史纪
2026-04-05 23:40:42
5-3!赵心童三连鞭斩获争冠先机,巡回锦标赛冠军归属存悬念!

5-3!赵心童三连鞭斩获争冠先机,巡回锦标赛冠军归属存悬念!

世界体坛观察家
2026-04-05 22:40:41
2换1!再看掘金篮网交易,双赢了吗?

2换1!再看掘金篮网交易,双赢了吗?

篮球实录
2026-04-05 22:51:32
饶毅:中国产出的科学垃圾,绝对数量和比例都世界第一

饶毅:中国产出的科学垃圾,绝对数量和比例都世界第一

生物学霸
2026-03-29 17:09:59
为何好多小国都莫名其妙反华?马斯克一语道破本质

为何好多小国都莫名其妙反华?马斯克一语道破本质

兴史兴谈
2026-04-06 02:41:27
全程眼突鼓腮,看了观众对孙俪的评价,才知张艺谋这句话的含金量

全程眼突鼓腮,看了观众对孙俪的评价,才知张艺谋这句话的含金量

陈述影视
2026-04-04 17:53:34
铁了心打垮中国?最大威胁现身!这次不是美国,普京却笑到了最后

铁了心打垮中国?最大威胁现身!这次不是美国,普京却笑到了最后

阿七说史
2026-03-13 15:56:51
特朗普再发通牒,话音刚落,伊朗山区爆发大战,美军损失5架军机

特朗普再发通牒,话音刚落,伊朗山区爆发大战,美军损失5架军机

李遝手工制作
2026-04-06 00:26:54
天雷滚滚,中移动利润下滑20%,中石油中冶下滑,28中字头暴雷

天雷滚滚,中移动利润下滑20%,中石油中冶下滑,28中字头暴雷

鹏哥投研
2026-04-05 18:20:30
银行信贷部老同学揭秘“房价跌不跌已经不重要了…”

银行信贷部老同学揭秘“房价跌不跌已经不重要了…”

慧翔百科
2026-04-01 09:02:03
也算是尽力撑住局面了!掘金替补中锋这次并没有被马刺打爆?

也算是尽力撑住局面了!掘金替补中锋这次并没有被马刺打爆?

稻谷与小麦
2026-04-06 01:28:25
2026-04-06 05:35:00
浙大科技园脑机智能产业化基地
浙大科技园脑机智能产业化基地
聚焦脑机+生命健康、脑机+智能制造、脑机+新一代信息技术、脑机+新材料等领域。
1018文章数 5关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

伊朗官员提开放霍尔木兹海峡条件

头条要闻

伊朗官员提开放霍尔木兹海峡条件

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

本地
健康
游戏
教育
旅游

本地新闻

跟着歌声游安徽,听古村回响

干细胞抗衰4大误区,90%的人都中招

三天鼠标干坏两个,你这还是自走棋嘛?

教育要闻

高考地理中的束水攻沙

旅游要闻

文明旅游|清明出游请注意!莫让这些不文明行为煞风景!

无障碍浏览 进入关怀版