网易首页 > 网易号 > 正文 申请入驻

巴斯克大学首次实现大脑"听说"功能跨任务识别

0
分享至


这项由巴斯克大学HiTZ中心与巴斯克认知、大脑与语言中心联合开展的突破性研究,发表于2026年的arXiv预印本平台(论文编号arXiv:2602.18253v1),标志着脑机接口领域的一个重要里程碑。有兴趣深入了解的读者可以通过该编号查询完整论文。

脑机接口技术一直被认为是连接人脑与计算机的桥梁,特别是在帮助失语症患者恢复语言能力方面具有巨大潜力。然而,传统方法面临着一个根本性挑战:需要为每个患者收集数小时甚至数十小时的大脑信号训练数据,这在临床实践中几乎不可能实现。患者往往无法承受如此长时间的数据收集过程,而医疗资源也难以支撑这样的需求。

研究团队巧妙地将这个问题转化为一个"知识迁移"的挑战,就像教一个已经熟练掌握钢琴演奏的人学习吉他一样。他们首先用一名志愿者的50小时大脑信号数据训练了一个基于Conformer架构的人工智能模型,这个模型专门用于识别大脑中的语音活动模式。这个过程类似于让AI系统深度学习人类大脑处理语音信息的基本规律。

接下来,研究团队将这个"预训练"的模型应用到18名新参与者身上,每人仅需要5分钟的大脑信号数据进行个性化调整。更令人惊喜的是,这个系统不仅能够识别人们听到语音时的大脑活动,还能识别人们说话时的大脑信号,实现了真正的"跨任务"解码能力。

这项研究采用了脑磁图技术来记录大脑活动。脑磁图就像是给大脑装上了一个极其敏感的"信号探测器",能够实时捕捉神经元放电时产生的微弱磁场变化。研究团队使用了306个传感器组成的探测阵列,以每秒250次的频率记录大脑信号,确保不遗漏任何细微的活动模式。

在预训练阶段,研究人员让一名英语母语的志愿者听了50多个小时的有声读物,主要是《夏洛克·福尔摩斯》系列故事。在这个过程中,AI系统学会了识别大脑中"有声音"和"安静"状态的区别。这个基础模型就像一个经验丰富的"大脑信号翻译员",掌握了人类处理语音信息的基本模式。

随后的测试阶段更加有趣。18名西班牙语母语的参与者分别完成了三项不同的任务:聆听预先录制的语音、回放自己的声音录音,以及大声朗读文字。每项任务仅持续约5分钟,产生的大脑信号数据量相当有限。然而,经过预训练的AI系统在这些新数据上进行快速调整后,展现出了令人印象深刻的识别能力。

实验结果显示了迁移学习的显著优势。在识别听力任务方面,使用迁移学习的模型准确率提升了3.7%,达到79.0%,F1分数提高了2.6%,AUC分数更是大幅提升了7.3%。这些改进听起来可能不太起眼,但在脑机接口领域,每一个百分点的提升都意味着巨大的技术进步。特别值得注意的是,即使预训练模型完全基于听力数据,它在语音产生任务上同样表现出了改进,准确率、F1分数和AUC分数分别提高了0.7%、0.7%和1.1%。

更加引人注目的是跨任务解码能力的实现。研究团队发现,在一个任务上训练的模型能够成功解码另一个完全不同的任务。比如,一个专门学习识别"听到语音"时大脑信号的模型,竟然能够识别"说话"时的大脑活动,准确率达到65.0%到73.4%之间。这个发现证实了一个重要的科学假设:人类大脑在处理语音感知和语音产生时,存在共同的神经基础。

跨任务迁移的效果呈现出有趣的方向性特征。感知任务之间的迁移相对容易,听力任务和回放任务之间可以很好地相互迁移,准确率都在72%以上。然而,从语音产生任务向感知任务的迁移稍显困难,准确率降到65-66%左右。这种不对称性实际上符合神经科学的基本原理:语音产生不仅涉及听觉处理,还需要运动规划、感觉反馈等额外的神经机制,而感知任务则相对简单。

当结合迁移学习技术后,跨任务解码能力得到了进一步提升。听力与回放任务间的迁移效果最为显著,准确率提升了6.1%和6.3%。更重要的是,涉及语音产生的跨任务组合也获得了3-5%的改进。这些提升在统计学上都达到了显著性水平,证明了方法的可靠性。

研究团队还深入分析了个体差异对迁移学习效果的影响。结果显示,18名参与者中的大多数都从迁移学习中受益,但效果存在一定的个体差异。在感知任务中,15名参与者表现出改进,而在语音产生任务中,16名参与者获得了提升。这种变异性提示我们,未来的脑机接口系统可能需要考虑个体化调整策略。

从技术角度来看,这项研究采用了多项创新性的方法改进。研究团队引入了"滚动增强"技术,通过对训练数据进行时间维度的循环移位来增加数据多样性,类似于通过不同角度观察同一个物体来增强理解。同时,他们还使用了"软标签"技术,不再简单地将每个时间窗口标记为"语音"或"静音",而是根据该窗口中语音所占的比例给出更细致的标记。

实验设计的严谨性也值得称道。研究团队使用了Wilcoxon符号秩检验这一非参数统计方法来评估结果的显著性,并采用Holm-Bonferroni方法进行多重比较校正,确保统计结论的可靠性。此外,他们还进行了基于排列的符号翻转检验,通过10000次迭代来验证整体效果的统计显著性。

这项研究的临床意义不容小觑。传统的脑机接口系统需要每个患者进行数小时的个性化训练,这在实际应用中往往不现实。而新方法仅需5分钟的数据收集,就能实现可靠的语音检测功能,这大大降低了技术应用的门槛。特别是跨任务能力的实现,意味着一个基于语音产生训练的系统也能理解患者的听觉感知状态,这为开发更全面的语言康复系统提供了可能。

研究也存在一些局限性。当前的系统仅能进行语音检测,还无法识别具体的语音内容或语义信息。此外,预训练和微调使用了不同的语言(英语和西班牙语),虽然证明了方法的跨语言适用性,但也可能限制了迁移效果的充分发挥。研究团队还指出,预训练数据来自单一个体,未来需要探索多个体预训练是否能进一步改善泛化能力。

从更广阔的科学视角来看,这项研究为神经科学提供了新的证据,证明了语音感知和语音产生在神经层面确实存在共享的表征机制。这支持了当代语音处理的"双流模型"理论,该理论认为大脑中存在腹侧感知通路和背侧感觉运动通路,它们相互协作完成语音处理任务。

技术实现方面,研究团队还公开了所有代码、预处理脚本和模型配置,确保研究的可重现性。这种开放科学的做法不仅有助于同行验证结果,也为后续研究提供了宝贵的技术基础。

说到底,这项研究代表了脑机接口技术从实验室走向实际应用的重要一步。通过证明大规模预训练模型可以用极少的个体数据实现有效的语音解码,研究团队为开发实用的语言康复系统铺平了道路。虽然目前的技术还处于语音检测阶段,但其展现的跨任务泛化能力和数据效率优势,预示着未来在词汇识别、语义理解等更高级任务上的巨大潜力。

这种技术突破不仅为失语症患者带来了希望,也为神经科学研究开辟了新的方向。通过更深入地理解大脑处理语言的机制,我们有望开发出更加智能、高效的脑机接口系统,最终帮助更多需要语言康复的患者重新获得与世界沟通的能力。

Q&A

Q1:脑磁图技术是如何记录大脑语音活动的?

A:脑磁图技术就像给大脑装上了极其敏感的"信号探测器",能够实时捕捉神经元放电时产生的微弱磁场变化。研究使用306个传感器组成的探测阵列,以每秒250次的频率记录大脑信号,确保不遗漏任何细微的活动模式。当大脑处理语音信息时,相关神经元会产生特定的放电模式,这些模式在磁场中留下独特的"指纹",AI系统通过学习这些指纹来识别语音活动状态。

Q2:为什么用5分钟数据就能训练出有效的语音识别系统?

A:关键在于"迁移学习"策略,就像教一个已经熟练掌握钢琴的人学吉他一样。研究团队首先用50小时的大脑信号数据训练了一个"预训练"模型,让它深度学习人类大脑处理语音的基本规律。然后将这个经验丰富的"大脑信号翻译员"应用到新参与者身上,只需5分钟的个性化调整就能适应新的大脑信号特征。这种方法避免了从零开始训练的低效率问题。

Q3:跨任务解码能力意味着什么实际应用前景?

A:跨任务解码能力证明了大脑在处理语音感知和语音产生时存在共同的神经基础。这意味着一个基于语音产生训练的脑机接口系统也能理解患者的听觉感知状态,为开发更全面的语言康复系统提供了可能。对于失语症患者来说,医生可以通过监测他们的听觉理解能力来评估康复进展,同时系统也能帮助患者重新学习语音表达,实现"听说并重"的综合治疗效果。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
村里最后饿死的那个人,只有九岁

村里最后饿死的那个人,只有九岁

霹雳炮
2026-02-22 20:24:41
第94分钟绝杀!西蒙尼狂欢,1亿巨星立大功:终结14轮进球荒

第94分钟绝杀!西蒙尼狂欢,1亿巨星立大功:终结14轮进球荒

足球狗说
2026-03-01 05:58:12
两性关系:男人要明白,女人无论多大年龄,都有这样一个需求

两性关系:男人要明白,女人无论多大年龄,都有这样一个需求

伊人河畔
2026-02-28 15:09:25
三次鹰眼,两次罚分!王曼昱VS张本,还是VS裁判?

三次鹰眼,两次罚分!王曼昱VS张本,还是VS裁判?

曹老师评球
2026-02-28 13:32:20
钱枫近照曝光,肥头大耳认不出,天天兄弟物是人非:还好退圈了

钱枫近照曝光,肥头大耳认不出,天天兄弟物是人非:还好退圈了

娱说瑜悦
2026-02-27 17:37:41
旦增,被双开!他理想信仰崩塌,求神拜佛搞迷信活动,顶风违纪,收受巨额财物,半年前主动投案

旦增,被双开!他理想信仰崩塌,求神拜佛搞迷信活动,顶风违纪,收受巨额财物,半年前主动投案

每日经济新闻
2025-10-09 15:44:18
女明星不红了只能接商演,听说一小时仅5万元,真是太可怜了!

女明星不红了只能接商演,听说一小时仅5万元,真是太可怜了!

老吴教育课堂
2026-02-28 11:30:11
世界上最烧钱的十项运动,没钱你真玩不起!

世界上最烧钱的十项运动,没钱你真玩不起!

马拉松跑步健身
2026-02-28 11:37:18
做人要聪明,不管亲戚有啥事,只要没有通知你,就一律装作不知道

做人要聪明,不管亲戚有啥事,只要没有通知你,就一律装作不知道

木言观
2025-12-12 19:58:59
外媒:伊朗革命卫队在波斯湾沿岸举行军事演习

外媒:伊朗革命卫队在波斯湾沿岸举行军事演习

参考消息
2026-02-25 16:13:04
德国那位军事专家说得够直白:美国不是怕中国,是怕打了也白打

德国那位军事专家说得够直白:美国不是怕中国,是怕打了也白打

扶苏聊历史
2026-01-28 18:04:09
一年流出视频294部的小宝到底探过多少朵花?

一年流出视频294部的小宝到底探过多少朵花?

挪威森林
2026-01-25 17:18:42
杭州男子失恋游湖南,遇苗族婚宴随礼1000入席,离场却被伴娘拦下

杭州男子失恋游湖南,遇苗族婚宴随礼1000入席,离场却被伴娘拦下

兰姐说故事
2025-06-09 10:00:07
墙倒众人推!无缘冠军的孙颖莎到底输在哪?邓亚萍的话一针见血

墙倒众人推!无缘冠军的孙颖莎到底输在哪?邓亚萍的话一针见血

丁丁鲤史纪
2025-11-17 15:58:28
同事借我的迈巴赫去相亲,归还时清洗还送了两瓶茅台,2天后我傻眼

同事借我的迈巴赫去相亲,归还时清洗还送了两瓶茅台,2天后我傻眼

夜阑故事集
2026-02-28 15:45:03
龙洋眼往上瞟,不是看提词器,也不是针打多了,而是一个“硬伤”

龙洋眼往上瞟,不是看提词器,也不是针打多了,而是一个“硬伤”

她时尚丫
2026-02-17 22:41:30
美以联手袭击,黄金、美元、A股将迎来怎样的变化?

美以联手袭击,黄金、美元、A股将迎来怎样的变化?

文曲塘财经研究
2026-02-28 20:03:29
俄罗斯是最受中国人喜欢的国家?

俄罗斯是最受中国人喜欢的国家?

玖奌杂货铺
2026-02-28 21:00:06
访华前夕摊牌?美国取消中国贸易待遇,背后全是这一国家的算计

访华前夕摊牌?美国取消中国贸易待遇,背后全是这一国家的算计

奇思妙想生活家
2026-03-01 00:25:56
中国最著名“叛国者”去世:逃亡99.9%概率死,0.1%奇迹改写一生

中国最著名“叛国者”去世:逃亡99.9%概率死,0.1%奇迹改写一生

近史谈
2026-02-28 21:29:29
2026-03-01 06:20:49
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7389文章数 553关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

以官员称哈梅内伊身亡 遗体在其官邸废墟中被找到

头条要闻

以官员称哈梅内伊身亡 遗体在其官邸废墟中被找到

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

周杰伦儿子正面照曝光,与父亲好像

财经要闻

冲突爆发 市场变天?

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

房产
手机
教育
健康
公开课

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

手机要闻

澎湃OS再次公布进展通报:10个问题,仅修复一则!

教育要闻

又看了一遍…觉得这册子真的太牛了…

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版