网易首页 > 网易号 > 正文 申请入驻

巴斯克大学首次实现大脑"听说"功能跨任务识别

0
分享至

来源:市场资讯

(来源:科技行者)


这项由巴斯克大学HiTZ中心与巴斯克认知、大脑与语言中心联合开展的突破性研究,发表于2026年的arXiv预印本平台(论文编号arXiv:2602.18253v1),标志着脑机接口领域的一个重要里程碑。有兴趣深入了解的读者可以通过该编号查询完整论文。

脑机接口技术一直被认为是连接人脑与计算机的桥梁,特别是在帮助失语症患者恢复语言能力方面具有巨大潜力。然而,传统方法面临着一个根本性挑战:需要为每个患者收集数小时甚至数十小时的大脑信号训练数据,这在临床实践中几乎不可能实现。患者往往无法承受如此长时间的数据收集过程,而医疗资源也难以支撑这样的需求。

研究团队巧妙地将这个问题转化为一个"知识迁移"的挑战,就像教一个已经熟练掌握钢琴演奏的人学习吉他一样。他们首先用一名志愿者的50小时大脑信号数据训练了一个基于Conformer架构的人工智能模型,这个模型专门用于识别大脑中的语音活动模式。这个过程类似于让AI系统深度学习人类大脑处理语音信息的基本规律。

接下来,研究团队将这个"预训练"的模型应用到18名新参与者身上,每人仅需要5分钟的大脑信号数据进行个性化调整。更令人惊喜的是,这个系统不仅能够识别人们听到语音时的大脑活动,还能识别人们说话时的大脑信号,实现了真正的"跨任务"解码能力。

这项研究采用了脑磁图技术来记录大脑活动。脑磁图就像是给大脑装上了一个极其敏感的"信号探测器",能够实时捕捉神经元放电时产生的微弱磁场变化。研究团队使用了306个传感器组成的探测阵列,以每秒250次的频率记录大脑信号,确保不遗漏任何细微的活动模式。

在预训练阶段,研究人员让一名英语母语的志愿者听了50多个小时的有声读物,主要是《夏洛克·福尔摩斯》系列故事。在这个过程中,AI系统学会了识别大脑中"有声音"和"安静"状态的区别。这个基础模型就像一个经验丰富的"大脑信号翻译员",掌握了人类处理语音信息的基本模式。

随后的测试阶段更加有趣。18名西班牙语母语的参与者分别完成了三项不同的任务:聆听预先录制的语音、回放自己的声音录音,以及大声朗读文字。每项任务仅持续约5分钟,产生的大脑信号数据量相当有限。然而,经过预训练的AI系统在这些新数据上进行快速调整后,展现出了令人印象深刻的识别能力。

实验结果显示了迁移学习的显著优势。在识别听力任务方面,使用迁移学习的模型准确率提升了3.7%,达到79.0%,F1分数提高了2.6%,AUC分数更是大幅提升了7.3%。这些改进听起来可能不太起眼,但在脑机接口领域,每一个百分点的提升都意味着巨大的技术进步。特别值得注意的是,即使预训练模型完全基于听力数据,它在语音产生任务上同样表现出了改进,准确率、F1分数和AUC分数分别提高了0.7%、0.7%和1.1%。

更加引人注目的是跨任务解码能力的实现。研究团队发现,在一个任务上训练的模型能够成功解码另一个完全不同的任务。比如,一个专门学习识别"听到语音"时大脑信号的模型,竟然能够识别"说话"时的大脑活动,准确率达到65.0%到73.4%之间。这个发现证实了一个重要的科学假设:人类大脑在处理语音感知和语音产生时,存在共同的神经基础。

跨任务迁移的效果呈现出有趣的方向性特征。感知任务之间的迁移相对容易,听力任务和回放任务之间可以很好地相互迁移,准确率都在72%以上。然而,从语音产生任务向感知任务的迁移稍显困难,准确率降到65-66%左右。这种不对称性实际上符合神经科学的基本原理:语音产生不仅涉及听觉处理,还需要运动规划、感觉反馈等额外的神经机制,而感知任务则相对简单。

当结合迁移学习技术后,跨任务解码能力得到了进一步提升。听力与回放任务间的迁移效果最为显著,准确率提升了6.1%和6.3%。更重要的是,涉及语音产生的跨任务组合也获得了3-5%的改进。这些提升在统计学上都达到了显著性水平,证明了方法的可靠性。

研究团队还深入分析了个体差异对迁移学习效果的影响。结果显示,18名参与者中的大多数都从迁移学习中受益,但效果存在一定的个体差异。在感知任务中,15名参与者表现出改进,而在语音产生任务中,16名参与者获得了提升。这种变异性提示我们,未来的脑机接口系统可能需要考虑个体化调整策略。

从技术角度来看,这项研究采用了多项创新性的方法改进。研究团队引入了"滚动增强"技术,通过对训练数据进行时间维度的循环移位来增加数据多样性,类似于通过不同角度观察同一个物体来增强理解。同时,他们还使用了"软标签"技术,不再简单地将每个时间窗口标记为"语音"或"静音",而是根据该窗口中语音所占的比例给出更细致的标记。

实验设计的严谨性也值得称道。研究团队使用了Wilcoxon符号秩检验这一非参数统计方法来评估结果的显著性,并采用Holm-Bonferroni方法进行多重比较校正,确保统计结论的可靠性。此外,他们还进行了基于排列的符号翻转检验,通过10000次迭代来验证整体效果的统计显著性。

这项研究的临床意义不容小觑。传统的脑机接口系统需要每个患者进行数小时的个性化训练,这在实际应用中往往不现实。而新方法仅需5分钟的数据收集,就能实现可靠的语音检测功能,这大大降低了技术应用的门槛。特别是跨任务能力的实现,意味着一个基于语音产生训练的系统也能理解患者的听觉感知状态,这为开发更全面的语言康复系统提供了可能。

研究也存在一些局限性。当前的系统仅能进行语音检测,还无法识别具体的语音内容或语义信息。此外,预训练和微调使用了不同的语言(英语和西班牙语),虽然证明了方法的跨语言适用性,但也可能限制了迁移效果的充分发挥。研究团队还指出,预训练数据来自单一个体,未来需要探索多个体预训练是否能进一步改善泛化能力。

从更广阔的科学视角来看,这项研究为神经科学提供了新的证据,证明了语音感知和语音产生在神经层面确实存在共享的表征机制。这支持了当代语音处理的"双流模型"理论,该理论认为大脑中存在腹侧感知通路和背侧感觉运动通路,它们相互协作完成语音处理任务。

技术实现方面,研究团队还公开了所有代码、预处理脚本和模型配置,确保研究的可重现性。这种开放科学的做法不仅有助于同行验证结果,也为后续研究提供了宝贵的技术基础。

说到底,这项研究代表了脑机接口技术从实验室走向实际应用的重要一步。通过证明大规模预训练模型可以用极少的个体数据实现有效的语音解码,研究团队为开发实用的语言康复系统铺平了道路。虽然目前的技术还处于语音检测阶段,但其展现的跨任务泛化能力和数据效率优势,预示着未来在词汇识别、语义理解等更高级任务上的巨大潜力。

这种技术突破不仅为失语症患者带来了希望,也为神经科学研究开辟了新的方向。通过更深入地理解大脑处理语言的机制,我们有望开发出更加智能、高效的脑机接口系统,最终帮助更多需要语言康复的患者重新获得与世界沟通的能力。

Q&A

Q1:脑磁图技术是如何记录大脑语音活动的?

A:脑磁图技术就像给大脑装上了极其敏感的"信号探测器",能够实时捕捉神经元放电时产生的微弱磁场变化。研究使用306个传感器组成的探测阵列,以每秒250次的频率记录大脑信号,确保不遗漏任何细微的活动模式。当大脑处理语音信息时,相关神经元会产生特定的放电模式,这些模式在磁场中留下独特的"指纹",AI系统通过学习这些指纹来识别语音活动状态。

Q2:为什么用5分钟数据就能训练出有效的语音识别系统?

A:关键在于"迁移学习"策略,就像教一个已经熟练掌握钢琴的人学吉他一样。研究团队首先用50小时的大脑信号数据训练了一个"预训练"模型,让它深度学习人类大脑处理语音的基本规律。然后将这个经验丰富的"大脑信号翻译员"应用到新参与者身上,只需5分钟的个性化调整就能适应新的大脑信号特征。这种方法避免了从零开始训练的低效率问题。

Q3:跨任务解码能力意味着什么实际应用前景?

A:跨任务解码能力证明了大脑在处理语音感知和语音产生时存在共同的神经基础。这意味着一个基于语音产生训练的脑机接口系统也能理解患者的听觉感知状态,为开发更全面的语言康复系统提供了可能。对于失语症患者来说,医生可以通过监测他们的听觉理解能力来评估康复进展,同时系统也能帮助患者重新学习语音表达,实现"听说并重"的综合治疗效果。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大满贯不和谐一幕:王曼昱2-4孙颖莎 比输球可怕是观众一边倒支持

大满贯不和谐一幕:王曼昱2-4孙颖莎 比输球可怕是观众一边倒支持

侃球熊弟
2026-03-01 20:27:26
英国宣布参与对伊朗军事行动 战机已升空

英国宣布参与对伊朗军事行动 战机已升空

桂系007
2026-02-28 23:56:12
伊朗建议民众离开德黑兰

伊朗建议民众离开德黑兰

财联社
2026-02-28 21:58:42
0-1到2-1!曼联踢疯了,升至英超第三!卡圣,上任7战6胜1平不败

0-1到2-1!曼联踢疯了,升至英超第三!卡圣,上任7战6胜1平不败

体育世界
2026-03-01 23:59:06
队长传射!7.2亿豪门2-1逆转 7轮6胜+11轮不败 赛季首次跻身前三

队长传射!7.2亿豪门2-1逆转 7轮6胜+11轮不败 赛季首次跻身前三

狍子歪解体坛
2026-03-01 23:58:16
中方呼吁美以立即停止对伊军事行动

中方呼吁美以立即停止对伊军事行动

看看新闻Knews
2026-03-01 12:31:25
消息人士称哈梅内伊正掌控战局

消息人士称哈梅内伊正掌控战局

财联社
2026-03-01 05:07:17
32万彩礼不让碰后续:彩礼已花完,女方全村社死,自曝另有隐情

32万彩礼不让碰后续:彩礼已花完,女方全村社死,自曝另有隐情

离离言几许
2026-02-28 18:06:09
铁卫90分钟破僵局,莱奥自我救赎!AC米兰2-0升班马,下轮战国米

铁卫90分钟破僵局,莱奥自我救赎!AC米兰2-0升班马,下轮战国米

钉钉陌上花开
2026-03-01 21:26:15
上海浦东机场多架航班返航!中国旅客:我已经哭过了,感到后怕;中东机场改签排队数百米,国内三大航可免费退改签

上海浦东机场多架航班返航!中国旅客:我已经哭过了,感到后怕;中东机场改签排队数百米,国内三大航可免费退改签

大象新闻
2026-03-01 14:45:10
中国军号:对于那一天我们不期待,但绝不惧怕!

中国军号:对于那一天我们不期待,但绝不惧怕!

潇湘晨报
2026-03-01 15:18:15
交了物业费还收车位管理费?2026年这4种情况,你可以直接拒交

交了物业费还收车位管理费?2026年这4种情况,你可以直接拒交

阿离家居
2026-03-01 16:53:47
全线拉升!刚刚,超10万人爆仓!伊朗总统,最新发声!伊朗股市按下“暂停键”

全线拉升!刚刚,超10万人爆仓!伊朗总统,最新发声!伊朗股市按下“暂停键”

每日经济新闻
2026-03-01 19:40:50
B费9分钟传射!迎两大里程碑,职业生涯造400球,百次助攻先生

B费9分钟传射!迎两大里程碑,职业生涯造400球,百次助攻先生

奥拜尔
2026-03-02 00:04:08
哈梅内伊和亲属开会时遇袭身亡!伊朗内鬼和现场照片曝光

哈梅内伊和亲属开会时遇袭身亡!伊朗内鬼和现场照片曝光

项鹏飞
2026-03-01 20:35:46
第1现场|直击以色列:警报不断,惊恐民众抱孩子冲向避难所

第1现场|直击以色列:警报不断,惊恐民众抱孩子冲向避难所

澎湃新闻
2026-02-28 22:14:29
哈梅内伊被精准斩首,为何伊朗人民载歌载舞?

哈梅内伊被精准斩首,为何伊朗人民载歌载舞?

历史总在押韵
2026-03-01 11:59:19
云淡风轻!网传特朗普指挥袭击伊朗前几分钟,还在家中参加派对

云淡风轻!网传特朗普指挥袭击伊朗前几分钟,还在家中参加派对

小萝卜丝
2026-03-01 13:10:35
挪动一米就锁死?国产五轴破局“电子手铐”,让美日高傲变成废铁

挪动一米就锁死?国产五轴破局“电子手铐”,让美日高傲变成废铁

通鉴史智
2026-02-02 16:14:26
哈梅内伊将就美以袭击发表讲话

哈梅内伊将就美以袭击发表讲话

财联社
2026-02-28 23:05:07
2026-03-02 00:15:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2303112文章数 5624关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

媒体:美以能精准"斩首"背后 摩萨德的"手笔"令人咋舌

头条要闻

媒体:美以能精准"斩首"背后 摩萨德的"手笔"令人咋舌

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

黄景瑜 李雪健坐镇!38集犯罪大剧来袭

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

健康
游戏
亲子
手机
公开课

转头就晕的耳石症,能开车上班吗?

《宝可梦》新游热销登顶!模拟建造休闲风

亲子要闻

保护孩子宝妈必学,什么是无记忆创伤?

手机要闻

小米11全系正式退役!安全更新停更,这些机型该换了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版