网易首页 > 网易号 > 正文 申请入驻

清华团队研发脑启发AI模型,为感知信息处理提供全新范例

0
分享至

人类天生具有分离各种音频信号的能力,比如区分不同的说话者的声音、或将声音与背景噪音区分开来。这种天生的能力被称为“鸡尾酒会效应”。

中枢听觉系统通过分析声音流中的模式的统计结构(例如频谱或包络),可以轻松地在混合的声音中识别特定的目标声音。

在 AI 领域,设计与人类一样强大的语音分离系统长期以来一直是一个重要目标。

先前的神经科学研究提示:人类大脑经常利用视觉信息来帮助听觉系统解决 “鸡尾酒会问题”。

受到这一发现的启发,视觉信息被纳入进来以改善语音分离质量,由此产生的方法被称为多模态语音分离方法。

如果系统能够捕捉到唇部运动,这一额外线索将有助于语音处理,因为它在嘈杂环境中补充了语音信号的信息丢失。

然而,现有的多模态语音分离方法的分离能力仍远远不及人类大脑。

基于此, 清华大学生物医学工程学院苑克鑫 教授团队打造了一款脑启发 AI 模型(CTCNet,cortico-thalamo-cortical neural network)。


图 | 苑克鑫(来源:苑克鑫)

该模型的语音分离性能大幅领先于现有方法,不仅为计算机感知信息处理提供了新的脑启发范例,而且在智能助手、自动驾驶等领域有潜力发挥重要作用。

苑克鑫表示:“CTCNet 是在皮层-丘脑-皮层环路和 A-FRCNN 基础上的结果。”

近些年,苑克鑫课题组针对高级听觉丘脑及其皮层联接的架构和生理学特性进行了系统性研究。

在此基础上,结合 清华大学计算机系胡晓林 教授课题组之前的语音分离应用算法,他们提出了一种多模态语音分离方案。

然后,使用公开数据集进行了一系列的语音分离测试和调参,最终才得到了具有优异语音分离性能的 CTCNet。


(来源:TPAMI)

因此,本次研究是在机制研究的基础上引发的应用研究。

“总体而言,这是一个双向奔赴的合作过程。 作为一名 AI 研究者,也许可以通过阅读脑科学领域的文献来获得灵感,但与脑科学研究者的直接沟通一定是最为高效。” 苑克鑫 说。

他继续表示,在没有相应知识的情况下,AI 研究者通过阅读文献来理解大脑的工作原理是有一定困难的。

而作为脑科学研究者,应该有将研究成果向 AI 领域转化的意识和意向,主动与 AI 领域的研究者接触、讨论,这样才有可能碰撞出火花。

事实上,AI 研究者在没有脑科学知识的情况下,已经在试图模拟大脑的部分功能,只不过脑科学研究者并不知道。

通过接触和了解,脑科学研究者就有机会将其研究成果迁移至 AI 研究者已经开展的脑功能模拟的尝试中,从而助力于开展真正有效的脑启发 AI 研究。

苑克鑫表示:“通过本次研究,我深切体会到了神经科学与 AI 领域的研究人员之间加强交流,对于有效开展脑启发 AI 相关工作的重要性。”


图 | 胡晓林(来源:百度百科)

据了解,苑克鑫与胡晓林都同时是清华大学与大脑研究相关的三个中心的兼职研究员,因此经常有机会互相听对方的工作报告,这成为了他们发起合作的契机。

另外,由于神经科学与 AI 是两个截然不同的学科,合作的成功离不开双方团队成员的密切交流。

虽然在交流过程中经常出现词同意不同的情况,甚至出现互相听不懂对方在说什么的情况,但是双方都有足够的耐心去理解对方措辞的内涵,这成为了最终合作成功的重要保障。

最终,相关论文以《由皮层-丘脑-皮层环路启发的视听语音分离模型》(An Audio-Visual Speech Separation Model Inspired by Cortico-Thalamo-Cortical Circuits)为题发在 Transactions on Pattern Analysis and Machine Intelligence(TPAMI)[1]。

胡晓林团队的硕士生李凯是第一作者,苑克鑫团队的博士后谢凤华、以及胡晓林团队的博士生陈航分别是第二作者和第三作者,苑克鑫和胡晓林担任共同通讯作者。


图 | 相关论文(来源:TPAMI)

下一步:

首先,他们将解析在单丘脑神经元水平上视、听觉信息的空间和时间整合模式,希望能够借助于该模式实现对 AI 模型的升级,进一步提高模型的语音分离性能,使其能够应对更加复杂的自然场景;

其次,他们将探索该模型在其他应用场景,如探索在噪音背景下的医学信号检测中的应用潜力;

最后,他们将解析在中枢感觉系统中处于更低层级脑区,如中脑中的多模态神经元的解剖、功能联接架构,进而探索这些联接架构启发 AI 模型构建的潜力。

预计拟构建的一系列 AI 模型,将能逆向揭示不同多模态感觉核团、及其中的神经元,在中枢感觉信息处理中可能扮演的重要角色和工作机制。

参考资料:

1.K. Li, F. Xie, H. Chen, K. Yuan and X. Hu, "An Audio-Visual Speech Separation Model Inspired by Cortico-Thalamo-Cortical Circuits" in IEEE Transactions on Pattern Analysis & Machine Intelligence, vol. , no. 01, pp. 1-15, 5555.

运营/排版:何晨龙


01/ 科学家打造文生视频大模型,含四个高效变种可更好处理时空维度,将Transformers与扩散模型完美结合

02/ 科学家用二氧化碳合成多碳醇,已完成8000小时稳定性评价,助力缓解过度依赖化石资源

03/ 科学家制备梯度石墨烯气凝胶,实现高浓度盐水持续淡化,并构建太阳能脱盐灌溉系统

04/ AlphaFold3来了!无需输入任何结构信息,生物分子预测精度高出50%

05/ 科学家研发高熵合金纳米颗粒,尺寸在3.5纳米左右,能模拟太阳光条件下的二氧化碳还原


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
哈尔科夫持续遭空袭,泽连斯基访问西班牙求援:需要7套“爱国者”

哈尔科夫持续遭空袭,泽连斯基访问西班牙求援:需要7套“爱国者”

凤凰卫视
2024-05-28 16:41:06
楼市大放松!彻底不装了!

楼市大放松!彻底不装了!

樱桃大房子
2024-05-28 22:05:59
“口中有口,点点大”,东部战区给“熊孩子”出字谜,岛内关注并解答

“口中有口,点点大”,东部战区给“熊孩子”出字谜,岛内关注并解答

环球网资讯
2024-05-27 16:56:07
庆余年2:凶手不是五竹!是庆帝引来的神庙人,五竹利用苦荷反杀

庆余年2:凶手不是五竹!是庆帝引来的神庙人,五竹利用苦荷反杀

凉子聊剧
2024-05-28 15:00:23
长期服用倍他乐克,现在基本上撑不过1分钟,还要不要继续吃?

长期服用倍他乐克,现在基本上撑不过1分钟,还要不要继续吃?

神经外科杜医生
2023-05-22 11:55:41
说谁呢?克洛普:我可不能像有的队,花8000万买球员又把他租出去

说谁呢?克洛普:我可不能像有的队,花8000万买球员又把他租出去

直播吧
2024-05-29 09:30:15
一干部接受纪律审查和监察调查

一干部接受纪律审查和监察调查

锡望
2024-05-29 09:16:47
8个「看似不错,实则伤身」的家居物件,我劝你远离!

8个「看似不错,实则伤身」的家居物件,我劝你远离!

新住家居
2024-05-26 18:53:48
志愿军10万人被围困,毛主席急电16字妙计,彭德怀大赞:确实高明

志愿军10万人被围困,毛主席急电16字妙计,彭德怀大赞:确实高明

猫眼观史
2024-05-16 17:21:31
普京:俄方已准备好就乌克兰问题继续谈判

普京:俄方已准备好就乌克兰问题继续谈判

财联社
2024-05-28 22:30:07
那些深藏不露的老师有多牛?出了校门,你连跟他说话的资格都没有

那些深藏不露的老师有多牛?出了校门,你连跟他说话的资格都没有

呼呼历史论
2024-05-28 21:27:24
津巴布韦呼吁国际社会提供粮食援助

津巴布韦呼吁国际社会提供粮食援助

新京报
2024-05-28 14:18:09
不续费就无法永久关闭?奥迪回应车机弹窗问题

不续费就无法永久关闭?奥迪回应车机弹窗问题

观察者网
2024-05-27 13:56:07
喝茶对心脏到底是好是坏?医生苦劝:4种茶,一口都不要喝

喝茶对心脏到底是好是坏?医生苦劝:4种茶,一口都不要喝

宋若讲故事
2023-01-18 21:38:26
CBA,张镇麟接受采访,谈与广东队徐杰之间的关系

CBA,张镇麟接受采访,谈与广东队徐杰之间的关系

体育哲人
2024-05-28 09:47:28
他曾称:我的部队是主力中的主力,被拟任副总长,谈完话没动静了

他曾称:我的部队是主力中的主力,被拟任副总长,谈完话没动静了

青年的背包
2024-05-29 02:35:51
各取所需!6换2交易方案出炉:勇士卖维金斯+两首轮 马卡携手库里

各取所需!6换2交易方案出炉:勇士卖维金斯+两首轮 马卡携手库里

锅子篮球
2024-05-28 23:18:41
比亚迪第五代 DM 技术发布,拥有 2.9L 全球最低百公里亏电油耗

比亚迪第五代 DM 技术发布,拥有 2.9L 全球最低百公里亏电油耗

IT之家
2024-05-28 20:21:11
西部决G4开打,半场打得难解难分,东契奇和华子对飙,太刺激

西部决G4开打,半场打得难解难分,东契奇和华子对飙,太刺激

篮球国度
2024-05-29 09:54:38
哈佛耗时75年研究发现:长大后有出息的孩子,往往都会有4大特征

哈佛耗时75年研究发现:长大后有出息的孩子,往往都会有4大特征

第一心理
2023-09-05 16:22:36
2024-05-29 10:48:49
DeepTech深科技
DeepTech深科技
麻省理工科技评论独家合作
13865文章数 511753关注度
往期回顾 全部

科技要闻

比亚迪重磅发布:最高续航2500KM

头条要闻

官方披露歼-20可"轻易达到超音速巡航" 引发外媒关注

头条要闻

官方披露歼-20可"轻易达到超音速巡航" 引发外媒关注

体育要闻

阿根廷一代神锋,击碎了沙特的金元足球梦

娱乐要闻

张若昀怎么剧外比剧内更惨兮兮…

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

新哈弗H6苦练内功 向燃油车绝缘智能SAY NO

态度原创

教育
游戏
本地
旅游
公开课

教育要闻

华师大附中自主招生,条件复杂,这道题你有思路吗?

黑人女主多人射击游戏或为3A游戏:索尼招聘现端倪

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

旅游要闻

希尔顿一会员退房时被罚3000元,理由令人震惊

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版