网易首页 > 网易号 > 正文 申请入驻

首个生物合理性语言模型诞生!MIT博后用神经架构实现类人学习

0
分享至

诺奖得主、美国科学家理查德·阿克塞尔(Richard Axel)曾表示,当前人们依旧不清楚神经活动转化为思维和行动的背后逻辑。他认为,洞察这一逻辑是神经科学未来最重要的发展方向。

语言、推理和规划等认知现象是神经元和突触活动的直接产物,但是目前尚无一个可以统领全局的理论来解释这一过程的实现机制。阿克塞尔使用“逻辑”一词似乎是在表示人们应当从日益增长的神经科学知识中,找出足以支撑大脑功能实现的基本元素。

近日,美国哥伦比亚大学博士毕业生、目前在美国麻省理工学院从事博士后研究的丹尼尔·米特罗波尔斯基(Daniel Mitropolsky)打造了一款名为 NEMO 的极简大脑神经模型。其表示,这是首个具有生物合理性的语言学习系统。该系统能通过接触少量与现实情境相关联的句子,在不限语言的前提下习得自然语言的基本要素,包括词汇、基础句法及语义知识。

同时,本次系统可被扩展至多语言处理:只需新增一个功能区域,就能为用户所掌握的语言配置专属处理组件。研究人员相信这套语言习得系统之所以具有生物学合理性,不仅是因为其严格地遵循着 NEMO 框架,更是因为它的白板式大脑架构所包括的功能分区和连接纤维,完全可能通过哺乳动物的发育过程来实现自然形成。

NEMO:基于神经科学的六个原则打造而来

据介绍,NEMO 基于神经科学中六个基础且无争议的原则构建了一个简单数学表述,它们分别是:兴奋性神经元、大脑区域、随机突触连接、每个区域内的局部抑制、赫布可塑性和区域间抑制。NEMO 模型能以极高的效率进行模拟,其模拟规模可达数千万个神经元和数万亿个突触。

研究人员通过实验发现 NEMO 符合阿克塞尔所说的那种抽象理论,并且能够完成自然语言习得的这一动物大脑最为明显的功能之一。与此同时,数学证明以及相关模拟也都证明,该模型能够通过神经集合的形成与操控来执行基本计算,并能完成多种认知类任务比如解析自然语言句子等任务。然而,NEMO 能够这样运行前提是:语言中的词汇已经由神经集群进行了表征,并且其突触连接已经编码了各个单词的语法角色。

如前所述,研究人员通过实验证明一个处于白板状态的 NEMO 系统能以一种类似于人类语言习得的方式来学习一门语言的词汇、句法和语义。具体而言,其通过接触那些有着具体依据的语言学会了以下四种本领:第一,学会了具体名词和动词的语义表征;第二,学会了基本的句法特征,例如每个词的词性;第三,学会了多种语气之下的语言词序;第四,学会了生成新句子。

当然,语言习得的内涵远不止于此。完整的语言习得描述必须涵盖以下方面:

  • 学会语音与音素习得(比如发音方式、音位对比);
  • 学会词性分类(能够掌握除了名词、动词外的其他词类,比如形容词、副词和介词等);
  • 功能词(比如冠词“the”、连词“and”等);
  • 抽象词汇(比如“love”“freedom”等表示情感或概念的词汇);
  • 句法结构(能够掌握超越基础词序的复杂句型,比如从句和倒装句等)。

在婴儿的大脑中,上述学习都会以微妙的方式交织在一起。然而,鉴于本次研究的目标是在严格控制的实验中,验证 NEMO 系统是否具备基础的语言习得能力,因此他们将重点放在完成统计学习任务上,并分为两个阶段进行:首先让其学习词义与词性,然后让其学习词序规则并产生句子生成能力。

而在语音和语音学方面,研究人员通过采用“输入 - 输出约定”来绕过了如下阶段:即向系统呈现一个句子时,系统会将其转化为与词语符号对应的刺激序列,而生成句子时也是如此。

实验中,系统会接触到有依据的、由自然语言呈现的、与具体情境相关联的完整句子。“有依据”的意思是,每个句子在呈现时,与该句子相对应的表征在感觉皮层和运动皮层中都处于激活状态。也就是说,当输入句子“狗在跑”时,研究人员假设运动前皮层中与“跑”相关的镜像细胞以及下颞叶视觉皮层中通用的狗的表征都处于激活状态。

此前有研究表明,在之前另外一种符合生物学现实的大脑模型中,名词、动词及其含义可以通过有实际依据的呈现方式来习得。然而,那项研究仅仅涉及到学习孤立单词这种比较简单的任务,并没有涉及到句法和上下文。众所周知,非人类灵长类动物也可以达到这种语言水平。而在本次研究之中,研究人员攻克了一个更加具有挑战性的难题——即通过接触有依据的完整句子,让系统能够习得词汇语义、动名词语法区分以及词序规则。

需要说明的是,这一能力目前仍然是人类所独有的认知特征。因此,研究人员认为他们构建出了首个在生物学上具有合理性、且能进行基本语言习得的人工模型。倘若未来人们能在非人类动物身上发现此类语言能力,那么研究人员相信这一发现将从根本上改变当前关于语言排他性的普遍观点。

语言的生物学基础是什么?

除了回应前文提及的阿克塞尔所说的“逻辑”之外,本次研究还涉及到另一个长期存在的根本性问题:即语言的生物学基础是什么?

具体而言,语言是否是人类在基因、分子或神经层面所拥有的独特特征的产物?事实上,这些特征包括科学家于此前发现的、一度被称为“语言基因”FOXP2 基因,以及科学家最近在人类第 2-3 层神经元中发现的新型树突电位,这些发现引发了人们对于人类语言能力生物学根源的猜测。而本次研究所提出的生物合理性语言习得系统,可被视为是另一种替代性零假设的实证:即基于简单且广受认可的神经科学要素与原理,语言系统完全能在哺乳动物大脑的基础上构建而来。

研究人员指出,他们所提出的特定神经架构和算法,可被视为是一个关于人类语言系统的全面的、且符合神经生物学可行性的假设,而在这一领域此前鲜有如此具体的模型。研究人员表示,本次模型所涉及的脑区(包括其数量、功能及突触连接方式),与现有神经解剖学和心理语言学的证据及观点是互相兼容的,并在已经具备学界共识的领域体现了这种一致性。与此同时,此次提出的人工语言系统能够预测这些脑区在语言理解与生成过程中的激活模式,因此这一特性或将为神经语言学研究提供重要参考。

相比目前已经得到广泛使用且具备语言能力的另一类计算系统——大模型,本次系统有一个重要区别:即具备生物学上的合理性。尤其是它并不依赖反向传播这一当前机器学习领域中最为关键的机制,而且这种机制此前在动物大脑中从未被观察到。

助力人类语言系统的进一步研究

当然,本次系统并未涵盖语言的所有方面,比如语音和音系的学习被加以略过,形容词、副词以及功能范畴也未被纳入考量。研究人员认为,通过针对现有系统进行简单扩展,便可涵盖许多未被涉及的方面。

研究人员表示,抽象词汇是下一步研究的关键目标,这需要建立相应的表征框架,并引入新的语义处理脑区。目前,已有许多关于人类大脑如何处理抽象词汇的认知语言学理论,这些理论可被用于指导这一领域的新研究。语言能力的其他复杂方面比如歧义消解、语法性判断、隐喻理解及下一词预测等,都是极具研究价值的进阶挑战。尽管其中部分任务可能需要针对 NEMO 模型进行一些符合生物机理的扩展,但是研究人员坚信这些挑战均能在现有框架之下得到解决。

未来,研究人员的更多探索目标包括:掌握语言的社会化使用,探索语言与社会认知要素的交互机制,预计这些研究需要建立新型的表征系统与处理机制。此外,研究人员认为很有必要探索 NEMO 模型与大模型之间的交互,这有助于 NEMO 模型在这些更具挑战性的方向上发展。除了语言能力外,各类推理形式比如逻辑推理、启发式推理、范畴推理、概率推理等,都将成为 NEMO 体系面临的重要进阶挑战。

尽管未来存在诸多研究方向,且依然存在一些局限性,但是研究人员此次提出的基于 NEMO 的基础语言习得人工系统是同类系统中的第一个,除了能够起到概念验证的价值之外,该系统或许还能为神经语言学研究提供帮助。由于其设计原理能在很大程度上反映当前神经语言学的思想,因此通过生成可验证的预测和部署更高级的版本,或将有助于指导对于人类语言系统的进一步研究。

参考资料:

https://arxiv.org/pdf/2507.11788

https://www.engineering.columbia.edu/faculty-staff/directory/christos-papadimitriou

https://dmitropolsky.github.io/

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有其母必有其女!张柏芝母亲风流不输女儿,55岁全裸拍三级片

有其母必有其女!张柏芝母亲风流不输女儿,55岁全裸拍三级片

橙星文娱
2026-03-29 00:22:53
巴基斯坦战略专家:这三场战争已表明,中国才是世界最强超级大国

巴基斯坦战略专家:这三场战争已表明,中国才是世界最强超级大国

甜美蜜桃派
2026-05-07 18:35:53
张本智和再度豪言夺冠!日媒力挺:马龙樊振东隐退中国队实力大减

张本智和再度豪言夺冠!日媒力挺:马龙樊振东隐退中国队实力大减

颜小白的篮球梦
2026-05-10 08:32:23
人老了确实没太大意思,我妈今年72岁,独自在家每天就做这两件事

人老了确实没太大意思,我妈今年72岁,独自在家每天就做这两件事

心理观察局
2026-05-04 11:19:11
潘江:比赛主要输在篮板球上,对刘传兴的使用是赛前讨论过的

潘江:比赛主要输在篮板球上,对刘传兴的使用是赛前讨论过的

懂球帝
2026-05-10 22:57:35
从确诊到去世只15天,“央视最帅主持人”的遭遇给所有人提了个醒

从确诊到去世只15天,“央视最帅主持人”的遭遇给所有人提了个醒

娱小余
2026-05-10 23:40:39
特朗普懵了!最后一条路,也被堵死了!

特朗普懵了!最后一条路,也被堵死了!

大嘴说天下
2026-05-09 20:24:37
某地“日前”出现一例汉坦病毒致死病例

某地“日前”出现一例汉坦病毒致死病例

一个生物狗的科普小园
2026-05-10 08:51:13
预计11日1时至8时,济南历下区、市中区、槐荫区、天桥区、历城区、南山区和起步区将有雷阵雨,局部10级以上阵风!

预计11日1时至8时,济南历下区、市中区、槐荫区、天桥区、历城区、南山区和起步区将有雷阵雨,局部10级以上阵风!

鲁中晨报
2026-05-10 17:54:04
德媒主编访华归来:深圳街头看到的一幕,让我为欧洲捏了一把冷汗

德媒主编访华归来:深圳街头看到的一幕,让我为欧洲捏了一把冷汗

補懂事的孩紙
2026-05-10 15:27:34
“爱必享”糖果中检出“伟哥”?上海市监局回应

“爱必享”糖果中检出“伟哥”?上海市监局回应

闪电新闻
2026-05-09 13:01:47
5月10日俄乌:俄罗斯又耍无赖了

5月10日俄乌:俄罗斯又耍无赖了

山河路口
2026-05-10 20:11:00
不得不承认,俄罗斯已经走到了退无可退的悬崖边上!

不得不承认,俄罗斯已经走到了退无可退的悬崖边上!

阿七说史
2026-05-10 05:10:06
大伯出狱全家没人接,我开车去接他,他偷偷塞我一张卡说有1200万

大伯出狱全家没人接,我开车去接他,他偷偷塞我一张卡说有1200万

千秋文化
2026-05-09 20:08:48
一觉醒来,成了全球首富的老婆?和贝索斯太太撞名,22岁妹子被骂懵了...

一觉醒来,成了全球首富的老婆?和贝索斯太太撞名,22岁妹子被骂懵了...

英国那些事儿
2026-05-10 23:20:09
惯子如杀子!孩子这几种表现说明已经被惯坏了,再不改就来不及了

惯子如杀子!孩子这几种表现说明已经被惯坏了,再不改就来不及了

木言观
2026-04-29 22:28:49
全亚洲穿比基尼最好看的女人,身材到底有多迷人?

全亚洲穿比基尼最好看的女人,身材到底有多迷人?

书画艺术收藏
2026-04-03 19:30:09
奚梦瑶独自在香港逛街!手捂肚子表情好痛苦,小腹隆起引三胎猜疑

奚梦瑶独自在香港逛街!手捂肚子表情好痛苦,小腹隆起引三胎猜疑

漫婷侃娱乐
2026-05-07 22:25:01
值得警惕!万万没想到,伊朗真正的内鬼,根本不是人

值得警惕!万万没想到,伊朗真正的内鬼,根本不是人

华史谈
2026-05-10 09:19:37
阿斯:利物浦致电皇马,询问哈维-阿隆索接班斯洛特

阿斯:利物浦致电皇马,询问哈维-阿隆索接班斯洛特

懂球帝
2026-05-10 20:05:06
2026-05-11 01:16:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16683文章数 514939关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

游戏
亲子
旅游
数码
手机

LPL第二赛段:拒绝让一追二!JDG三局战胜AL,挺进前三

亲子要闻

大动脉上长出活胚胎!深圳医生接诊致命妊娠

旅游要闻

重庆新增一夜景打卡点!磁器口步行街看大学生“脑洞”建筑

数码要闻

你昂贵的DDR5内存可能是假货:穿着三星的马甲 心里却是SK海力士

手机要闻

OPPO Reno16系列参数全曝光,就差价格了

无障碍浏览 进入关怀版