网易首页 > 网易号 > 正文 申请入驻

首个生物合理性语言模型诞生!MIT博后用神经架构实现类人学习

0
分享至

诺奖得主、美国科学家理查德·阿克塞尔(Richard Axel)曾表示,当前人们依旧不清楚神经活动转化为思维和行动的背后逻辑。他认为,洞察这一逻辑是神经科学未来最重要的发展方向。

语言、推理和规划等认知现象是神经元和突触活动的直接产物,但是目前尚无一个可以统领全局的理论来解释这一过程的实现机制。阿克塞尔使用“逻辑”一词似乎是在表示人们应当从日益增长的神经科学知识中,找出足以支撑大脑功能实现的基本元素。

近日,美国哥伦比亚大学博士毕业生、目前在美国麻省理工学院从事博士后研究的丹尼尔·米特罗波尔斯基(Daniel Mitropolsky)打造了一款名为 NEMO 的极简大脑神经模型。其表示,这是首个具有生物合理性的语言学习系统。该系统能通过接触少量与现实情境相关联的句子,在不限语言的前提下习得自然语言的基本要素,包括词汇、基础句法及语义知识。

同时,本次系统可被扩展至多语言处理:只需新增一个功能区域,就能为用户所掌握的语言配置专属处理组件。研究人员相信这套语言习得系统之所以具有生物学合理性,不仅是因为其严格地遵循着 NEMO 框架,更是因为它的白板式大脑架构所包括的功能分区和连接纤维,完全可能通过哺乳动物的发育过程来实现自然形成。

NEMO:基于神经科学的六个原则打造而来

据介绍,NEMO 基于神经科学中六个基础且无争议的原则构建了一个简单数学表述,它们分别是:兴奋性神经元、大脑区域、随机突触连接、每个区域内的局部抑制、赫布可塑性和区域间抑制。NEMO 模型能以极高的效率进行模拟,其模拟规模可达数千万个神经元和数万亿个突触。

研究人员通过实验发现 NEMO 符合阿克塞尔所说的那种抽象理论,并且能够完成自然语言习得的这一动物大脑最为明显的功能之一。与此同时,数学证明以及相关模拟也都证明,该模型能够通过神经集合的形成与操控来执行基本计算,并能完成多种认知类任务比如解析自然语言句子等任务。然而,NEMO 能够这样运行前提是:语言中的词汇已经由神经集群进行了表征,并且其突触连接已经编码了各个单词的语法角色。

如前所述,研究人员通过实验证明一个处于白板状态的 NEMO 系统能以一种类似于人类语言习得的方式来学习一门语言的词汇、句法和语义。具体而言,其通过接触那些有着具体依据的语言学会了以下四种本领:第一,学会了具体名词和动词的语义表征;第二,学会了基本的句法特征,例如每个词的词性;第三,学会了多种语气之下的语言词序;第四,学会了生成新句子。

当然,语言习得的内涵远不止于此。完整的语言习得描述必须涵盖以下方面:

  • 学会语音与音素习得(比如发音方式、音位对比);
  • 学会词性分类(能够掌握除了名词、动词外的其他词类,比如形容词、副词和介词等);
  • 功能词(比如冠词“the”、连词“and”等);
  • 抽象词汇(比如“love”“freedom”等表示情感或概念的词汇);
  • 句法结构(能够掌握超越基础词序的复杂句型,比如从句和倒装句等)。

在婴儿的大脑中,上述学习都会以微妙的方式交织在一起。然而,鉴于本次研究的目标是在严格控制的实验中,验证 NEMO 系统是否具备基础的语言习得能力,因此他们将重点放在完成统计学习任务上,并分为两个阶段进行:首先让其学习词义与词性,然后让其学习词序规则并产生句子生成能力。

而在语音和语音学方面,研究人员通过采用“输入 - 输出约定”来绕过了如下阶段:即向系统呈现一个句子时,系统会将其转化为与词语符号对应的刺激序列,而生成句子时也是如此。

实验中,系统会接触到有依据的、由自然语言呈现的、与具体情境相关联的完整句子。“有依据”的意思是,每个句子在呈现时,与该句子相对应的表征在感觉皮层和运动皮层中都处于激活状态。也就是说,当输入句子“狗在跑”时,研究人员假设运动前皮层中与“跑”相关的镜像细胞以及下颞叶视觉皮层中通用的狗的表征都处于激活状态。

此前有研究表明,在之前另外一种符合生物学现实的大脑模型中,名词、动词及其含义可以通过有实际依据的呈现方式来习得。然而,那项研究仅仅涉及到学习孤立单词这种比较简单的任务,并没有涉及到句法和上下文。众所周知,非人类灵长类动物也可以达到这种语言水平。而在本次研究之中,研究人员攻克了一个更加具有挑战性的难题——即通过接触有依据的完整句子,让系统能够习得词汇语义、动名词语法区分以及词序规则。

需要说明的是,这一能力目前仍然是人类所独有的认知特征。因此,研究人员认为他们构建出了首个在生物学上具有合理性、且能进行基本语言习得的人工模型。倘若未来人们能在非人类动物身上发现此类语言能力,那么研究人员相信这一发现将从根本上改变当前关于语言排他性的普遍观点。

语言的生物学基础是什么?

除了回应前文提及的阿克塞尔所说的“逻辑”之外,本次研究还涉及到另一个长期存在的根本性问题:即语言的生物学基础是什么?

具体而言,语言是否是人类在基因、分子或神经层面所拥有的独特特征的产物?事实上,这些特征包括科学家于此前发现的、一度被称为“语言基因”FOXP2 基因,以及科学家最近在人类第 2-3 层神经元中发现的新型树突电位,这些发现引发了人们对于人类语言能力生物学根源的猜测。而本次研究所提出的生物合理性语言习得系统,可被视为是另一种替代性零假设的实证:即基于简单且广受认可的神经科学要素与原理,语言系统完全能在哺乳动物大脑的基础上构建而来。

研究人员指出,他们所提出的特定神经架构和算法,可被视为是一个关于人类语言系统的全面的、且符合神经生物学可行性的假设,而在这一领域此前鲜有如此具体的模型。研究人员表示,本次模型所涉及的脑区(包括其数量、功能及突触连接方式),与现有神经解剖学和心理语言学的证据及观点是互相兼容的,并在已经具备学界共识的领域体现了这种一致性。与此同时,此次提出的人工语言系统能够预测这些脑区在语言理解与生成过程中的激活模式,因此这一特性或将为神经语言学研究提供重要参考。

相比目前已经得到广泛使用且具备语言能力的另一类计算系统——大模型,本次系统有一个重要区别:即具备生物学上的合理性。尤其是它并不依赖反向传播这一当前机器学习领域中最为关键的机制,而且这种机制此前在动物大脑中从未被观察到。

助力人类语言系统的进一步研究

当然,本次系统并未涵盖语言的所有方面,比如语音和音系的学习被加以略过,形容词、副词以及功能范畴也未被纳入考量。研究人员认为,通过针对现有系统进行简单扩展,便可涵盖许多未被涉及的方面。

研究人员表示,抽象词汇是下一步研究的关键目标,这需要建立相应的表征框架,并引入新的语义处理脑区。目前,已有许多关于人类大脑如何处理抽象词汇的认知语言学理论,这些理论可被用于指导这一领域的新研究。语言能力的其他复杂方面比如歧义消解、语法性判断、隐喻理解及下一词预测等,都是极具研究价值的进阶挑战。尽管其中部分任务可能需要针对 NEMO 模型进行一些符合生物机理的扩展,但是研究人员坚信这些挑战均能在现有框架之下得到解决。

未来,研究人员的更多探索目标包括:掌握语言的社会化使用,探索语言与社会认知要素的交互机制,预计这些研究需要建立新型的表征系统与处理机制。此外,研究人员认为很有必要探索 NEMO 模型与大模型之间的交互,这有助于 NEMO 模型在这些更具挑战性的方向上发展。除了语言能力外,各类推理形式比如逻辑推理、启发式推理、范畴推理、概率推理等,都将成为 NEMO 体系面临的重要进阶挑战。

尽管未来存在诸多研究方向,且依然存在一些局限性,但是研究人员此次提出的基于 NEMO 的基础语言习得人工系统是同类系统中的第一个,除了能够起到概念验证的价值之外,该系统或许还能为神经语言学研究提供帮助。由于其设计原理能在很大程度上反映当前神经语言学的思想,因此通过生成可验证的预测和部署更高级的版本,或将有助于指导对于人类语言系统的进一步研究。

参考资料:

https://arxiv.org/pdf/2507.11788

https://www.engineering.columbia.edu/faculty-staff/directory/christos-papadimitriou

https://dmitropolsky.github.io/

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
既然给脸不要脸,那就彻底撕破脸!王毅外长已经把话挑明了

既然给脸不要脸,那就彻底撕破脸!王毅外长已经把话挑明了

安安说
2026-02-01 14:01:51
四川再次发布橙色预警!这些地方高度危险

四川再次发布橙色预警!这些地方高度危险

四川省教育厅
2026-03-03 20:50:15
一名中国公民遇难!伊朗海军全灭,空军惨败,导弹部队孤军奋战

一名中国公民遇难!伊朗海军全灭,空军惨败,导弹部队孤军奋战

快看张同学
2026-03-03 14:22:39
英媒爆出猛料:中国或违反联合国规定,运送超高音速导弹给伊朗!

英媒爆出猛料:中国或违反联合国规定,运送超高音速导弹给伊朗!

始于初见见
2026-03-02 19:33:23
终于来了!苹果发布全新 120Hz 高刷新品

终于来了!苹果发布全新 120Hz 高刷新品

XCiOS俱乐部
2026-03-03 22:49:12
伊朗宣示不会与美国谈判,拉里贾尼:他们不可能打了伊朗就一走了之

伊朗宣示不会与美国谈判,拉里贾尼:他们不可能打了伊朗就一走了之

环球网资讯
2026-03-03 07:00:20
山东省纪委监委最新通报:3人被查

山东省纪委监委最新通报:3人被查

齐鲁壹点
2026-03-03 18:05:12
埃及被打醒了,苏35和歼10都不买:就要一种4000万美元中国新军机

埃及被打醒了,苏35和歼10都不买:就要一种4000万美元中国新军机

近史谈
2026-01-17 21:44:06
奉劝所有40到50岁后的中年人,只要不被开除,干到退休就是成功

奉劝所有40到50岁后的中年人,只要不被开除,干到退休就是成功

岁月有情1314
2026-03-03 14:49:44
当春节开始为“喜欢”买单

当春节开始为“喜欢”买单

新周刊
2026-03-02 15:42:40
美国打伊朗到底图什么?八成中国人以为是抢石油……

美国打伊朗到底图什么?八成中国人以为是抢石油……

基本常识
2026-03-02 23:53:16
“特朗普以为靠军事震慑中方,然而…”

“特朗普以为靠军事震慑中方,然而…”

观察者网
2026-03-03 14:22:08
且看北京普通中产家庭年收入,是这个数,出乎你的意料吗?

且看北京普通中产家庭年收入,是这个数,出乎你的意料吗?

慧翔百科
2026-03-03 11:20:57
突然发现一件事:凡是有公务员的家庭,父母都有这个软实力

突然发现一件事:凡是有公务员的家庭,父母都有这个软实力

风流女汉
2026-03-04 02:10:00
刚下飞机行李就没了!杭州姑娘花10多万去南极旅游却崩溃:衣物全靠借

刚下飞机行李就没了!杭州姑娘花10多万去南极旅游却崩溃:衣物全靠借

环球网资讯
2026-03-03 08:53:57
伊朗称击中了美空军基地大楼

伊朗称击中了美空军基地大楼

界面新闻
2026-03-03 12:13:18
阿斯:虽然C罗的私人飞机抵达马德里,但球员本人仍留在沙特

阿斯:虽然C罗的私人飞机抵达马德里,但球员本人仍留在沙特

懂球帝
2026-03-03 21:38:12
可望而不可及,美国人工智能 Claude 不带我们玩,未来怎么办?

可望而不可及,美国人工智能 Claude 不带我们玩,未来怎么办?

喜爱的CAD
2026-03-02 07:00:05
被这张图片惊出一身冷汗!

被这张图片惊出一身冷汗!

中国民航人
2026-03-03 14:34:18
邮轮因中东局势滞留迪拜 船上有约200名中国游客 旅行社称“该想的办法都想了”

邮轮因中东局势滞留迪拜 船上有约200名中国游客 旅行社称“该想的办法都想了”

闪电新闻
2026-03-02 22:20:51
2026-03-04 06:36:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16354文章数 514703关注度
往期回顾 全部

科技要闻

拥抱AI的"牛马":边提效边自嘲"自费"上班

头条要闻

美国突发史无前例撤离令引外界担忧:终极空袭或来临

头条要闻

美国突发史无前例撤离令引外界担忧:终极空袭或来临

体育要闻

35轮后积分-7,他们遭遇史上最早的降级

娱乐要闻

谢娜霸气护夫:喊话薛之谦给张杰道歉

财经要闻

特朗普“不惜一切”!全球股债齐崩

汽车要闻

第一梯队辅助驾驶加持 iCAR V27定档3月13日上市

态度原创

家居
教育
艺术
房产
手机

家居要闻

万物互联 享科技福祉

教育要闻

昊泽老师:像这样的家长,就不要管孩子了

艺术要闻

明朝皇帝怎么过元宵

房产要闻

狂销13亿!近百位三亚顶豪买家,都在All in超级地中海·憘悦?

手机要闻

荣耀Magic V6下周见,开启折叠屏7000mAh时代

无障碍浏览 进入关怀版