网易首页 > 网易号 > 正文 申请入驻

自然·计算科学:当机器拥有“概念”,理解才真正发生

0
分享至


导语

人类大脑的一项非凡能力是能够从感知—运动经验中形成更抽象的概念表征,并在脱离直接感官输入的情况下灵活应用。然而,这种能力背后的计算机制仍未被清晰理解。本文提出了一种双模块神经网络框架——CATS Net,用以弥合这一空白。该模型由概念抽象模块和任务求解模块构成。前者提取低维概念表示,后者在概念的层级门控下完成视觉判断任务。系统基于概念表征形成可迁移的语义结构,并可通过“概念通信”实现跨网络知识传递。模型与大脑的拟合分析表明,其概念空间与人类语义模型及腹侧视觉皮层的表征结构一致。同时,其门控机制对应语义控制网络。该工作提供了一个统一的计算框架,用于理解人类概念认知,并推动类人概念智能系统的发展。

关键词:概念形成(Concept formation)、概念理解(Concept understanding)、层级门控(Hierarchical gating)、语义结构(Semantic structure)、知识迁移(Knowledge transfer)、脑-模型对齐(Model–brain alignment)

周骁俊丨作者

赵思怡丨审校


论文题目:A neural network for modeling human concept formation, understanding and communication 论文链接:https://www.nature.com/articles/s43588-026-00956-4 发表时间:2026年3月24日 论文来源:Nature Computational Science

为什么“概念”是智能的核心问题

在人类认知中,最关键的一步并不是“看到”,而是“理解”。语言学家 Saussure 早已指出,人类能够用符号指代不在场的对象,这种“脱离当下”的能力,使我们可以规划未来、想象过去、进行抽象推理。

从计算角度看,这意味着大脑完成了两件事:一是将高维感知经验压缩为低维概念空间;二是在需要时重新激活这些概念,并将其组合用于任务。前者是概念形成(formation),后者是概念理解(understanding)。

但现有AI体系在这两点上是割裂的。一类模型(如CNN、ViT)擅长表征学习,但知识被“埋”在参数中,难以抽取与迁移;另一类模型(如多模态大模型)依赖已有语言符号,却无法从感知经验中自主形成概念。因此,核心问题不是“如何建模视觉”,而是:能否构建一个系统,同时完成概念的形成、理解与传递?


图 1. A. 概念的核心特征是将高维感知-运动信息压缩成低维表示,并能够没有直接输入的情况下重新激活。B. 概念形成与理解的计算框架:通过低维概念向量压缩经验,并在任务中重新调用以驱动行为。C. CATS Net 的整体架构:概念抽象(CA)模块生成控制信号,对任务求解(TS)模块进行层级调控,实现“概念驱动”的感知判断。

CATS Net:把“概念”从参数中解耦出来

本文提出的CATS Net,本质是一个结构极简但思想关键的设计:用两个模块,将“概念”显式建模出来。概念抽象(CA)模块接收一个低维向量(concept vector),输出控制信号;任务求解(TS)模块处理感知输入,但其计算过程会被概念动态调制。

关键机制是“门控”(gating):概念不是标签,而是直接改变网络内部计算路径的控制变量。这意味着,同一张图像,在不同概念输入下,会激活完全不同的功能。例如,当输入“apple”概念时,网络会判断图像是否属于苹果类别;而输入“vehicle”,同一输入将被重新解释。

从数据中“长出”概念,而不是预定义

模型的训练过程同样体现了这一思想,训练分为两个交替阶段:一阶段学习网络参数;另一阶段学习概念向量。这种分离带来一个关键结果:概念空间本身是可学习的,而不是预设的。


图 2. A. 涌现的 20 维概念空间从训练前的“任意向量空间”,变成了“具有语义结构和功能选择性的概念坐标系”。B. 训练概念空间(蓝色)和任务求解参数空间(紫色)中功能熵的概率密度分布。

实验表明,固定的概念空间(如Word2Vec或one-hot)都会显著降低性能,而可学习的低维空间不仅更高效,还能形成结构化语义。更重要的是,这些概念具有“功能特异性”:每个概念向量对应一类任务功能,而不是简单标签。通过熵分析(functional entropy),作者发现训练后的概念空间明显比随机空间更有结构,表现为低熵、强选择性。这说明:概念不是人为定义的类别,而是从任务中自然涌现的低维结构

概念空间为什么“像人类”

一个关键问题是:模型学到的概念,是否真的具有认知意义?作者通过表征相似性分析(RSA)发现,模型的概念空间与两类人类语义模型显著相关:

  • 基于神经科学的语义维度(Binder65),

  • 基于行为相似性的人类判断(SPOSE49)。

这种一致性说明,即使模型只接受视觉分类训练,它仍然自发形成了类似人类的语义组织结构。 进一步分析发现,这些概念还能聚类出“动物、家具、交通工具”等语义群落,甚至捕捉颜色、形状、共现关系等多维特征。换句话说:语义结构不是语言专属,而是可以从感知任务中涌现。

真正关键的一步:概念可以“沟通”

最有意思的实验,是“概念通信”。作者构建了teacher–student体系:teacher学习全部类别,student刻意缺失一个类别(如apple)。两个网络独立训练后,各自形成不同的概念空间。然后,通过一个“翻译模块”,将teacher的概念映射到student空间。结果是:student可以仅凭传递过来的概念向量,识别从未见过的类别,准确率远高于随机水平。


图 3. 概念通信流程。Phase 1:teacher 与 student 独立学习概念空间(student缺失一类)。Phase 2:通过翻译模块对齐两者概念结构。Phase 3:传递teacher的概念向量,student在未见类别上完成判断任务。

这意味着:知识不再依赖参数复制,而可以通过低维概念进行传递。这与人类语言的本质高度一致——我们用极低维的符号,传递复杂经验。

与真实大脑的对应关系

模型不仅在行为上有效,在神经层面也具有对应性。作者使用fMRI数据发现:概念层(concept layer)与腹侧视觉皮层(VOTC)高度相关,说明其编码类似人类的对象表征;而CA模块则与语义控制网络显著相关,表明其与之对应,负责选择与调制语义信息。 这种分工与认知神经科学理论高度一致:感知系统负责表征,控制系统负责调度。


图 4. 模型与人脑一致性(ROI-level RSA)。左:concept layer 与 VOTC 显著相关。右:CA1 层与 semantic-control network 的相关性强于 multiple-demand network,体现功能特异性。

进一步,多个独立训练的模型会收敛到相似的概念结构,而这些“高一致性模型”与人脑的对应关系更强。这暗示一个重要结论:概念结构可能是由计算约束决定的“最优解”

结语与展望:从AI模型到认知理论的转变

这项工作的真正价值,不在于提出一个更强的模型,而在于改变问题的提法:

  • 从“如何预测”转向“如何形成概念”

  • 从“参数学习”转向“结构学习”

  • 从“单体模型”转向“可沟通的智能体”。

它给出一个统一视角:概念 = 高维经验的压缩表示 + 可调度的计算规则 + 可通信的语义接口。这不仅解释了人类认知的核心机制,也为AI提供了一条新的路径:不是更大的模型,而是更结构化的表示。

神经动力学模型读书会

为了促进神经科学、系统科学以及计算机科学等多领域学术工作者的交流合作,吸引更多朋友共同探索脑科学与类脑研究,周昌松、臧蕴亮、杨冬平、郭大庆、陈育涵、曹淼、刘泉影、王大辉、刘健、王鑫迪等来自国内外多所知名高校的专家学者在集智俱乐部共同发起「 」读书会,历时四个月研讨,近日圆满结束。

本季读书会形成了聚集500+成员的神经动力学社区,积累了40+小时综述、解读、研讨的视频记录,以及多篇社区成员总结的词条、笔记、翻译、科普资料等。现在报名加入读书会,即可加入社区交流讨论(微信),并解锁相关视频、文本资料。我们对脑的探索才刚刚起航,欢迎你一道参与,共同点亮更多脑科学研究的岛屿!

详情请见:

1.

2.

3.

4.

5.

6.

7.

#速递

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
活久见!深大26个专业停止招生,网友:毕业去向落实率2年低于60%

活久见!深大26个专业停止招生,网友:毕业去向落实率2年低于60%

火山詩话
2026-04-24 16:07:45
两只大熊猫将前往亚特兰大,外交部:将为增进中美人民友谊做出新贡献

两只大熊猫将前往亚特兰大,外交部:将为增进中美人民友谊做出新贡献

澎湃新闻
2026-04-24 15:30:30
济南市市中区副区长许胜勇,被查

济南市市中区副区长许胜勇,被查

鲁中晨报
2026-04-24 16:40:06
等不了方文山…周杰伦亲自出手了! 「嘴硬」喊:谁稀罕

等不了方文山…周杰伦亲自出手了! 「嘴硬」喊:谁稀罕

ETtoday星光云
2026-04-24 15:16:08
赖清德无法窜访,郑丽文表态后,蓝营改口,柯文哲做出惊人预言

赖清德无法窜访,郑丽文表态后,蓝营改口,柯文哲做出惊人预言

DS北风
2026-04-23 11:52:05
我空降到家乡担任副省长,参加校友聚会,却被班花的处长丈夫嘲笑

我空降到家乡担任副省长,参加校友聚会,却被班花的处长丈夫嘲笑

红豆讲堂
2025-04-16 10:47:03
大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?

大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?

深度报
2026-04-18 23:37:27
李奇微晚年曾说过,战斗力一流的国家只有三个,其他的都不值一提

李奇微晚年曾说过,战斗力一流的国家只有三个,其他的都不值一提

老范谈史
2026-04-23 17:35:54
血脂高不高,看头就知道!血脂高的人,会有4个表现,看看有没有

血脂高不高,看头就知道!血脂高的人,会有4个表现,看看有没有

DrX说
2026-04-24 15:00:03
格力回应铝线电机争议:相关工程机已停产,海信称靠多三两铜多500元时代已终结

格力回应铝线电机争议:相关工程机已停产,海信称靠多三两铜多500元时代已终结

红星资本局
2026-04-21 20:40:16
上海地铁站内,这个“高素质”习惯爆发冲突!上海已叫停多年!很多人改不过来……

上海地铁站内,这个“高素质”习惯爆发冲突!上海已叫停多年!很多人改不过来……

环球网资讯
2026-04-23 11:11:44
布伦森绝杀失误登全美热搜!迷之操作遭讽 布朗:为他画绝杀战术

布伦森绝杀失误登全美热搜!迷之操作遭讽 布朗:为他画绝杀战术

颜小白的篮球梦
2026-04-24 10:53:39
五常中唯一不造航母的国家,实力不输中国,美国十分忌惮

五常中唯一不造航母的国家,实力不输中国,美国十分忌惮

蜉蝣说
2026-04-24 11:31:15
奥黛丽赫本人生最后30年:在瑞士小镇一座带花园的漂亮房子里度过

奥黛丽赫本人生最后30年:在瑞士小镇一座带花园的漂亮房子里度过

毒舌小红帽
2026-04-17 18:24:06
美军正制定新计划,若谈判破裂即打击霍尔木兹海峡或伊朗内部的“阻挠者”

美军正制定新计划,若谈判破裂即打击霍尔木兹海峡或伊朗内部的“阻挠者”

澎湃新闻
2026-04-24 12:24:28
厦门一乘客酒后打车,支付了77276元车费,司机懵了,追着乘客退钱:不是自己的钱,一分也不能要

厦门一乘客酒后打车,支付了77276元车费,司机懵了,追着乘客退钱:不是自己的钱,一分也不能要

环球网资讯
2026-04-24 17:23:08
情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

新欧洲
2026-04-21 19:37:05
DeepSeek V4震撼发布!实现全球开源领先

DeepSeek V4震撼发布!实现全球开源领先

新智元
2026-04-24 12:11:03
中美联合国激烈交锋,美逼中国买单,中方拒绝接受,对美反将一军

中美联合国激烈交锋,美逼中国买单,中方拒绝接受,对美反将一军

南宗历史
2026-04-23 15:52:11
2:1!约基奇被打成玩具!狂输44正负值!!

2:1!约基奇被打成玩具!狂输44正负值!!

柚子说球
2026-04-24 13:18:57
2026-04-24 18:15:00
集智俱乐部 incentive-icons
集智俱乐部
科普人工智能相关知识技能
5786文章数 4670关注度
往期回顾 全部

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

头条要闻

媒体:伊朗将恢复往返中国航班 霍尔木兹决战或收兵了

头条要闻

媒体:伊朗将恢复往返中国航班 霍尔木兹决战或收兵了

体育要闻

里程碑之战拖后腿,哈登18分8失误

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

19家企业要"铝代铜",格力偏不

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

本地
家居
手机
数码
公开课

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

家居要闻

自然肌理 温润美学

手机要闻

Nothing OS 4.1发布,看看更新了啥?

数码要闻

一英寸口袋云台相机!大疆Osmo Pocket 4图赏

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版