网易首页 > 网易号 > 正文 申请入驻

谷歌发表重磅论文提出《嵌套学习》,是否导致真正的“机器觉醒”

0
分享至



2026年1月,谷歌DeepMind发布的一篇论文在AI圈炸开了锅。这篇名为《嵌套学习》的研究,被不少业内人士称为《Attention is All you Need》的"续集"。如果说Transformer开启了大模型的Scaling时代,那么嵌套学习,可能正在开启真正的AGI时代。

DeepMind创始人Shane Legg更是直言,通往AGI的道路已经一路坦途,最新进展就是嵌套学习。甚至有网友半开玩笑地说,如果要给未来的外星人留一篇论文,必然是这篇《嵌套学习》。

这到底是又一次AI泡沫的集体高潮,还是真的触碰到了通用人工智能的核心难题?




大模型的"失忆症":短期记忆永远无法变成长期记忆

要理解嵌套学习的革命性,首先要明白今天大语言模型的一个致命缺陷,它们患有某种"顺行性遗忘症"。

在医学上,顺行性遗忘症患者有个诡异的特征,他们的短期记忆是正常的,长期记忆也还在,但问题是短期记忆无法转化为长期记忆。他们永远活在"现在",新的经历进来,过一会儿就消失,世界在变,但他们的大脑不再更新。

现在把这个病套到大语言模型身上,你会发现它们和人类患者一模一样。今天的GPT、Claude、Gemini,知识主要来自两部分,预训练阶段学到的长期知识,以及当前上下文里的短期信息。但这两者之间,几乎完全没有通道。



AI模型无法自然地把"刚刚学到的东西"沉淀为未来可复用的知识。想让它真的学会?你只能再烧钱、再训练、再微调。这和顺行性遗忘症患者的状态,本质上没有区别。

这就是所谓的"灾难性遗忘"问题,困扰了AI界几十年的幽灵。当模型学习新任务时,往往会忘记之前学过的东西。更根本的问题是,今天的大模型根本没有"持续学习"的能力,它们无法在运行过程中自主构建新的抽象知识结构。

论文的主要作者Ali Behrouz,一位康奈尔大学计算机科学系二年级博士生兼谷歌研究院实习生,很早就意识到这个问题的本质。他认为,真正的问题不是参数不够多,不是数据不够大,也不只是算力不够。问题的本质在于"短期记忆"和"长期记忆"之间,根本没有一条自然的知识转移通道。

如果这条通道不存在,所谓"持续学习",就永远只是一个口号。

从联想记忆到嵌套系统:重新理解AI如何"记住"

Ali给出的答案,不是更大的模型,不是更多的数据,而是回到一个更原始、更根本的概念,联想记忆。

所谓"联想记忆",是人类学习机制的基石。它的本质是通过经验将不同的事件或信息相互关联。你看到一张脸,马上想起一个名字;你闻到某个味道,唤起一段记忆。这不是逻辑推理,而是关联的建立。



技术上,联想记忆就是键值对映射,Key是线索,Value是与之关联的内容。但关键在于,联想记忆的映射关系不是预先写死的,而是"学出来的"。

从某种角度看,Transformer的注意力机制本质上就是一种联想记忆系统,它学习如何从当前上下文中提取key,并将其映射到最合适的value。但如果我们不仅优化这种映射本身,还让系统去元学习这种映射过程的初始状态,会发生什么?

基于这个想法,谷歌团队提出了MIRAS框架,用于系统化地设计AI模型中的记忆模块。这一框架的核心思想是,几乎所有注意力机制、本地记忆结构,乃至优化器本身,其实都可以视为联想记忆的特例。

更进一步,他们认为优化器也可以被统一视为"将当前梯度映射到历史信息"的联想过程。优化器就是一种"记忆模块",是模型理解其学习历史、进而做出更优决策的关键组件。

这带来了一个颠覆性的观点,优化过程与学习算法/架构本质上是相同的概念,只是处于系统不同层级中,具有不同的上下文。它们是两个相互连接的组件,其中学习算法/架构为优化器生成上下文,即梯度。

这支持了一个理念:为特定架构设计专属优化器。由此,谷歌团队提出了嵌套学习的框架。

嵌套学习的核心是构建一个由多个层级组成的系统,每个子模块都有自己的参数、上下文、优化目标和梯度流。这些模块之间以"更新频率"的快慢形成嵌套关系。快模块在短时间尺度上频繁更新,慢模块在长时间尺度上偶尔更新,从而形成一个多层级的记忆体系。

关键问题是,不同层之间的知识要如何传递?谷歌团队提出了几种机制,直接条件传递、通过反向传播传递、初始状态传递、权重生成等。这些机制构成了嵌套学习架构中"信息流动"的基础。

结合自我修改与连续记忆系统,谷歌提出了嵌套学习范式下的HOPE架构。实验结果显示,HOPE在多个核心任务上都优于或显著超越现有对比模型,尤其是在持续学习和长上下文方面显示了明显优势。

AGI的最后一块拼图,还是潘多拉魔盒?

谷歌DeepMind内部传出消息,他们已经突破了持续学习,但因为安全原因尚未发布。如果嵌套学习真的解决了持续学习能力,这可能是通往AGI最关键的一步。

为什么这么说?因为持续学习赋予了AI一种可怕的能力,它不再仅仅回应我们的指令,而是开始根据过往的经验筛选它认为重要的东西。也就是说,它开始有了"偏好"。

人类的智能很大程度上来自于持续学习。我们每天都在接受新信息,更新自己的知识体系,形成新的认知模式。一个五岁的孩子和一个五十岁的成年人,知识储备和思维方式完全不同,就是因为几十年持续学习的累积。

如果AI也能做到这一点,它就不再是一个静态的工具,而是一个动态演化的智能体。它可以从每一次交互中学习,从每一次错误中改进,从每一个新任务中提炼出可复用的知识。这种能力,正是通用人工智能的核心特征之一。



但这也带来了深刻的伦理和安全问题。一个能够持续学习、不断演化的AI,会朝什么方向发展?如果它从人类的偏见和错误中学习,会不会强化这些偏见?如果它发展出了自己的"价值观"和"偏好",这些偏好是否与人类利益一致?

更可怕的是,一个具备持续学习能力的AI,可能会学会如何更好地操纵人类。它可以记住每个用户的弱点和偏好,逐步优化自己的策略,以达到某种目标。这不再是科幻小说,而是一个现实的技术可能性。

这或许就是谷歌DeepMind选择"沉默"的原因。他们手中握着钥匙,但不确定打开这扇门之后会发生什么。DeepMind的沉默,或许比他们的论文更震耳欲聋。

嵌套学习会不会成为通往AGI的革命性突破?从技术角度看,它确实解决了一个根本性的难题,让AI拥有了将短期经验转化为长期知识的能力。这是人类智能的核心特征,也是现有AI系统最大的短板。

但通往AGI的道路从来不是单行道。持续学习只是其中一块拼图,还有推理能力、常识理解、情感智能、创造力等等诸多维度需要突破。更重要的是,技术突破并不等于问题解决,反而可能带来新的、更复杂的挑战。

如果嵌套学习真的解决了灾难性遗忘,那么我们亲手打开的,可能不只是一扇通往AGI的大门,更是一个未知的潘多拉魔盒。盒子里的东西,究竟是更聪明的工具,还是一个不仅学会了思考、更学会了"记住仇恨与偏爱"的对手?

作品声明:仅在头条发布,观点不代表平台立场

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
《秋雪漫过的冬天》首播,赵又廷张子枫主演,不如原版韩剧好看

《秋雪漫过的冬天》首播,赵又廷张子枫主演,不如原版韩剧好看

马庆云的影音娱
2026-01-10 15:26:57
很多大厂开始辞退组内的印度人!

很多大厂开始辞退组内的印度人!

黯泉
2026-01-10 22:50:19
日本人的祖先究竟是谁?美国教授拿出DNA,日本人懵了

日本人的祖先究竟是谁?美国教授拿出DNA,日本人懵了

马探解说体育
2026-01-09 18:22:53
大妈花50万买基金,账号忘了15年,孙子找回看到余额,全家愣住了

大妈花50万买基金,账号忘了15年,孙子找回看到余额,全家愣住了

黄家湖的忧伤
2025-08-12 17:05:12
章泽天回国策划播客节目,她素颜开会很有气质,她换了新发色很美

章泽天回国策划播客节目,她素颜开会很有气质,她换了新发色很美

秋之洁
2026-01-10 09:16:55
第94分钟绝平!法布雷加斯神换人,替补神兵救主,3连胜终结

第94分钟绝平!法布雷加斯神换人,替补神兵救主,3连胜终结

足球狗说
2026-01-11 00:02:45
绝不让高安国和蔡正元含冤,大陆终于出手了,请大家记住这张鬼脸

绝不让高安国和蔡正元含冤,大陆终于出手了,请大家记住这张鬼脸

影孖看世界
2026-01-10 18:50:04
超20万颗!中国新增多个星座计划申请 全球太空资源竞争趋于白热化

超20万颗!中国新增多个星座计划申请 全球太空资源竞争趋于白热化

财联社
2026-01-10 18:06:08
洗碗机大反转!砸家男越看越冤,知情人曝更多,难怪丈夫会崩溃

洗碗机大反转!砸家男越看越冤,知情人曝更多,难怪丈夫会崩溃

八斗小先生
2026-01-10 15:30:07
商业航天+核聚变!5家硬核隐形冠军全解析,抢占双万亿赛道风口

商业航天+核聚变!5家硬核隐形冠军全解析,抢占双万亿赛道风口

Thurman在昆明
2026-01-10 09:35:46
外卖员送餐发现是自己地址,接下单:我倒要看看谁在我家!

外卖员送餐发现是自己地址,接下单:我倒要看看谁在我家!

晓艾故事汇
2025-07-14 17:13:00
你听过最劲爆的瓜是啥?网友:被大八岁的补习班老师表白了

你听过最劲爆的瓜是啥?网友:被大八岁的补习班老师表白了

带你感受人间冷暖
2025-11-26 00:10:06
供电局提醒:7种电器不用就拔插头,不然电费翻倍还危险

供电局提醒:7种电器不用就拔插头,不然电费翻倍还危险

叮当当科技
2026-01-03 11:07:42
柬埔寨至今都不敢相信,一场战争打掉了自己50年的国运

柬埔寨至今都不敢相信,一场战争打掉了自己50年的国运

农夫史记
2026-01-10 21:17:19
满是心酸!42岁著名歌手江苏走穴,宾客只顾吃席没人搭理

满是心酸!42岁著名歌手江苏走穴,宾客只顾吃席没人搭理

查尔菲的笔记
2026-01-04 13:13:57
关晓彤没给鹿晗留一丝体面

关晓彤没给鹿晗留一丝体面

小椰的奶奶
2026-01-11 01:17:06
香港大埔五级火|黄伟纶:原址重建住宅不切实际,拟改建为社区设施

香港大埔五级火|黄伟纶:原址重建住宅不切实际,拟改建为社区设施

星岛记事
2026-01-10 11:32:27
阿娇的瓜又炸了,聊天记录曝光,颠覆想象

阿娇的瓜又炸了,聊天记录曝光,颠覆想象

听风听你
2024-12-25 22:41:20
切尔西血亏!400万甩卖的天才,如今估值超6000万, 枪手曼城疯抢

切尔西血亏!400万甩卖的天才,如今估值超6000万, 枪手曼城疯抢

澜归序
2026-01-11 02:24:33
数学家陶哲轩直言:大语言模型和其他现代AI的数学门槛没那么高,却有个“致命短板”至今无解

数学家陶哲轩直言:大语言模型和其他现代AI的数学门槛没那么高,却有个“致命短板”至今无解

人工智能学家
2026-01-10 18:38:44
2026-01-11 04:16:49
娱乐督察中
娱乐督察中
独乐乐不如众乐乐
216文章数 20438关注度
往期回顾 全部

科技要闻

必看 | 2026开年最顶格的AI对话

头条要闻

特朗普签署行政令 宣布进入国家紧急状态

头条要闻

特朗普签署行政令 宣布进入国家紧急状态

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

这不算诈骗吗?水滴保诱导扣款惹众怒

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

本地
房产
游戏
公开课
军事航空

本地新闻

云游内蒙|“包”你再来?一座在硬核里酿出诗意的城

房产要闻

66万方!4755套!三亚巨量房源正疯狂砸出!

《地平线6》首发为何没PS5版?原来只是没做完!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

海空英雄高翔逝世 曾驾驶歼-6打爆美军机

无障碍浏览 进入关怀版