网易首页 > 网易号 > 正文 申请入驻

AI 为什么不会规划?Yann LeCun团队:问题出在「时间是弯的」

0
分享至


来源:机器之心

在人工智能的发展历程中,有一位科学家几乎贯穿了整个深度学习时代 —— 他就是 Yann LeCun。

许多人第一次接触神经网络,往往就是通过他在上世纪提出的手写数字识别系统LeNet。这一早期的卷积神经网络模型不仅成功应用于银行支票识别,也为后来席卷全球的深度学习浪潮奠定了重要基础。

与如今大量研究者将目光投向生成式 AI 不同,LeCun 近年来一直在强调另一条更长期的研究路线:构建能够理解世界并进行规划的 「世界模型」(World Model)。

在他看来,当前模型虽然在文本与图像生成上表现惊艳,但仍然缺乏一种关键能力 ——现实世界进行建模,并预测未来可能发生的变化。

围绕这一愿景,来自 Meta 与 New York University 等机构的研究者(其中也包括 LeCun 团队的成员)最近发布了一篇新论文,尝试解决世界模型中的一个基础问题:如果我们希望 AI 在潜在空间中进行规划,那么这种表示空间应该具备怎样的结构?


  • 论文标题:Temporal Straightening for Latent Planning

  • 论文链接:https://arxiv.org/pdf/2603.12231

视觉特征的「曲率陷阱」

这项研究的核心灵感源自神经科学中的一个著名假设 ——感知直道化(Perceptual Straightening)。人类视觉系统在处理自然视频流时,倾向于将复杂的视觉输入转化为在大脑皮层中轨迹更平直的表征,从而预测物体的运动。

研究指出,虽然预训练编码器能够学习到丰富的语义表示,但其在潜在空间中形成的时间轨迹通常具有较高的曲率,这使得基于该表示进行规划变得更加困难。

这种高曲率带来了两个致命问题:

  • 距离失效:在复杂的潜空间中,简单的欧几里得距离无法准确反映到达目标状态的真实难度(测地距离)。

  • 规划不稳定:基于梯度的规划算法在弯曲的景观中极易陷入局部最优,导致智能体在任务中「原地打转」或逻辑断层。


预训练视觉编码器所编码的潜在轨迹通常高度弯曲(DINO),这增加了预测和规划的难度。本文引入了一个几何约束,在此空间中可行的轨迹更加平直(Ours)。

时间直道化

为了解决这一问题,研究团队引入了一个几何约束 ——曲率正则化器(Curvature Regularizer)

传统的潜空间规划通常学习一个编码器 和一个预测器 。但在复杂的动态环境中,相邻状态在潜空间中的轨迹往往是剧烈弯曲的。

为了实现「拉直」,研究团队提出了基于曲率(Curvature 的约束。在潜空间中,定义连续三个时间步的表征为 。

1. 曲率的数学定义

直道化的核心是要求潜空间中的运动轨迹尽可能接近匀速直线运动。公式上,这体现为相邻两个时间步的「位移向量」应该尽可能一致:

如果轨迹是完全笔直且匀速的,那么这两个向量应该相等。

2. 曲率损失函数

论文引入了以下损失函数来惩罚轨迹的弯曲程度:

或者使用单位向量的夹角余弦值来衡量方向的一致性:

这个正则项会强制编码器 将原始视觉输入映射到一个平滑的空间中,使得状态转移在该空间内表现为线性演化。


训练与规划示意图。在训练过程中,一方面最小化预测嵌入 与目标分支中带有停止梯度的目标 之间的预测损失,另一方面最小化嵌入的局部曲率。在规划过程中,我们使用训练好的预测器进行时域 的展开推演,并在嵌入空间中选择能够最小化预测最终状态与目标之间成本的最优动作。

通过这种方式,模型共同学习了一个更「平滑」的编码器和一个更「直觉」的预测器。这种「拉直」操作产生了两个神奇的效应:

  • 欧几里得距离 = 测地距离:在拉直后的空间里,两个点之间的直线距离就能精准代表从 A 态转移到 B 态的成本。

  • 改善目标条件调节:规划目标对路径的引导变得更加线性且稳定。


直道化前后的潜空间轨迹对比。 上方的 PushT 示例展示了一个旋转动作,下方的 UMaze 示例展示了智能体从左上角移动到右上角的过程,其中星号表示目标。直道化产生了更少弯曲且更平滑的轨迹,并使欧几里得距离能够更真实地反映通往目标的测地线进展(即实际步数)。

实验结果:攻克「传送门」迷宫

为了验证这一理论,研究团队设计了一个极具挑战性的实验环境:Teleport-PointMaze(带传送门的点迷宫)。

在这个迷宫中,当智能体触碰右侧墙壁时会瞬间「传送」到左侧,这种瞬时的位置跳跃对传统的预训练编码器(如 DINOv2)是巨大的灾难。


不同编码器的潜在曲率与开环 GD 成功率对比。余弦相似度越高表示曲率越低。此处比较了具有空间特征的模型,并报告了平均逐块余弦相似度。在编码器类型相同的情况下,曲率的降低通常会导致成功率的提升。

研究通过计算潜空间中任意点与目标点(Target)之间的 均方误差(MSE),生成了距离热力图。


PointMaze 的距离热力图(蓝色表示小值,红色表示大值)。黄色五角星代表目标位置,计算其嵌入与迷宫中所有其他状态嵌入之间的欧氏距离。图 b 和图 c 使用了经过平直化正则化训练的 ResNet,其输出特征 。经过平直化处理后,潜在距离能够准确反映到达目标所需的最小步数。


  • DINOv2 (a):其热力图呈现出支离破碎的斑块,完全无法反映迷宫的物理拓扑结构,规划算法在此空间内几乎是「盲目搜索」。

  • 无直道化的投影器 (c):虽然经过了任务微调,但热力图依然显示出严重的扭曲,无法正确识别传送门的连接性。

  • 时间直道化(b):神奇的事情发生了 —— 热力图显示出的梯度非常平滑,且完美契合了地标真值(d)。这意味着在直道化后的空间里,简单的欧氏距离就能精准指导智能体穿过传送门。

世界模型研究的新线索

随着世界模型研究不断发展,越来越多学者开始关注:什么样的表示才真正适合规划?

这篇论文给出了一个简单但有启发性的答案:在一个好的 latent space 中,时间轨迹应该尽可能是直线。

这种设计不仅可以提高规划效率,还可能影响未来许多研究方向,例如机器人控制、视频世界模型、自动驾驶……

或许正如 Yann LeCun 所强调的那样:真正的智能,离不开一个能够理解并预测世界的模型。

而让「时间变直」,可能正是通往这一目标的重要一步。

阅读最新前沿科技趋势报告,请访问21世纪关键技术研究院的“未来知识库”


未来知识库是 “21世纪关键技术研究院”建 立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告

(加入未来知识库,全部资料免费阅读和下载)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄方人员在伊朗布什尔核电站进行最后一轮轮换:108人离开,仅剩20人留守

俄方人员在伊朗布什尔核电站进行最后一轮轮换:108人离开,仅剩20人留守

潇湘晨报
2026-04-13 21:41:11
信德员工曝何超蕸感情生活:有一位相伴多年的伴侣,有3位密友!

信德员工曝何超蕸感情生活:有一位相伴多年的伴侣,有3位密友!

童叔不飙车
2026-04-14 00:33:37
小鹏新车定档4月15日,全球首发3000TOPS算力+纯电750km!

小鹏新车定档4月15日,全球首发3000TOPS算力+纯电750km!

阿芒娱乐说
2026-04-13 16:39:02
41岁詹姆斯霸榜28.6亿播放,湖人却把他逼成孤胆英雄

41岁詹姆斯霸榜28.6亿播放,湖人却把他逼成孤胆英雄

热血体育社
2026-04-14 08:29:27
油箱见底了!常规赛打完,这7名球星大概率退役!5人曾是全明星

油箱见底了!常规赛打完,这7名球星大概率退役!5人曾是全明星

毒舌NBA
2026-04-13 20:07:23
你在无意中发现别人什么秘密?网友爆料,电视剧都不敢这样演

你在无意中发现别人什么秘密?网友爆料,电视剧都不敢这样演

夜深爱杂谈
2026-03-16 22:21:03
A股:刚刚,大消息传来,股民做好准备,周二将迎来大级别的转变

A股:刚刚,大消息传来,股民做好准备,周二将迎来大级别的转变

云鹏叙事
2026-04-14 00:00:09
单程决死突击!伊朗飞行员壮烈牺牲,炸翻美司令部,换掉3架美机

单程决死突击!伊朗飞行员壮烈牺牲,炸翻美司令部,换掉3架美机

荷兰豆爱健康
2026-04-12 18:19:03
保密期限终到期,中央首长透露:毛岸英真相,可以向外界公开了

保密期限终到期,中央首长透露:毛岸英真相,可以向外界公开了

历史点行
2026-03-29 13:38:28
惨烈英超?第6距第14仅6分!欧冠资格最新形势 曼联领先切尔西7分

惨烈英超?第6距第14仅6分!欧冠资格最新形势 曼联领先切尔西7分

我爱英超
2026-04-14 07:26:06
曾志伟追债20多年终获胜!讨回5700万,还债人居然是她,令人意外

曾志伟追债20多年终获胜!讨回5700万,还债人居然是她,令人意外

一盅情怀
2026-04-11 17:12:15
伊朗要求巴林、沙特阿拉伯等五个中东国家赔偿战争损失

伊朗要求巴林、沙特阿拉伯等五个中东国家赔偿战争损失

新京报
2026-04-14 07:15:15
莫言:告诉你一个基本不会得罪人的方法,那就是当别人找你帮忙时,你一定要痛痛快快地拒绝,犹犹豫豫地同意

莫言:告诉你一个基本不会得罪人的方法,那就是当别人找你帮忙时,你一定要痛痛快快地拒绝,犹犹豫豫地同意

每日一首古诗词
2026-04-09 06:06:47
勒温:利马拽我头发被罚下场?规则又不是我制定的,我不记仇

勒温:利马拽我头发被罚下场?规则又不是我制定的,我不记仇

懂球帝
2026-04-14 05:27:14
中方已做最坏准备,一旦中美爆发战争,中国三大底牌一个比一个狠

中方已做最坏准备,一旦中美爆发战争,中国三大底牌一个比一个狠

凡知
2026-04-14 00:49:47
印度首富小儿媳:弃帅模前男友,嫁300斤阿南特,如今成家族门面

印度首富小儿媳:弃帅模前男友,嫁300斤阿南特,如今成家族门面

照见古今
2026-04-12 19:32:51
陪玩陪睡仅冰山一角,继迪丽热巴事件后,圈内人再揭内娱阴暗面

陪玩陪睡仅冰山一角,继迪丽热巴事件后,圈内人再揭内娱阴暗面

叨唠
2026-04-14 01:19:42
布兰妮自愿进康复中心,前夫2年前就喊"警钟已响"

布兰妮自愿进康复中心,前夫2年前就喊"警钟已响"

影视情报室
2026-04-14 08:10:06
被嘲笑了4年的俄罗斯突然发现,美军只打了1个月,就比它还拉胯

被嘲笑了4年的俄罗斯突然发现,美军只打了1个月,就比它还拉胯

南宗历史
2026-04-13 09:01:23
前妻晒绿底离婚证!综艺清华男神彻底塌房,被曝出轨还卷走300万

前妻晒绿底离婚证!综艺清华男神彻底塌房,被曝出轨还卷走300万

艺能八卦局
2026-04-13 04:31:47
2026-04-14 08:44:49
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4660文章数 37449关注度
往期回顾 全部

科技要闻

OpenAI四页内部信曝光:痛批Anthropic

头条要闻

牛弹琴:特朗普发了一张图 让全世界都雷得外焦里嫩

头条要闻

牛弹琴:特朗普发了一张图 让全世界都雷得外焦里嫩

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

初代“跑男团”合体,邓超、鹿晗缺席

财经要闻

伊朗要求五个中东国家赔偿战争损失

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

房产
教育
手机
游戏
公开课

房产要闻

6000亿投资盛宴,全球巨头齐聚,海南又要干件大事!

教育要闻

教育的目的到底应该是什么?

手机要闻

苹果或以材料科技攻克折叠屏“折痕顽疾”

微软曾想为初代Xbox设计PC主机混合系统

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版