
![]()
多年来,人工智能行业一直遵循着一条简单而残酷的规则:越大越好。我们用海量数据集训练模型,增加参数数量,并投入强大的计算能力来解决问题。这种方法在大多数情况下都行之有效。从 GPT-3 到 GPT-4,从粗糙的聊天机器人到推理引擎,“规模定律”表明,只要我们不断地向机器输入更多的文本,它最终就会变得智能。
但我们现在遇到了瓶颈。互联网资源有限。高质量的公共数据正在枯竭,而仅仅扩大模型规模所带来的收益正在递减。顶尖的人工智能研究人员认为,人工智能的下一个重大飞跃并非仅仅来自阅读更多文本,而是来自理解文本背后的现实。这一观点标志着人工智能研究方向的根本性转变,开启了世界模型时代。
01
下一个标记预测的局限性
要理解为什么我们需要一种新的方法,我们首先必须了解当前的人工智能系统究竟在做什么。尽管它们功能强大,但像 ChatGPT 或 Claude 这样的模型本质上仍然是统计引擎。它们根据前面出现的词语的概率来预测序列中的下一个词。它们并不理解“玻璃掉在地上会破碎”这句话的含义;它们只是知道在数百万个故事中,“破碎”这个词经常出现在“玻璃掉在地上”之后。
这种方法被称为自回归建模,它存在一个关键缺陷。它完全依赖于相关性,而非因果关系。如果你用一千条车祸描述来训练一个线性线性模型(LLM),它能学习到事故的语言,但它永远无法学习动量、摩擦力或脆弱性等物理原理。它只是一个旁观者,而非参与者。
这种限制正演变成“数据墙”。我们几乎已经抓取了整个公共互联网。如果想用现有方法进一步扩展,我们需要的数据量将呈指数级增长。合成数据(例如人工智能生成的文本)可以暂时解决这个问题,但它往往会导致“模型崩溃”,即系统放大自身的偏差和错误。我们无法仅凭文本实现通用人工智能(AGI)的扩展,因为文本是对世界的低带宽压缩。它描述了现实,但它本身并非现实。
02
为什么世界模式很重要
像 Yann LeCun 这样的AI领军人物长期以来一直认为,当前的 AI 系统缺乏人类认知的一个基本方面,而这种认知甚至连幼儿都天生具备。这种能力就是我们维持一个关于世界如何运作的内部模型,他们通常称之为“世界模型”。世界模型不仅仅是预测下一个词;它构建了一幅关于物理环境如何运作的内部心理地图。当我们看到一个球滚到沙发后面时,我们知道它仍然在那里。我们知道,除非有人阻止它,否则它会出现在沙发的另一边。我们不需要阅读教科书就能理解这一点;我们基于我们内部的物理和物体恒存的“世界模型”进行心理模拟。
人工智能要想取得进步,就必须从统计模仿转向这种内部模拟。它需要理解事件的根本原因,而不仅仅是事件的文字描述。
联合嵌入预测架构(JEPA)正是这种范式转变的典型例证。与试图预测每个像素或单词的层级模型(LLM,这一过程计算量巨大且噪声较大)不同,JEPA 预测的是抽象表示。它忽略了诸如树叶运动等不可预测的细节,而专注于诸如树木、风和季节等高层概念。通过学习预测这些高层状态随时间的变化,人工智能能够学习到世界的整体结构,而非表面细节。
03
从预测到模拟
我们已在视频生成模型中看到了这种转变的初步迹象。OpenAI 发布 Sora 时,他们不仅将其描述为一个视频工具,而且还将其描述为一个“世界模拟器”。
这种区别至关重要。普通的视频生成器可能通过预测哪些颜色的像素通常会相邻排列来生成人物行走的视频。然而,世界模拟器则力求在一段时间内保持三维结构的一致性、光照效果和物体的持久性。它“理解”即使人物走到墙后,也不应该消失。
尽管当前的视频模型远非完美,但它们代表了新的训练场。物理世界包含的信息量远超文本世界。一秒钟的视频就包含数百万个关于物理、光线和交互的视觉数据点。通过基于这种视觉现实训练模型,我们可以教会人工智能目前逻辑逻辑模型所缺乏的“常识”。
这将形成新的扩展规律。衡量成功的标准不再是模型读取了多少万亿个代币,而是其模拟的精确度和预测未来环境状态的能力。能够准确模拟行动后果而无需实际执行该行动的人工智能,才能安全地进行规划、推理和行动。
04
效率与通用人工智能之路
这种转变也解决了当前人工智能能源成本过高的问题。逻辑逻辑模型(LLM)效率低下,因为它们必须预测每一个细节才能生成连贯的输出。世界模型效率更高,因为它具有选择性。正如人类驾驶员专注于路面而忽略天空中的云朵图案一样,世界模型专注于任务的相关因果因素。
勒昆认为,这种方法可以让模型学习速度更快。像V-JEPA(视频联合嵌入预测架构)这样的系统已经证明,它能够以远少于传统方法的训练迭代次数收敛到解决方案。世界模型通过学习数据的“形状”而非记忆数据本身,构建了一种更稳健的智能形式,能够更好地泛化到新的、未曾见过的情境中。
这是通用人工智能(AGI)缺失的一环。真正的智能需要导航。它要求智能体审视目标,利用其内部世界模型模拟实现目标的不同路径,然后选择成功概率最高的路径。文本生成器无法做到这一点;它们只能编写计划,却无法理解执行计划的约束条件。
最后
人工智能行业正处于一个转折点。“不断增加数据”的策略已接近尾声。我们正在从聊天机器人时代迈向模拟器时代。
下一代人工智能的规模化发展并非在于读取整个互联网,而在于观察世界,理解其规律,并构建一个能够反映现实的内部架构。这不仅仅是一次技术升级,更是对“学习”概念的根本性变革。
对于企业和研究人员而言,关注点必须转变。我们需要停止执着于参数数量,转而评估系统对因果关系的理解程度。未来的人工智能不仅会告诉你发生了什么,还会向你展示可能会发生什么,以及为什么会发生。这就是世界模型的承诺,也是我们前进的唯一途径。
免责声明:
本文所发布的内容和图片旨在传播行业信息,版权归原作者所有,非商业用途。如有侵权,请与我们联系删除。所有信息不构成任何投资建议,加密市场具有高度风险,投资者应基于自身判断和谨慎评估做出决策。投资有风险,入市需谨慎。
设为星标 避免错过
虚拟世界没有旁观者,每个点赞都是创造历史的像素
关注我,一起探索AWM⁺
2025-12-10
2025-12-09
2025-12-08
商业赞助
![]()
点击下方 “目录” 阅读更多
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.