网易首页 > 网易号 > 正文 申请入驻

李飞飞一年前究竟说了啥?怎么又火了

0
分享至

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

大语言模型的局限在哪里?

AI教母李飞飞这样说:

大自然中是没有语言存在的,你不会从天空中直接看到文字。
语言是一种纯粹的生成的信号。



语言信号的输出主要基于人类给的输入信号,可以说,语言是不独立于人之外的。

然而,物理世界是客观存在的。所以提取、理解、生成3D世界的数据、实现空间智能和处理语言问题时截然不同。



没想到,李飞飞一年前的访谈被扒出来,又引发大量围观。

她这段话意味着,大语言模型或许还不是真正的智能。

真正的智能将是信号感知、物理以及和现实世界相结合的产物。



下面来看看大家还在热议些啥吧。

空间智能可以借鉴语言模型,但仍存在本质差异

这场讨论的焦点在于,现在基于语言信号训练的模型到底懂不懂物理世界的常识

首先,回顾一下李飞飞的说法。

她认为语言模型及当今的多模态语言模型的底层表示是一维的。它们在根本上就是操作于离散token的一维序列上,所以模型对于书面文本这种一维序列的表示是非常自然的。



然而,在处理空间智能问题时,核心是世界的三维本质。

虽然多模态大语言模型也能看图像,但它是将其他模态硬塞进这种一维token序列的底层表示中,这种一维且由人类生成的数据,可能无法很好地表示物理世界,造成信息损失。

如果直接让模型处理3D数据,那么表示类型与模型旨在执行的任务类型之间将会有更好的匹配。



而空间智能的挑战就是在于从这个真实世界中提取、表示和生成信息。

除了这个维度上的差异,从更哲学的角度来说,她认为语言是一种纯粹由生成产生的信号。自然界中并不存在预设的语言形式,也就是说语言不能独立于人类之外。

大模型能够通过学习并反刍所输入的数据,无论输入什么样的数据,模型都能用足够的泛化能力处理语言任务。这是因为语言,或者说文本的本质允许模型在生成范式下表现得出色。



与语言不同,3D世界是真实存在于外部的。这个世界遵循着物理定律,并因材料等多种因素而具有其自身的结构。

因此,要让模型倒推出3D世界的信息,并能够表示和生成它,在技术层面上,空间智能可以借鉴语言模型,但从哲学的范畴来看,这两者仍存在本质差异。



有人举了一堆例子来证明李飞飞的观点,同时说明语言模型在理解物理世界时确实有局限。

基于语言信号训练的模型在物理世界任务中表现差

比如用一个小实验来测试Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro三个多模态大模型的物理常识,并与人类儿童表现做对比。



研究用Animal-AI这个用来测试动物和人工智能体物理认知的3D环境来测试大模型,让大模型通过前进/后退、左转/右转、环境描述与规划控制三个指令控制一个小角色在虚拟环境中完成任务。



第一个实验是让大模型完成一些简单的任务,如直接找到小球,还有一些稍难的任务,如躲开障碍物找到小球。

结果发现模型只能搞定最简单的任务,稍难一点就不行了。

第二个实验是在第一个实验的基础上增加教学案例,比如演示正确做法,结果模型表现也没有明显的提升。

对比之后再看,这些大模型的表现远不及人类儿童,也比不上专门为这个环境测试的机器人。



还有其他研究团队设计了一个名为ABench-Physics的工具,专门用来测试大语言模型在物理推理方面的能力,核心就是想搞清楚这些模型到底能不能真的理解物理、解决物理问题。



测试分两部分,Phy A由400道竞赛级别的物理难题组成,先给大模型来个基础测试。

Phy B属于动态部分:修改Phy A中题目的数字,但不改变物理原理,用来测试大模型能不能进行灵活的物理推理。

结果显示,最厉害的模型在Phy A上的正确率只有43%,而在Phy B中模型的平均准确率下降了22.5%。

这说明模型并不是真懂物理。



还有团队用视觉任务测试大模型,比如让模型判断照片中哪些物体更近,或者匹配相同的事物。

人类对这些任务的正确率能达到95.7%,而几个模型最高的正确率仅有51%。在视觉感知上,大模型还远不及人类。



这些结果都进一步证明了李飞飞之前访谈中关于大模型理解真实物理世界局限性的观点。

也得到了网友们的认同。



模型的开发确实正在扩展到将模型建立在物理与多模态理解的基础上。



讨论升级

当然了,有正方就有反方。

有人先是反驳了关于语言的论述。



也有人认为,在某些情况下,语言描述现实的能力可能会比感知更优。



还有人说模型的语言不用局限于人类的语言、文本等,人工智能或许能创造出自己的语言来理解物理世界。



或者,我们该思考,用语言训练大模型取得现有成就的根本因素又是什么呢?



对于这场讨论,你又有什么样的看法呢?


[1]https://x.com/rohanpaul_ai/status/1965242567085490547
[2]https://www.youtube.com/watch?v=vIXfYFB7aBI

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中美军事实力有多大差距?张召忠:我可以负责任地讲,别再被误导

中美军事实力有多大差距?张召忠:我可以负责任地讲,别再被误导

混沌录
2025-05-12 18:38:14
疑似偷车贼被打致死5人获刑 另一被告被判10年:其递了钢管,后被用于殴打被害人

疑似偷车贼被打致死5人获刑 另一被告被判10年:其递了钢管,后被用于殴打被害人

红星新闻
2026-01-04 13:11:17
唏嘘!昔日国安希望之星再失业,年仅26岁已无球可踢

唏嘘!昔日国安希望之星再失业,年仅26岁已无球可踢

体坛鉴春秋
2026-01-04 18:32:15
起拍价从60万腰斩至30万,杭州张小泉集团一奔驰车第四次流拍,品牌客服回应

起拍价从60万腰斩至30万,杭州张小泉集团一奔驰车第四次流拍,品牌客服回应

极目新闻
2026-01-04 14:44:48
公开道歉,官宣二胎,骤然离世,1月刚开始,娱乐圈又有新“瓜”

公开道歉,官宣二胎,骤然离世,1月刚开始,娱乐圈又有新“瓜”

杰丝聊古今
2026-01-05 03:04:38
非洲杯2-1,仅34%控球率仍赢,世界第57掀翻南非,晋级八强

非洲杯2-1,仅34%控球率仍赢,世界第57掀翻南非,晋级八强

侧身凌空斩
2026-01-05 04:58:43
官媒下场点名!“皇子”登基观众不买账,内娱世袭制为何惹众怒

官媒下场点名!“皇子”登基观众不买账,内娱世袭制为何惹众怒

以茶带书
2025-12-11 12:36:49
伊朗,突发!崩盘、失控!发生了什么?

伊朗,突发!崩盘、失控!发生了什么?

证券时报
2025-12-31 08:07:06
伊朗危险了!全面绞杀,已经开始了!

伊朗危险了!全面绞杀,已经开始了!

大嘴说天下
2026-01-02 22:15:17
越拆越乱!雷军拆车直播两小时急关评论,1200公里续航成谜

越拆越乱!雷军拆车直播两小时急关评论,1200公里续航成谜

老特有话说
2026-01-04 19:57:29
2025将结束,央媒发文,陈芋汐捅破天花板,让整个国际体坛沉默了

2025将结束,央媒发文,陈芋汐捅破天花板,让整个国际体坛沉默了

梨花黛娱
2026-01-04 17:43:10
盯上3000亿桶石油储量,特朗普:美国将“接管”委内瑞拉

盯上3000亿桶石油储量,特朗普:美国将“接管”委内瑞拉

时代周报
2026-01-04 08:49:26
男子一脸桃花相眼神“拉丝”,戴金戒指走红,网友:一看就是老手

男子一脸桃花相眼神“拉丝”,戴金戒指走红,网友:一看就是老手

梅子的小情绪
2026-01-03 15:28:47
医学博士:肿瘤越来越高发,我们究竟被隐瞒了什么?

医学博士:肿瘤越来越高发,我们究竟被隐瞒了什么?

深度报
2025-12-21 23:01:02
大瓜!成都一女生蜜雪上班迟到,怒骂HR殴打店长,注销收银系统

大瓜!成都一女生蜜雪上班迟到,怒骂HR殴打店长,注销收银系统

火山詩话
2026-01-04 07:12:23
狂轰55分,爆砍45分!全世界都说你快退役了,你却逆天改命冲冠了

狂轰55分,爆砍45分!全世界都说你快退役了,你却逆天改命冲冠了

老侃侃球
2026-01-05 03:30:03
帮我们认清这个世界真相的,还得是懂王

帮我们认清这个世界真相的,还得是懂王

超级学爸蛋总
2026-01-04 21:00:15
腐乳再次被关注!研究发现:糖尿病患者常吃腐乳,或出现4种变化

腐乳再次被关注!研究发现:糖尿病患者常吃腐乳,或出现4种变化

摇感军事
2026-01-03 21:16:50
资治通鉴:告诉你一个顶级智慧,你对别人恩情越大越不要主动提及

资治通鉴:告诉你一个顶级智慧,你对别人恩情越大越不要主动提及

李舟
2026-01-03 18:13:59
尽力局!曼联队长全场8次解围 他首发出场红魔没输过

尽力局!曼联队长全场8次解围 他首发出场红魔没输过

球事百科吖
2026-01-05 05:23:59
2026-01-05 06:35:00
量子位 incentive-icons
量子位
追踪人工智能动态
11967文章数 176356关注度
往期回顾 全部

科技要闻

雷军:骂小米汽车有流量,但别故意抹黑

头条要闻

拘押马杜罗的拘留中心"环境令人作呕" 内部画面披露

头条要闻

拘押马杜罗的拘留中心"环境令人作呕" 内部画面披露

体育要闻

女子世界第一,9年前在咖啡店洗碗

娱乐要闻

《小城大事》上星央八 热血筑梦正当时

财经要闻

李迅雷:扩内需必须把重心从"投"转向"消"

汽车要闻

最高续航310km 岚图泰山8或将上半年发布

态度原创

艺术
旅游
家居
公开课
军事航空

艺术要闻

太美了,看一眼美进心窝!

旅游要闻

一票“畅玩”京津冀

家居要闻

黑白碰撞 个性多元冷冽风

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美军突袭抓获马杜罗 三个细节值得关注

无障碍浏览 进入关怀版