网易首页 > 网易号 > 正文 申请入驻

李飞飞一篇论文,ChatGPT、Claude全部是”智障”

0
分享至

最近一篇论文让我反复观看,那就是李飞飞联合西北大学教授做了一个测试,将ChatGPT、Claude、DEEPSEEK等主流一线模型做了一个基线测试。

“Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces”

研究团队设计了一个 空间推理测试集 VSI-Bench ,包含:

  • 5000+ 视频空间问答任务

  • 需要模型理解:

    • 物体位置

    • 空间移动

    • 距离关系

    • 环境结构


测试模型

论文测试了多种大模型,例如:

  • GPT 系列

  • 多模态模型

  • 视觉语言模型

从而得出结论

  1. LLM的空间理解能力远低于人类

  2. 语言推理技巧(CoT、Tree-of-Thought)几乎无帮助

  3. 模型缺乏真正的 “world model / 空间认知结构”

并且语言推理技巧也几乎完全落后人类

  • 语言推理技巧(CoT、Tree-of-Thought)几乎无帮助

  • 模型缺乏真正的 “world model / 空间认知结构”

LLM模型无法做空间的底座

为什么现在的AI模型无法生成空间系统了,因为他就没有办法去理解空间操作能力,这就导致我们现在做vision Pro的开发,当程序员想用AI编码工具生成,几乎无法完成。


被迫只能手动写代码,在现在空间计算里面,因为他们记不住在视频里面的内容,也很难分辨出空间里面的物体。

在论文里举例,如果现在的常识是在3D图形旋转一圈之后,看下AI模型能不能识别,而这种只是拿着标准答案来测试;于是他们用真实的家庭识别来测试,或者工厂或者办公室。


空间智能有4个能力,分别是视觉能力、语言能力、时间处理、空间推理,其中

1.视觉感知(visual perception)

模型需要:

  • 识别物体

  • 识别形状

  • 识别位置

例如:

桌子、椅子、门、窗户

2.语言能力(linguistic intelligence)

模型要理解问题。

例如:桌子在沙发左边还是右边?

3.时间处理(temporal processing)

视频是:

时间序列

模型要理解:

  • 物体移动

  • 相机移动

  • 人的路径

4.空间推理(spatial reasoning)

这是最难的部分。

模型要理解:

  • 距离

  • 方向

  • 相对位置

例如:

桌子在椅子前面

而这点现在大模型做不到,主要是因为大模型现在只有tokens sequence,所以LLM不会真正理解房间结构、路径、距离。

最后就是通过空间智能之后,加上时间的维度就是空间记忆,比如在记忆里面人类可以记住物体的位置,完整的房间布局结构。


而机器人要想能够自主运动,就是需要空间模型,而当前时间是没有空间模型的,都是LLM,这也是为什么vision Pro与AndroidXR会成为下一代革命,当真正使用空间设备的人多了之后,就可以快速生成更多高质量的空间数据,就可以完成空间智能模型的训练了。

今天的分享就到这里

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
WTT重庆赛爆冷:陈幸同石洵瑶18分钟零封张本美和

WTT重庆赛爆冷:陈幸同石洵瑶18分钟零封张本美和

阿嚼影视评论
2026-03-12 12:42:28
光漂亮有何用?全场3中0,0板0断0帽+空篮不中,球迷:用高颂换她

光漂亮有何用?全场3中0,0板0断0帽+空篮不中,球迷:用高颂换她

法老不说教
2026-03-12 12:24:44
OpenClaw创始人表达对腾讯抄袭不满:大量抓取龙虾数据却不提供支持,服务器成本飙升

OpenClaw创始人表达对腾讯抄袭不满:大量抓取龙虾数据却不提供支持,服务器成本飙升

回旋镖
2026-03-12 14:56:05
快船大胜森林狼:小卡45+5+5+6三分迎里程碑 华子36分

快船大胜森林狼:小卡45+5+5+6三分迎里程碑 华子36分

醉卧浮生
2026-03-12 13:02:27
马云憋了整整十年,终于完成了对王兴的复仇。

马云憋了整整十年,终于完成了对王兴的复仇。

流苏晚晴
2026-03-11 18:32:00
日薪100元,给12岁女儿打工?女孩花4万元压岁钱盘下文具店雇佣妈妈

日薪100元,给12岁女儿打工?女孩花4万元压岁钱盘下文具店雇佣妈妈

封面新闻
2026-03-11 20:45:02
小哈梅内伊,刚出场就遇袭!伊朗官方医院召开发布会

小哈梅内伊,刚出场就遇袭!伊朗官方医院召开发布会

新动察
2026-03-12 08:27:46
你别不信,大部分公公;都会趁儿子不在家的时候跟儿媳妇保持距离

你别不信,大部分公公;都会趁儿子不在家的时候跟儿媳妇保持距离

风起见你
2026-03-12 09:55:29
中国船员实拍伊朗导弹轰炸阿联酋储油设施,6枚爱国者皆拦截失败

中国船员实拍伊朗导弹轰炸阿联酋储油设施,6枚爱国者皆拦截失败

不掉线电波
2026-03-12 09:27:43
5万人口小城的奇迹!欧冠超级黑马狂飙:3-0 5连胜 奔向8强

5万人口小城的奇迹!欧冠超级黑马狂飙:3-0 5连胜 奔向8强

叶青足球世界
2026-03-12 08:53:27
现场画面!特朗普宣称:我们赢了,在第一个小时一切就结束了,但需要“完成最后的工作”

现场画面!特朗普宣称:我们赢了,在第一个小时一切就结束了,但需要“完成最后的工作”

极目新闻
2026-03-12 10:33:45
CCTV5直播!亚洲杯1/4决赛:朝鲜决战澳大利亚,胜者或踢中国女足

CCTV5直播!亚洲杯1/4决赛:朝鲜决战澳大利亚,胜者或踢中国女足

何老师呀
2026-03-12 11:59:45
多接触女性的隐秘好处:第2个很多男人一辈子没明白

多接触女性的隐秘好处:第2个很多男人一辈子没明白

夏末moent
2026-03-12 11:38:54
又一艘货船在霍尔木兹海峡附近遭袭

又一艘货船在霍尔木兹海峡附近遭袭

界面新闻
2026-03-12 12:57:27
“终结700年传统”,外媒:英国议会投票决定废除上议院世袭贵族席位

“终结700年传统”,外媒:英国议会投票决定废除上议院世袭贵族席位

环球网资讯
2026-03-12 10:42:56
使用过时情报?美军内部调查初步认定“误炸”伊朗小学

使用过时情报?美军内部调查初步认定“误炸”伊朗小学

界面新闻
2026-03-11 23:52:52
凌晨在北京去世?75岁“风流妖精”刘晓庆,给内娱明星们上了一课

凌晨在北京去世?75岁“风流妖精”刘晓庆,给内娱明星们上了一课

乡野小珥
2026-03-11 19:44:41
伊朗这一战把美军底裤扒光,全球军事格局从此改写

伊朗这一战把美军底裤扒光,全球军事格局从此改写

纪史行者
2026-03-10 07:45:50
索赔138亿只是开始,巴拿马闯下大祸,中国要对其全球资产动手

索赔138亿只是开始,巴拿马闯下大祸,中国要对其全球资产动手

浮光惊掠影
2026-03-11 22:17:46
东契奇发布声明!正式与妻子分手!每个月将支付100万美金抚养费

东契奇发布声明!正式与妻子分手!每个月将支付100万美金抚养费

小椰的奶奶
2026-03-12 11:57:02
2026-03-12 15:11:00
Kevin改变世界的点滴 incentive-icons
Kevin改变世界的点滴
每周一次,产品案例与经验分享
265文章数 20关注度
往期回顾 全部

科技要闻

腾讯"养虾"暴涨后,百度急得在门口"装虾"

头条要闻

媒体:中东战事进入"全新阶段" 美以恐怕会最先"眨眼"

头条要闻

媒体:中东战事进入"全新阶段" 美以恐怕会最先"眨眼"

体育要闻

要脸,还是要83分纪录?

娱乐要闻

李湘瘦身惊艳亮相肖邦之夜 携女儿出席

财经要闻

卢锋:从特朗普团队群演看时代变局

汽车要闻

大众2025财报:转型虽有阵痛 "大象"已然起跑

态度原创

本地
旅游
健康
游戏
公开课

本地新闻

这档韩国玄学综艺,让多少人看得头皮发麻

旅游要闻

这座城,何以唱响新时代龙江颂?

转头就晕的耳石症,能开车上班吗?

使命召唤22赛季中更新!丧尸模式和大批新地图

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版