网易首页 > 网易号 > 正文 申请入驻

大模型觉醒空间意识?李飞飞、谢赛宁再叙空间智能

0
分享至

有着“AI教母”之称的斯坦福大学教授李飞飞又有新发现——尽管空间推理能力依然薄弱,但多模态大模型已经能够记住和回忆空间,甚至内部已经形成了局部世界模型,表现出了空间意识。

来自纽约大学、耶鲁大学、斯坦福大学的研究者引入了VSI-Bench,这是一个用于评估多模态大模型视觉空间智能能力的工具。VSI-Bench包含了超过5000个问答对,这些问答对来源于288个真实视频。这些视频包括居住空间、专业场所(例如,办公室、实验室)和工业场所(例如,工厂)——以及多个地理区域。VSI-Bench的质量很高,经过迭代审查以最小化问题的歧义,并移除了从源数据集中传播的错误注释。

通过5000多个问答对,研究人员发现多模态大模型表现出了有竞争性的视觉空间智能(尽管仍然低于人类)——人类评估者的平均准确率达到79%,比最佳模型高出33%,在配置和时空任务上的表现接近完美(94%-100%)。

哪些模型的空间智能能力更强?

在专有模型中,Gemini-1.5 Pro脱颖而出,尽管只在2D数字数据上进行训练,但它大大超过了机会基线,并在绝对距离和房间大小估计等任务中接近人类表现;表现最佳的开源模型,如LLaVA-NeXT-Video-72B和LLaVA-OneVision-72B,取得了有竞争力的结果,仅落后Gemini-1.5 Pro 4%-5%。然而,大多数开源模型(7/12)都低于机会基线,暴露出视觉空间智能的明显缺陷。

在最新研究中,研究人员还给出了提升大模型空间智能能力的潜在路径。

这项研究系统评估了多模态大模型的视觉空间智能后发现,思维链、思维树、自洽性等常用的语言提示技术不仅没有提升模型在空间任务上的表现,反而会使性能下降,而问答过程中明确生成认知地图则会增强多模态大模型的空间距离能力——使用认知地图辅助空间推理,可使模型在空间任务上的准确率提升了10个百分点。

相关论文已发布,合著作者中不仅有李飞飞,还有纽约大学计算机科学助理教授、CV大牛谢赛宁。

谢赛宁表示,视觉空间智能在现实世界中的应用,比以往任何时候都更近了。比如AI眼镜,它可以向我们显示去过的地方,还能定位、导航。

李飞飞也表示,在2025年,空间智能的界限很可能会再次突破,“这项名为“Thinking in Space”的研究,是对大模型在空间推理方面表现的评估,而空间推理对人类智能至关重要。”

视频理解能力无疑是AI大模型的下一个待攻关高地。当前的多模态大模型在2D空间的推理能力不断增强,可以较好地处理语言对话任务和视频图像任务,但在空间认知和理解方面的能力仍未得到充分研究。

空间智能对于模型理解物理世界而言至关重要

李飞飞对空间智能的定义是:空间智能是机器在3D空间和时间中感知、推理和行动的能力。

在她看来,空间智能是AI领域的下一个前沿技术方向,是她的下一个“北极星”。

李飞飞此前表示,实现AGI(通用人工智能)的关键一环是“空间智能”,尽管OpenAI的Sora模型可以文生视频,但就本质而言,它仍属平面二维模型,没有三维立体理解能力,只有通过空间智能,才能看到世界、感知世界、理解世界并让机器人做事,从而形成良性闭环。

今年9月份,在成功融资2.3亿美元后,李飞飞创办的空间智能公司World Labs正式启动。据介绍,World Labs的目标是开发一种能够理解实体世界的模型。今年7月,有消息称在完成两轮融资后,World Labs的估值已超过10亿美元,该公司的投资机构可以说是耳熟能详,包括安德森•霍罗威茨(Andreessen Horowitz,又名a16z)、Adobe、AMD、Databricks、英伟达、AI基金Radical Ventures等。

本文源自:科创板日报

作者:宋子乔

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张嘉倪已复婚!买超微博仍是张嘉倪老公,疑似张嘉倪为热度假离婚

张嘉倪已复婚!买超微博仍是张嘉倪老公,疑似张嘉倪为热度假离婚

八卦王者
2026-05-31 14:18:47
现场核爆级!7台引擎瞬间成废铁,印度零件坑惨美国登月计划?

现场核爆级!7台引擎瞬间成废铁,印度零件坑惨美国登月计划?

普陀动物世界
2026-05-31 00:41:55
中超下课第3人!新鹏城官宣解雇41岁陈涛:半程输8场 继任者浮现

中超下课第3人!新鹏城官宣解雇41岁陈涛:半程输8场 继任者浮现

风过乡
2026-05-31 11:06:18
禽兽都不会这么干!巴西亚马逊雨林发生严重挑战人类伦理的事情

禽兽都不会这么干!巴西亚马逊雨林发生严重挑战人类伦理的事情

科普大世界
2026-05-30 21:04:03
榛树导弹误击己方阵地,普京遭遇3.6亿损失闹剧

榛树导弹误击己方阵地,普京遭遇3.6亿损失闹剧

老头的传奇色彩
2026-05-30 08:45:10
打虎!王益华被查

打虎!王益华被查

新京报
2026-05-30 20:29:17
绍伊古承认俄罗斯在前线无法推进,理由是俄罗斯与56个国家作战

绍伊古承认俄罗斯在前线无法推进,理由是俄罗斯与56个国家作战

山河路口
2026-05-29 21:50:31
上海26岁女博士怀孕五个月查出胰腺癌,丈夫凑了200万为她治病,谁料,女子竟哭着大喊:你们再逼我化疗,我就从20楼跳下去!

上海26岁女博士怀孕五个月查出胰腺癌,丈夫凑了200万为她治病,谁料,女子竟哭着大喊:你们再逼我化疗,我就从20楼跳下去!

大爱三湘
2026-05-30 20:18:34
土伦杯:中国vs沙特,以小打大+残阵出击盼开门红,首发11人浮现

土伦杯:中国vs沙特,以小打大+残阵出击盼开门红,首发11人浮现

徽派体育
2026-05-31 17:21:36
为什么宁愿坐24小时的火车,也不坐几小时高铁?内行人透露实情

为什么宁愿坐24小时的火车,也不坐几小时高铁?内行人透露实情

猫叔东山再起
2026-05-30 10:40:07
法网女单八强诞生2席,斯瓦泰克连输6局出局,王曦雨抢七惜败

法网女单八强诞生2席,斯瓦泰克连输6局出局,王曦雨抢七惜败

老皢尾声体育解说
2026-05-31 20:41:46
三四个同事死死拽住,才没让他冲出去!药房医生当众扯下白大褂,只因一句……

三四个同事死死拽住,才没让他冲出去!药房医生当众扯下白大褂,只因一句……

医客
2026-05-30 12:14:19
美媒晒SGA荣誉直言不以成败论英雄!美记建议今夏追扬尼斯组三巨

美媒晒SGA荣誉直言不以成败论英雄!美记建议今夏追扬尼斯组三巨

颜小白的篮球梦
2026-05-31 11:09:39
iPhone到底能用几年?网友真实换机周期曝光,多数人都选错了

iPhone到底能用几年?网友真实换机周期曝光,多数人都选错了

小柱解说游戏
2026-05-30 00:13:06
你闻过最臭的是什么?网友:邻居以为我们在煮屎

你闻过最臭的是什么?网友:邻居以为我们在煮屎

夜深爱杂谈
2026-05-31 08:26:28
豪赌两岸统一!黄仁勋这招"暗度陈仓",直接把美国政客看傻了

豪赌两岸统一!黄仁勋这招"暗度陈仓",直接把美国政客看傻了

地球记
2026-05-31 00:23:43
英国公布的圆明园被毁前照片,美如仙境,引发世界关注

英国公布的圆明园被毁前照片,美如仙境,引发世界关注

贱议你读史
2026-05-23 15:23:34
超级央企连亏四年之后,80后总经理上位

超级央企连亏四年之后,80后总经理上位

地产一品塘
2026-05-31 08:00:11
何超莲追《主角》气得质问窦骁,坦言不是因为老公而追这部剧

何超莲追《主角》气得质问窦骁,坦言不是因为老公而追这部剧

娱最资讯
2026-05-31 20:34:47
一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一盅情怀
2026-05-16 20:12:47
2026-05-31 21:55:00
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 546439关注度
往期回顾 全部

科技要闻

戴尔诺基亚又回来了!AI重估老牌科技公司

头条要闻

保时捷一天两次被钉子扎 路面现多个修车广告报价上千

头条要闻

保时捷一天两次被钉子扎 路面现多个修车广告报价上千

体育要闻

阿森纳用最悲壮的方式,成就了巴黎王朝

娱乐要闻

朱军退休,正义虽迟但到,女方受惩

财经要闻

医学首席转岗搞科技,A股科技股遭遇巨震

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

旅游
教育
健康
亲子
时尚

旅游要闻

“六一”儿童节,一起漫步上博东馆(文末探索宫活动互动有奖)

教育要闻

事关所有高考生!2026高考或将出现3个重大变化!家长考生了解

尝试干细胞疗法如何避免踩坑?

亲子要闻

青少年哪个品牌DHA好?藻油组合易吸收,纯净配方无负担,学习状态更稳定

梓渝:慢下来,也很好

无障碍浏览 进入关怀版