据量子位报道,当地时间11月10日,斯坦福大学教授、World Labs联合创始人李飞飞发布长文,首次系统性阐述空间智能为AI下一个前沿。她指出,当前大语言模型虽能处理抽象知识,但缺乏对物理世界的根基性理解,空间智能将成为突破的关键。
李飞飞提出“世界模型”需具备三项核心能力:生成性(创造遵守物理定律的虚拟世界)、多模态(处理图像、视频、动作等输入)、交互性(预测世界演变状态)。她强调,这种模型将彻底革新创造力、机器人、科学及医疗等领域。
World Labs创始人李飞飞透露,团队已开发出Marble平台早期版本——全球首个可通过多模态输入生成一致性3D环境的世界模型。该平台允许用户实时探索并构建虚拟世界,目前正逐步向公众开放。
李飞飞回顾其研究历程时提到,ImageNet数据集与神经网络、GPU共同催生了现代AI。她认为,空间智能的进化源于生物“感知-行动”循环,而当前AI在距离估计、物体旋转等基础空间任务中表现仍远逊于人类。
World Labs成立于2024年初,正致力于解决世界模型的技术壁垒:设计通用训练任务函数、构建大规模多模态数据集、开发新型模型架构。团队近期推出的RTFM模型采用空间记忆机制,实现了实时生成且保持世界一致性。
李飞飞特别强调AI需增强人类能力而非取代,空间智能将赋能创作者、科学家及护理人员。在斯坦福实验室与医疗机构合作中,她观察到空间智能在药物研发、影像诊断及家庭护理机器人领域的应用潜力。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.