网易首页 > 网易号 > 正文 申请入驻

李飞飞的创业公司放大招:只要一个 H100 就能跑世界模型

0
分享至


作者 | 木子、高允毅

“AI 教母”李飞飞的创业公司,刚刚放出了一个大招。

World Labs在 X 上隆重介绍了一个新鲜的高效世界模型:RTFM(Real-Time Frame Model,实时帧模型)

有多高效?——只要一个 H100 GPU,即可一边和用户交互,一边实时渲染出 3D 世界。


要知道,现在世界模型的一大挑战,就是对算力的需求很高。据 World Labs 介绍,生成式世界模型的计算需求,远超如今的大语言模型。

也就是说,李飞飞团队的这个新成果,把世界模型的对 H100 的需求锐减了好几个量级,显著降低了硬件成本和部署难度。

而且据 World Labs 介绍,虽然 RTFM 背后的算力大幅减少,但其渲染效果依旧不俗,构建的 3D 世界可达到持久一致,所有场景将永久留存。该系统构建的持久化 3D 世界不会因视角转换而消失。


RTFM 可以处理各种场景类型、视觉风格和效果,包括反射、光滑表面、阴影和镜头眩光;

此外,该架构具备随数据量与算力增长而持续扩展的能力。它通过端到端的通用架构从海量视频数据中自主学习,无需依赖显式 3D 表征即可构建三维世界模型。

1 RTFM:突破世界模型的算力限制

世界模型,是 AI 根据自己与环境的交互建立的预测模型,它不需要人工创建完整的虚拟世界,而是通过与环境的互动,推测和构建出一个虚拟世界的“内部地图”。

那么,与仿真和一般的视频生成模型相比,世界模型有什么不同和优势?

世界模型与仿真和视频生成模型的主要区别在于,前者是通过 AI 与环境的互动自动学习和构建的,它不需要人工创建完整的虚拟世界,而是根据交互推测出环境的规律和变化。

与仿真不同,仿真依赖于人工设计的虚拟环境和规则,而世界模型具备自主学习和适应能力。

相比视频生成模型,世界模型不仅生成图像或视频,还能够理解和预测环境的动态,支持智能体做出决策。

简而言之,世界模型能更真实地反映动态变化,并为 Agent 提供决策支持;而仿真和视频生成模型更多是静态的或单向生成的内容。

世界模型如果发展成熟,能够深刻改变从媒体到机器人等各个行业,因为它能够实时生成“持久、交互、精准”的模拟世界,进一步推进 AI 在现实世界产生实际作用。

然而,据 World Labs 介绍,生成式世界模型的计算需求非常高,远超如今的大语言模型。

他们了打个比喻,以 60fps 的速度生成交互式 4K 视频流需要每秒生成超过 10 万个 token(大约相当于第一部《哈利·波特》的长度),那让这些 token 持续生成一小时或更长时间,需要关注超过 1 亿个 token 的上下文。

再举个例子,OpenAI 的 Sora 还不算完整的世界模型,只是具备一定的世界建模能力。而据 Factorial 基金会估计,OpenAI 的 Sora 在峰值运行时,需要 72 万块 H100 GPU。

这些也让李飞飞的 World Labs 开始思考:生成式世界模型是否受到当今硬件限制的阻碍?或者,目前是否有办法预览这项技术?

指出,AI 领域有个教训:就是过去很多研究者试图把人类的知识和经验直接嵌入到 AI 系统中,虽然这种方法在短期内有效,但从长远来看,它会阻碍进步。

而随着计算能力的提升,像搜索和学习这样的技术可以变得越来越强大,越来越好,反而是最有前景的方法。

也就是说,从长远来看,人类知识的嵌入并不是一个很好的解决办法,计算能力的扩展和智能的自主学习,才是推动 AI 进步的真正动力。

2 仅靠一个 H100 跑世界模型,怎么做到的?

据 World Labs 官方博客,RTFM 能够仅依靠一个 H100 GPU 进行高效的实时推理,主要得益于其高效的神经网络架构、创新的自回归扩散 Transformer、空间记忆技术和上下文切换机制

这些设计使得 RTFM 能够减少计算资源的消耗,并实现大规模 3D 世界的持久建模,确保其可以在单一硬件上长期运行。

首先,研发团队对 RTFM 在推理过程中的各个环节进行了精细优化,他们运用了架构设计、模型提炼和推理优化方面的最新进展,以保证模型在硬件上能够高效运行。

为了同时确保它生成的世界模型质量够高,RTFM 需要依赖优化的神经网络架构和推理技术,保证它在计算资源有限的情况下仍能提供高质量的输出;这些技术能让它在计算资源有限的情况下仍然提供好的表现。

至于自回归扩散 Transformer(Autoregressive Diffusion Transformer),是近年来新兴的神经网络架构之一,它在视频生成和时间序列预测方面表现优异。使用这种先进架构,能够有效优化模型的计算效率,并生成高质量的帧,支持实时推理。

另外,RTFM 采用空间记忆机制,通过为每一帧建模其在三维空间中的姿态,能够在保持高效的同时,在大场景中保留住几何结构,实现真正意义上的世界持久性;还采用了上下文切换机制,优化了计算资源的使用,提高了模型的效率。

总而言之,RTFM 只需要一个 H100 GPU 就能运行世界模型,主要得益于以下几个方面

  • 高效的架构设计,确保模型在单个 GPU 上运行并维持交互帧率和世界持久性。

  • 使用自回归扩散变换器进行帧序列预测,优化了推理过程。

  • 空间记忆和上下文切换技术,使得模型能够从历史帧中检索数据,避免重复计算。

  • 采用端到端学习的方法,减少对复杂 3D 建模的需求,从而降低计算负担。

  • 可扩展性设计,使得模型能够在计算资源提升时有效扩展其功能。

https://www.worldlabs.ai/blog/rtfm

https://x.com/theworldlabs/status/1978839175320186988https://x.com/drfeifei/status/1978840835341914164

https://analyticsindiamag.com/ai-news-updates/openais-sora-takes-about-12-minutes-to-generate-1-minute-video-on-nvidia-h100/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
央视主持人尼格买提:陪母亲抗癌6年,再婚顺其自然

央视主持人尼格买提:陪母亲抗癌6年,再婚顺其自然

情感大头说说
2026-03-30 17:09:10
50岁李小冉素颜白到发光,便利店给粉丝关东煮亲和无架子

50岁李小冉素颜白到发光,便利店给粉丝关东煮亲和无架子

悠悠说世界
2026-03-30 17:06:42
中东突发,紧急降准!

中东突发,紧急降准!

中国基金报
2026-03-30 15:22:39
俄乌战场传来血的教训,我们最先进的歼20,不能再抱着火箭弹不放

俄乌战场传来血的教训,我们最先进的歼20,不能再抱着火箭弹不放

安安说
2026-03-28 11:54:14
2026款丰田塞纳曝光,换装2.4T混动,新增E-Four四驱与150kW快充

2026款丰田塞纳曝光,换装2.4T混动,新增E-Four四驱与150kW快充

音乐时光的娱乐
2026-03-29 13:00:16
补贴堆出来的千亿泡沫,破了!

补贴堆出来的千亿泡沫,破了!

老鹰哥
2026-03-30 09:43:46
张雪峰去世头七,曝电动车还停在公司楼下,与女儿珍贵合影曝光

张雪峰去世头七,曝电动车还停在公司楼下,与女儿珍贵合影曝光

180视角
2026-03-30 14:18:21
特朗普:伊朗政权已完成更迭 现在与我们打交道的人跟以前完全不一样

特朗普:伊朗政权已完成更迭 现在与我们打交道的人跟以前完全不一样

闪电新闻
2026-03-30 13:55:41
1952年,打了大败仗的王近山,对彭德怀怒拍桌子:你这是什么打法

1952年,打了大败仗的王近山,对彭德怀怒拍桌子:你这是什么打法

浩渺青史
2026-03-30 13:22:44
1955 年饶漱石遭开除党籍,历多年关押服刑,晚年于农场度余生

1955 年饶漱石遭开除党籍,历多年关押服刑,晚年于农场度余生

唠叨说历史
2026-03-24 11:17:11
魔改侵权抢注商标!李荣浩怒撕单依纯,李健对她的忠告一点没错

魔改侵权抢注商标!李荣浩怒撕单依纯,李健对她的忠告一点没错

艺能八卦局
2026-03-30 00:27:58
股民站稳扶好了,明天周二,A股将迎来更大震荡反弹行情?

股民站稳扶好了,明天周二,A股将迎来更大震荡反弹行情?

股市皆大事
2026-03-30 15:51:10
1997年,女子拿着父亲的勋章找到军长哭诉:他是特级英雄,却在煤矿扛了40年炸药

1997年,女子拿着父亲的勋章找到军长哭诉:他是特级英雄,却在煤矿扛了40年炸药

老杉说历史
2026-03-28 18:39:12
今晚别换台!3月30日两大卫视好剧追不停

今晚别换台!3月30日两大卫视好剧追不停

手工制作阿歼
2026-03-30 07:42:43
连夺六天冠军,沈腾吴京都压不住,中国观众将助力《镖人》被超越

连夺六天冠军,沈腾吴京都压不住,中国观众将助力《镖人》被超越

影视高原说
2026-03-28 18:27:58
巴萨买断拉什福德陷入僵局:豪门困境下的犹豫与博弈!

巴萨买断拉什福德陷入僵局:豪门困境下的犹豫与博弈!

田先生篮球
2026-03-30 18:56:44
原来她是张雪峰前妻,90后历史学博士‌,两人离婚后曾一起上节目

原来她是张雪峰前妻,90后历史学博士‌,两人离婚后曾一起上节目

大铁猫娱乐
2026-03-25 13:03:57
“我有自己的指标!”上海知名演员催母亲体检被怼:撒向大海,我最喜欢

“我有自己的指标!”上海知名演员催母亲体检被怼:撒向大海,我最喜欢

上观新闻
2026-03-29 18:06:13
男人的生理需求能有多难忍?网友:我对我老公只有动物本能

男人的生理需求能有多难忍?网友:我对我老公只有动物本能

带你感受人间冷暖
2026-02-07 03:58:56
伊朗给中国出了口恶气!被干掉的E3正是在中国周边频繁搞事的那架

伊朗给中国出了口恶气!被干掉的E3正是在中国周边频繁搞事的那架

阿龙聊军事
2026-03-30 13:47:37
2026-03-30 19:44:49
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
12225文章数 51823关注度
往期回顾 全部

科技要闻

一句谎言引发的硅谷血案

头条要闻

河南女子举报母亲去世后被结婚 官方通报

头条要闻

河南女子举报母亲去世后被结婚 官方通报

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

单依纯凌晨发长文道歉!李荣浩再回应

财经要闻

本轮地缘冲突,A股凭什么走出独立行情

汽车要闻

理想i9要来了!外形似小号MEGA 能冲击高端纯电市场?

态度原创

房产
健康
艺术
游戏
军事航空

房产要闻

重磅!番禺20宗涉宅地亮相,万博CBD宅地将上新!

干细胞抗衰4大误区,90%的人都中招

艺术要闻

600 年前的「产亡孤魂」,藏着中国女性最痛的记忆

生化9格蕾丝3D区神图!马甲线南半球 里昂成无能丈夫

军事要闻

第三艘航母出动数千名士兵抵达 美军大举增兵中东战场

无障碍浏览 进入关怀版