网易首页 > 网易号 > 正文 申请入驻

“世界模型”——AI下一个“必争之地”,英伟达、谷歌双双下场

0
分享至

来源:硬AI

作者:赵颖

黄仁勋身着新皮衣亮相2025 CES,除了推出炸裂的GPU RTX 5090之外,还宣布入局AI领域当下最关键的方向一“世界模型”。

1月7日,黄仁勋在2025年拉斯维加斯消费电子展(CES)上宣布,推出Cosmos世界模型(Cosmos World Foundation Models,简称Cosmos WFMs),该模型专为理解物理世界打造,可预测和生成“物理感知”的视频。

具体来看,Cosmos WFMs分为三类:

(1)Nano:适用于低延迟和实时应用;(2)Super:高性能基线模型;(3)最高质量和保真度输出。

这些模型的参数规模从40亿到140亿不等,Nano最小,Ultra最大。英伟达还发布了上采样模型、针对增强现实优化的视频解码器以及确保负责任使用的guardrail模型。

实际上,除了英伟达,谷歌以及不少初创企业也在追逐世界模型,谷歌旗下DeepMind组建世界模型研究团队,聘请Sora核心人员Tim Brooks掌舵。此外,“AI教母”李飞飞的World Labs、初创公司Decart、 Odyssey也都涉足其中。

不仅引得一众科技企业逐鹿,“世界模型”还被业内吹捧为是AI领域的下一个关键突破,那么“世界模型”到底指的是什么?它的重要之处在于哪里?

英伟达入局“世界模型”,一众科技巨头“逐鹿”

据英伟达介绍称,Cosmos WFMs经过了9000万亿个token的训练,数据来自2000万小时的真实世界人类互动、环境、工业、机器人和驾驶数据。模型可针对特定应用进行微调,通过英伟达API和NGC目录、GitHub和AI开发平台Hugging Face可获得。

多家企业已开始试用Cosmos,英伟达表示,Waabi、Wayve、Fortellix和Uber等多家已经承诺在各种用例中试用CosmosWFM,从视频搜索和策划到为自动驾驶汽车构建AI模型。

不过,由于英伟达拒绝透露训练数据的具体来源,这引发了版权争议,分析称这正是英伟达将这些模型称为“开放”而不是“开源”的原因。

与此同时,谷歌DeepMind也在积极布局世界模型领域。根据TechCrunch报道,DeepMind正在组建一支专门的世界模型研究团队,以扩大其在该领域的领先地位。该团队将由前OpenAI研究员Tim Brooks领导,他于去年10月加入DeepMind。

DeepMind上个月发布了Genie,该模型可模拟虚拟世界以及逼真的动画和物理效果,并支持所有这些元素之间的交互。例如用户可以使用Genie创建的各种示例世界,包括航海模拟、赛博朋克西部片等,还可以使用文本、图像或两者的组合来提示Genie。

除了英伟达、谷歌等科技巨头,还有不少耀眼的初创玩家。“AI教母”李飞飞的World Labs已筹集2.3亿美元用于构建“大世界模型”,以及Decart、 Odyssey等公司也入局其中。此外,OpenAI此前发布的Sora模型也可视为一种“世界模型",它能够模拟如画家在画布上留下笔触等行为,以及渲染类似Minecraft的UI和游戏世界。

AI领域的下一个关键突破:世界模型

什么是AI“世界模型”?为什么它们很重要?

具体来看,世界模型是指通过大量图像、音频、视频和文本数据训练,创建对世界运作方式的内部表征,并能推理行为的后果。这使它们能更好地理解和模拟现实世界的规律。

世界模型的概念源自人类大脑形成的心智模型,我们的大脑能够将感官获取的抽象信息整合成对周围世界的具体理解,从而形成"模型",这些模型帮助我们预测和感知世界。

世界模型的特点是试图超越数据,模拟人类的潜意识推理,例如,棒球击球手能在毫秒内决定如何挥棒,是因为他们能本能地预测球的轨迹。这种潜意识推理能力被认为是实现人类级智能的先决条件之一。

“世界模型”的意义在于可以实现复杂推理和规划,还将生成式视频技术的突破:

1. 生成式视频技术的突破:世界模型在生成式视频领域展现出巨大潜力。与传统的生成模型相比,具备基本物理规律理解的世界模型能更准确地模拟物体的运动。例如,它不仅能预测篮球会弹跳,还能理解为什么会弹跳。Snap前AI负责人、Higgsfield公司CEO Alex Mashrabov表示,有了强大的世界模型,创作者就不需要为每个物体定义预期的运动方式,模型本身就能理解这些。
2. 复杂预测和规划:Meta首席AI科学家Yann LeCun认为,世界模型未来可能用于数字和物理领域的复杂预测和规划。例如,给定一个脏乱的房间(初始状态)和一个整洁的房间(目标状态),世界模型可以推理出一系列清洁行动,而不仅仅是根据观察到的模式进行操作。

拥有这些能力后,“世界模型”可广泛赋能影视、游戏,自动驾驶以及机器人等行业。

World Labs联合创始人Justin Johnson预测,未来的世界模型可能能够按需生成用于游戏、虚拟摄影等用途的3D世界,大大降低开发成本和时间。世界模型将不仅能获得图像或视频片段,还能得到一个完全模拟的、生动的、可交互的3D世界。

代表好莱坞动画师和漫画家的工会动画协会 (Animation Guild) 一项2024年研究估计,人工智能有可能在未来两年内颠覆美国10多万个电影、电视和动画工作岗位。

世界模型还有望推动机器人技术进步,通过增强机器人对周围环境和自身的感知能力,帮助它们更好地理解所处情境并推理可能的解决方案。

尽管前景诱人,世界模型的发展仍面临诸多技术挑战:

巨大的计算需求:训练和运行"世界模型"需要比当前生成模型更多的计算能力;幻觉和偏见问题:像所有AI模型一样,"世界模型"也会产生幻觉并内化训练数据中的偏见。
训练数据限制:缺乏足够广泛而又具体的训练数据可能会加剧上述问题。复杂行为模拟:目前的模型难以准确捕捉世界居民(如人类和动物)的行为。

过去一年AI技术在多元方向持续突破,世界模型被视为下一个重大突破。虽然距离成熟的“世界模型”还有数年时间距离,但这一技术已展现出巨大潜力。如果所有主要障碍都能克服,“世界模型”有望在虚拟世界生成、机器人技术和AI决策等领域带来重大突破,为人工智能与现实世界的融合开辟新的途径。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗重要人事任命,释放强烈信号!

伊朗重要人事任命,释放强烈信号!

斐君观点
2026-03-25 21:08:16
经济学历巴曙松被带走调查

经济学历巴曙松被带走调查

地产微资讯
2026-03-25 20:49:47
张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

每日人物
2026-03-26 13:34:51
我有一个朋友在张雪峰公司上班他说张雪峰根本不是大家看到的样子

我有一个朋友在张雪峰公司上班他说张雪峰根本不是大家看到的样子

乐悠悠娱乐
2026-03-26 10:27:07
张雪峰离世!北京苏州房产不在名下,1400名员工等安抚,好友停工

张雪峰离世!北京苏州房产不在名下,1400名员工等安抚,好友停工

阿纂看事
2026-03-25 21:31:59
特朗普坚称正在与伊朗谈判:伊朗不敢认,其领导人“害怕被自己人干掉,也害怕被美国干掉”,美国在伊朗赢麻了

特朗普坚称正在与伊朗谈判:伊朗不敢认,其领导人“害怕被自己人干掉,也害怕被美国干掉”,美国在伊朗赢麻了

极目新闻
2026-03-26 08:57:45
张雪峰家人首发声:不设追思会丧事从简,谢绝所有人去家中慰问

张雪峰家人首发声:不设追思会丧事从简,谢绝所有人去家中慰问

娱乐圈圈圆
2026-03-26 11:08:26
张雪峰去世真相!网友:偌大的公司靠他个人ip养活,早死是必然的

张雪峰去世真相!网友:偌大的公司靠他个人ip养活,早死是必然的

火山詩话
2026-03-25 09:18:58
我就不信张一山没有后悔过吗?这么美的前任拱手让出去了

我就不信张一山没有后悔过吗?这么美的前任拱手让出去了

喜欢历史的阿繁
2026-03-26 09:20:58
封锁霍尔木兹海峡,伊朗丢掉的不只是底牌

封锁霍尔木兹海峡,伊朗丢掉的不只是底牌

冰川思想库
2026-03-26 00:05:12
万科高管被要求退还薪酬

万科高管被要求退还薪酬

地产微资讯
2026-03-26 12:22:04
吃饺子没蘸酱油进监狱了,这是真的

吃饺子没蘸酱油进监狱了,这是真的

深度报
2026-03-25 22:55:01
伊朗官媒发布《为众人复仇》AI短片:一枚伊朗导弹在哈梅内伊等人注视下,精准炸毁幻化成羊头恶魔的美国自由女神像

伊朗官媒发布《为众人复仇》AI短片:一枚伊朗导弹在哈梅内伊等人注视下,精准炸毁幻化成羊头恶魔的美国自由女神像

大象新闻
2026-03-26 09:45:03
伊朗议长和外长被移出美以清除名单,“时限4到5天”!专家:若达成协议最慌的是以色列!特朗普:油价涨、股市跌,我无所谓

伊朗议长和外长被移出美以清除名单,“时限4到5天”!专家:若达成协议最慌的是以色列!特朗普:油价涨、股市跌,我无所谓

每日经济新闻
2026-03-26 12:20:14
张雪峰去世事件升级!很多人连夜下单AED,有店铺一天销售100多台

张雪峰去世事件升级!很多人连夜下单AED,有店铺一天销售100多台

火山詩话
2026-03-26 07:32:38
快讯!美军拒绝为以色列作战!

快讯!美军拒绝为以色列作战!

达文西看世界
2026-03-26 09:54:51
跟着黄仁勋下注:如今的token可能就是20年的房子

跟着黄仁勋下注:如今的token可能就是20年的房子

梦大明白
2026-03-24 11:05:49
二战后首次!日自卫队将登陆菲律宾

二战后首次!日自卫队将登陆菲律宾

环球时报国际
2026-03-26 08:59:28
这就是徐志摩爱而不得的林徽因中年时的真实长相,大家看看吧!

这就是徐志摩爱而不得的林徽因中年时的真实长相,大家看看吧!

小椰的奶奶
2026-03-26 09:50:43
突发心梗,吃丹参滴丸有用吗?医生:这2种药才是心梗急救药!

突发心梗,吃丹参滴丸有用吗?医生:这2种药才是心梗急救药!

健康科普365
2026-03-26 09:57:24
2026-03-26 14:24:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
143548文章数 2653021关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
游戏
本地
房产
公开课

亲子要闻

躺平的孩子意外觉醒了,在父母学会当“乌龟”!

IGN认为Xbox机会来了!新主机要转守为攻 重塑自我

本地新闻

春日吃花第三站——广东

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版