网易首页 > 网易号 > 正文 申请入驻

World Model As Agent 是 AGI 的必经之路吗?

0
分享至

机器之心PRO · 会员通讯 Week 01

---- 本周为您解读 ③ 个值得细品的 AI & Robotics 业内要事 ----

1. World Model As Agent 是 AGI 的必经之路吗?

世界模型是什么?LLM 已经具备世界模型的雏形了吗?LLM 与世界模型能「划等号」吗?世界模型是如何实现「超级 AI」的?...

2. 一文回顾 AI4Science 进展

AI 推动了哪些科学研究范式的转变?AI 在科研各个领域中有哪些共性的应用?大语言模型是如何加持科学研究的?有哪些研究工作值得关注?...

3. 「AI 生成的」生成式 AI 综述了解一下?

这篇综述是 AI 生成的?OpenAI 研究员为何吐槽这篇综述?MoE、多模态和 AGI 对生成式 AI 有何影响?综述是怎么看待 Q*的?...

...本期完整版通讯含 3 项专题解读 + 30 项本周 AI & Robotics 赛道要事速递,其中技术方面 13 项,国内方面 9 项,国外方面 8 项...

本期通讯总计 24635 字,可免费试读至 8 %

消耗 99 微信豆即可兑换完整本期解读(约合人民币 9.9 元)

要事解读 ①World Model As Agent 是 AGI 的必经之路吗?

日期:1 月 4 日

事件:跨年之际,业内不少知名学者、大佬们发表了对 2024 年 AI 的预测,不乏有多模态、AI 智能体、世界模型等热门关键词。其中,世界模型作为实现超级 AI/通用具身智能的有效路径,备受关注。早期,LSTM 的作者 Jürgen Schmidhuber 探索了基于 LSTM 的强化学习和世界模型,为后续的世界模型奠定了基础;2022 年 6 月,图灵奖得主 Yann LeCun 发表论文,提出「世界模型」的架构;近期,吴恩达在接受「金融时报」采访时表示,「现在 LLM 已经具备了世界模型的雏形。有科学证据表明,LLM 在接受大量数据训练后,确实可以建立一个世界模型。」

世界模型是什么?[1]

1、在 Yann LeCun 的论文《Yann Lecun: A Path Towards Autonomous Machine Intelligence》中,对于世界模型的描述为:

① 世界模型可能预测自然世界的演化,或者预测由行为主体模块提出的一系列动作所导致的未来世界状态。世界模型可以预测多个合理的世界状态,这些状态由潜在变量参数化,这些潜在变量代表对世界状态的不确定性。

② 世界模型是一种模拟世界相关方面的‘模拟器’。世界状态的哪些方面是相关的取决于手头的任务。配置器配置世界模型以处理当前的情况。预测是在包含与任务相关信息的抽象表示空间内进行的。

③ 理想情况下,世界模型会在多个抽象层次上操纵世界状态的表示,使其能够预测多个时间尺度。一个关键问题是,世界模型必须能够表示世界状态的多种可能预测。自然世界并不是完全可预测的。这一点尤为重要。

2、世界模型(或称预测动力学模型)的核心任务是预测在特定智能体行动下,世界状态的变化,即尝试建模世界的状态转换函数。

目前,大语言模型能否和世界模型「划等号」?[2] [3]

1、图灵奖得主 Yann LeCun 在一场辩论表示,「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」Yann LeCun 认为自回归大型语言模型没有前途,模型并不了解这个世界底层的事实(underlying reality),而构建「世界模型」才是正道。

2、Yann LeCun 认为,当前的这些大型语言模型在学习方面是非常低效的。虽然表现惊人,但很多问题难以解决,包括事实错误、逻辑错误、前后矛盾、推理有限、容易生成有害内容等。重要的是,这类模型并不了解这个世界底层的事实(underlying reality)。

3、但近期,也有一些研究开始探索直接使用大型语言模型作为动态世界模型,但因受限于上下文限制和幻觉等大型语言模型自身存在的问题,这些探索还处于较为初期的阶段。

4、2023 年 10 月,MIT 的一项研究证实了大语言模型能够理解世界。

① MIT 的研究者通过对「从 LLM 中提取真实的世界地图」验证发现,LLM 在多个尺度上都学习了空间和时间的线性表征,而这些表征对不同的提示变化具有稳健性,并且在不同的环境类型(如城市和地标)中具有统一性。

② 同时,研究者还发现,LLM 具有独立的「空间神经元」和「时间神经元」,可以可靠地编码空间和时间坐标。也就是说,LLM 绝不仅仅是学习了表面的统计数据,而是获得了关于空间和时间等基本维度的结构化知识。

5、2023 年 11 月,西安交大、微软、北大的研究者发表论文,提出了 LEMA 框架,通过逆向学习过程(即从 LLM 犯过的错误中学习)进一步提高大模型的推理能力。

① 首先,研究者生成错误 - 修正数据对(称为修正数据),然后,利用修正数据对 LLM 进行微调。在生成修正数据时,研究者使用了多个 LLM(包括 LLaMA 和 GPT 系列模型)来收集不准确的推理路径(即最终答案不正确),然后使用 GPT-4 作为 「修正器」,为这些不准确的推理路径生成修正。

② 由于「世界模型」对现实世界的逻辑和规则具有先验意识,但大模型本身不具备推理能力。LEMA 框架采用了 GPT-4 作为「世界模型」,教导更小的模型遵守这些逻辑和规则,而不仅仅是模仿 step-by-step 的行为。

6、2023 年 2 月,哈佛大学、麻省理工学院的研究者同发表了一项研究 Othello-GPT,在简单的棋盘游戏中验证了内部表征的有效性。研究者认为语言模型的内部确实建立了一个世界模型,而不只是单纯的记忆或是统计,但其能力来源还不清楚。

① 在没有任何奥赛罗规则先验知识的情况下,研究人员发现模型能够以非常高的准确率预测出合法的移动操作,捕捉棋盘的状态。

② 同时,吴恩达对该研究表示高度认可,他认为基于该研究,有理由相信大型语言模型构建出了足够复杂的世界模型,在某种程度上来说,确实理解了世界。

为什么说「world model as Agent」有可能走得通?[4]

1、2018 年,David Ha 和 Jürgen Schmidhuber 在论文《World Models》中将心智模型的概念引入到了机器学习模型的构建中。

① 论文中指出,我们大脑中的预测模型预测的可能不是一般性的未来,而是基于我们的动作的未来的感官数据。这样,我们就能基于这个预测模型采取直觉行动,并在面临危险时执行快速反射行为。这个过程并不需要进行有意识的规划。

② 因此,如果能让人工智能体具备对于过去和当前状态的优良表征,那么就可能让该智能体在执行任务时表现得更加智能,尽管这个过程可能是无意识的。

2、世界模型(或称预测动力学模型)的核心任务是预测在特定智能体行动下,世界状态的变化,即尝试建模世界的状态转换函数。而实现通用具身智能的关键之一就是让机器学习系统能从自然模态(如视觉、听觉)中学习世界的层级化抽象,即世界模型。

3、世界模型能够将感知和认知整合在同一框架下。在现有的具身智能系统中,感知到认知的过程是通过独立模块完成的,这在模块间的衔接上面临挑战,同时是高级自动驾驶技术等具身智能系统难以实现的原因之一。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
被母亲喂养12年同居15年,如此“畸形”的母爱,终将爱子送进监狱

被母亲喂养12年同居15年,如此“畸形”的母爱,终将爱子送进监狱

五月读书汇
2024-06-01 10:02:23
致敬前辈!琼阿梅尼晒与欧冠奖杯合影,姿势与十年前阿隆索一样

致敬前辈!琼阿梅尼晒与欧冠奖杯合影,姿势与十年前阿隆索一样

直播吧
2024-06-03 05:10:05
“香会”智库报告偏颇指责中国,中国学者当场反驳引起共鸣

“香会”智库报告偏颇指责中国,中国学者当场反驳引起共鸣

环球网资讯
2024-06-02 22:07:35
安徽画家关玉梅被执行死刑前,拒绝吃断头饭,行刑时已四肢瘫软

安徽画家关玉梅被执行死刑前,拒绝吃断头饭,行刑时已四肢瘫软

一个人讲故事
2024-05-05 21:46:11
报复陷入危险循环,深夜集束导弹突防:2艘俄军弹药船剧烈大爆炸

报复陷入危险循环,深夜集束导弹突防:2艘俄军弹药船剧烈大爆炸

帅先工场
2024-06-02 16:53:06
看李小冉47岁蜕变成“大号水蜜桃”,你跟上新风潮了吗?

看李小冉47岁蜕变成“大号水蜜桃”,你跟上新风潮了吗?

虾剪说剧
2024-05-30 16:07:11
科学家发现量子纠缠的真相,竟然和古人的描述有惊人的巧合!

科学家发现量子纠缠的真相,竟然和古人的描述有惊人的巧合!

青山易观
2024-06-01 23:21:06
广东的酒席是什么样的?参加了几十场广东宴席,发现挺有意思的

广东的酒席是什么样的?参加了几十场广东宴席,发现挺有意思的

申浩
2024-05-27 02:27:09
比断供芯片更可怕?库克正式宣布!中国或成全球最大iPhone市场!

比断供芯片更可怕?库克正式宣布!中国或成全球最大iPhone市场!

奇奇怪怪的冒险
2024-06-03 02:21:41
重大利好!25家上市公司退市,更大退市潮还在路上

重大利好!25家上市公司退市,更大退市潮还在路上

股海风云大作手
2024-06-03 07:26:50
丘成桐谈韦神:数学家也是普通人,一瓶水加馒头不是数学家的形象

丘成桐谈韦神:数学家也是普通人,一瓶水加馒头不是数学家的形象

芯怡飞
2024-06-02 15:08:32
原来老人开的早餐店这么离谱?看完网友的评论,我产生了阴影

原来老人开的早餐店这么离谱?看完网友的评论,我产生了阴影

双色球的方向舵
2024-06-03 01:37:23
“绝世美女”别硬演,《庆余年2》看到隋俊波,差点没敢认

“绝世美女”别硬演,《庆余年2》看到隋俊波,差点没敢认

小影吉
2024-05-31 17:12:54
正式登场:乌克兰F-16首次执行任务!乌军收复多块失地

正式登场:乌克兰F-16首次执行任务!乌军收复多块失地

项鹏飞
2024-05-30 19:39:35
泽连斯基亚洲行程挺“神秘”,中国看破不说破,普京送他一份大礼

泽连斯基亚洲行程挺“神秘”,中国看破不说破,普京送他一份大礼

千里持剑
2024-06-03 14:38:18
欧文:NBA最无可争议的巨星,历史第一人,真正的GOAT!

欧文:NBA最无可争议的巨星,历史第一人,真正的GOAT!

开心体育站
2024-06-03 09:59:13
太丢人了!德国颁发抄袭大奖,中国包揽前10名!

太丢人了!德国颁发抄袭大奖,中国包揽前10名!

我是娱有理
2024-05-24 07:20:29
洪秀柱反对统一?看看她这句话,说得多么有讲究,网友:现在才懂

洪秀柱反对统一?看看她这句话,说得多么有讲究,网友:现在才懂

历史求知所
2023-12-09 08:00:21
大将军承认荒唐事:车后座有3个女人 不确定有杰伦-格林女友

大将军承认荒唐事:车后座有3个女人 不确定有杰伦-格林女友

直播吧
2024-06-01 12:40:54
闹大了!日本警方为了抓铁头,将悬赏金加到1000万,一些华人加入

闹大了!日本警方为了抓铁头,将悬赏金加到1000万,一些华人加入

皖声微言
2024-06-03 14:26:24
2024-06-03 15:26:44
机器之能
机器之能
探索人工智能应用场景及商业化
1925文章数 4356关注度
往期回顾 全部

科技要闻

2万字演讲|黄仁勋剧透 未来3年新品有这些

头条要闻

陈冰:特朗普获罪令拜登更着急 他对拜登威胁性加大

头条要闻

陈冰:特朗普获罪令拜登更着急 他对拜登威胁性加大

体育要闻

万人空巷!皇马举行欧冠夺冠庆典

娱乐要闻

混战升级!编剧赵冬苓力挺王阳遭围攻

财经要闻

黄仁勋的计划:新AI平台 HBM4 机器人

汽车要闻

搭载华为HiCAR 传祺M6 MAX售14.58万元

态度原创

健康
游戏
时尚
手机
旅游

晚餐不吃or吃七分饱,哪种更减肥?

暴雪前CEO:索尼新战略难以吸引大量玩家购入PS5

夏季穿衣就看看日杂,不管衬衫还是t恤都太美了,时髦优雅

手机要闻

紫光展锐再出海,T750 处理器 Lava Yuva 5G 智能手机海外登场

旅游要闻

哈尔滨至香港航线正式开通

无障碍浏览 进入关怀版