网易首页 > 网易号 > 正文 申请入驻

李飞飞高徒新作!30万小时视频教会AI在《我的世界》里打败末影龙

0
分享至

新智元报道

编辑:袁榭 桃子

【新智元导读】近日,李飞飞高徒和团队研究人员提出了基于《我的世界》游戏新框架MineDojo,可以让AI自由探索程序生成的3D世界。

上周,OpenAI让AI看完海量视频后,学会玩《我的世界》。

在这之前,来自英伟达团队的研究人员还构建了一个游戏新框架MineDojo。

MineDojo包含了1000多种不同的开放式任务的模拟套件。

在这里,AI智能体可以自由探索程序生成的3D世界。

李飞飞在社交媒体上称赞了其得意门生,也是这篇论文的一作,Linxi Fan(范麟熙)的最新研究成果。

MineDojo:打开AI新世界

说来,这些AI究竟能做什么?

能在主世界、下界、末日中进行开放式探索,比如:

对战末影龙

寻找沙漠中的金字塔

还能探索海洋纪念碑

可以穿越不同地形,开采材料

能够制作并使用多样化工具,比如,用栅栏围住骆驼

种植小麦...

省事儿了!AI自学自励

目前为止,《我的世界》玩家已经有1亿多人,他们是构建大量数据的基础。

MineDojo从网上收集了海量数据:

  1. 73万YouTube视频,带有标记2.2亿个单词的英文脚本,这些视频总时长大概有30万个小时;


  2. 6735个Wiki页面,其中包括交互式的文本、图像、表格和图表;


  3. 34万条在「r/Minecraft」上的 Reddit帖子,还有660万条评论。

视频素材分两类:

逐步演示、配音详解的教程视频,研究团队用教程视频做出了大量程序基准。

不按特定任务与步骤进行的普通游戏录播视频,给AI智能体提供了内容更多元、素材更丰富的各种学习与训练信号。

由于不管是教程视频还是游戏录播视频,大多数视频库素材都是按时间轴配脚本的。如此就让AI智能体可以低障碍地将自然语言与像素级的图像数据对应,不用大量人工标注就能自行理解各种活动的自然语义对应物。

由于Reddit文本数据库中的内容结合了文字、图片、短视频片段,将精细调试的大语言模型在其中使用后,AI智能体就能获得大量特定的内化概念和复杂策略。

MineDojo现有基准任务库中包含3131个任务,其中有1572个可编程任务、1558个创造性任务、1个通关性任务。

可编程任务按固定步骤和任务目标完成,分四种:

1.生存:AI玩家在初始游戏环境中生存若干天

2.采集:发现、获取、培育、制造数百种材料和物体

3.科技树:按游戏进程目录解锁各种等级的工具与技能

4.基础战斗:AI玩家在游戏中打各种普通小怪,测试智能体反应灵活度和战斗技能

创造性任务就没有可编程任务的精细定义、自动完成的标准了,由AI智能体自由发挥。

通关任务的要求是让AI玩家「打败末影龙并获取龙蛋奖励」。这对人类新手玩家来说都是个游戏初期的里程碑成就。

对于AI智能体而言,这是个验收性任务,考验了AI智能体自行准备、探索、试错等等完成游戏的能力。

研究团队将所有任务都附带了自然语言叙述的提示,很多任务还有用GPT-3生成的逐步指南。

为了用强化学习训练AI智能体玩《我的世界》、完成必备的奖惩功能,研究团队自行开发了模型MineCLIP。

MineCLIP是在海量Youtube数据库上预训练的对比视频语言模型,利用大型预训练的视频语言模型作为学习奖励函数。

比较有特点的是,这个智能体可以解决各种用自由形式的语言指定的开放任务。

同时,它不需要任何人工设计的密集设计奖励。

其奖励效果在可编程任务上与人工编写的逐条奖励程序不相上下,在创造性任务上胜过了OpenAI的预训练CLIP模型。

MineCLIP模型也是MineDojo中AI将图像对应自然语言的核心组件,包含了文本编码器和图像编码器,参数1.5亿。

研究团队在论文中称MineCLIP模型的神经架构很类似CLIP4Clip,但比其多了两层图-文适应处理层。

研究团队在视频数据库中抽取了64万16秒短视频片段抽样,来训练这两层来对应图像和文字,效果可与人工判定的真实值媲美。

网友点评

一位网友称,OpenAI和英伟达基于《我的世界》做的研究方向有些不同。

并对这两项研究进行了对比。

OpenAI试图训练一个《我的世界》中的通才智能体,就像此前DeepMind训练星际争霸那样:

先通过模仿大量演示来学习,然后再通过精心化设计的奖励让智能体去进行强化学习。

问题是,智能体想要进行模仿学习得知道个所以然,然而很多视频并没有标记动作,根本不知道玩家执行了哪些动作来生成这些视频。

于是OpenAI提出了视频与训练模型(VPT)解决方案,在训练7万个小时后,模型就学会了怎么砍树、收集木头。

值得注意的是,预训练的智能体仍然在执行任务时是有限的。

如果想要让其学习更复杂的动作,那就需要精心设计的奖励函数来引导智能体完成必要的步骤。

相比之下,英伟达提出了不同的观点。

他们通过利用YouTube上的视频里的知识学习各种想得到的任务,包括GPT-3生成的任务。

为此,研究者并没有通过手动设计无数奖励,而是设计了一种算法MineCLIP,利用了大型与训练视频模型作为学习奖励函数。

作者介绍

这项最新研究团队共有十个人。

其中论文一作是李飞飞门下得意弟子Linxi Fan(范麟熙)。

他毕业于上海实验中学,本科就读于纽约哥伦比亚大学,目前在斯坦福大学攻读博士,主修计算机视觉、强化学习以及机器人技术。

参考资料:

https://minedojo.org/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
无视台当局禁令,大陆想要的,蒋万安给的很干脆,两岸共同谋统一

无视台当局禁令,大陆想要的,蒋万安给的很干脆,两岸共同谋统一

影孖看世界
2024-06-16 04:59:40
同济医院科室主任被堵办公室讨说法:我儿被制造脑死亡劝捐器官!

同济医院科室主任被堵办公室讨说法:我儿被制造脑死亡劝捐器官!

兵叔评说
2024-06-16 09:23:12
欧倩怡首回应离婚,每天买菜送娃惨过佣人,单身后和6名男士约会

欧倩怡首回应离婚,每天买菜送娃惨过佣人,单身后和6名男士约会

开开森森
2024-06-15 07:58:01
17岁数学天才少女姜萍爆火的第2天,担忧的事发生了

17岁数学天才少女姜萍爆火的第2天,担忧的事发生了

解说阿洎
2024-06-15 11:15:13
楼市的救市方向,正在南辕北辙

楼市的救市方向,正在南辕北辙

听三哥说
2024-06-13 23:50:04
53年北京拆除大批古建筑,林徽因公开大骂副市长:将来你们要后悔

53年北京拆除大批古建筑,林徽因公开大骂副市长:将来你们要后悔

红色风云
2024-01-06 10:08:08
越南崩盘!重蹈日本覆辙,将成为亚洲第一个倒下的国家?

越南崩盘!重蹈日本覆辙,将成为亚洲第一个倒下的国家?

美人茶话会
2024-06-16 05:03:58
《海天雄鹰》被吐槽疯了:军旅剧四个烂大街的俗套,一个也不能少

《海天雄鹰》被吐槽疯了:军旅剧四个烂大街的俗套,一个也不能少

娱记掌门
2024-06-16 11:16:00
解放战争中,如果国民党获得胜利,今天的中国会是什么样

解放战争中,如果国民党获得胜利,今天的中国会是什么样

史诗长歌
2024-05-13 13:34:32
没救了!马宁降级吹中甲再现重大错判,球迷愤怒高喊:马宁进监狱

没救了!马宁降级吹中甲再现重大错判,球迷愤怒高喊:马宁进监狱

阿牛体育说
2024-06-16 11:19:06
曝豆得儿曾为王思聪打过胎,看到黄一鸣爆料后破防,本人发文怒斥

曝豆得儿曾为王思聪打过胎,看到黄一鸣爆料后破防,本人发文怒斥

拾娱先生
2024-06-13 15:04:40
唱不过周杰伦,演不过谢霆锋,史上巅峰期最短最无奈的小天王

唱不过周杰伦,演不过谢霆锋,史上巅峰期最短最无奈的小天王

综艺拼盘汇
2024-06-15 07:25:08
曾经的两个好朋友,已成两敌人,再想买先进装备是没地方可买了

曾经的两个好朋友,已成两敌人,再想买先进装备是没地方可买了

历史与财经
2024-06-12 12:52:02
留洋+1官方:日本国脚川村拓梦将开启留洋,正式离开广岛三箭

留洋+1官方:日本国脚川村拓梦将开启留洋,正式离开广岛三箭

直播吧
2024-06-16 00:01:13
现在月薪1万在中国是什么水平?

现在月薪1万在中国是什么水平?

陌小尘桑
2024-01-03 18:50:03
太现实,中专生姜萍数学大赛成绩超麻省理工学生,只能上常熟理工

太现实,中专生姜萍数学大赛成绩超麻省理工学生,只能上常熟理工

育学笔谈
2024-06-14 11:18:52
表面坐滩,实则放毒!我国公布仁爱礁菲坐滩舰最新情况

表面坐滩,实则放毒!我国公布仁爱礁菲坐滩舰最新情况

笔墨V
2024-06-16 11:17:37
055一打一能不能打过阿利伯克?5项数据性能对比,美国没那么神

055一打一能不能打过阿利伯克?5项数据性能对比,美国没那么神

十三级台阶
2024-06-16 11:14:56
“难度直线飙升,堪比高考”!上海中考作文题公布,进来挑战→

“难度直线飙升,堪比高考”!上海中考作文题公布,进来挑战→

上观新闻
2024-06-15 18:19:51
为什么日本人晚上那么晚去居酒屋吃炸鸡啤酒,但街上却鲜有胖子?

为什么日本人晚上那么晚去居酒屋吃炸鸡啤酒,但街上却鲜有胖子?

有趣的羊驼
2024-06-14 09:32:17
2024-06-16 12:38:44
新智元
新智元
AI产业主平台领航智能+时代
11154文章数 65537关注度
往期回顾 全部

游戏要闻

《刺客信条影》弥助1:1武士头盔超霸气!原价5434元

头条要闻

媒体:普京开出的停火条件有重大变化 已亮出战略底牌

头条要闻

媒体:普京开出的停火条件有重大变化 已亮出战略底牌

体育要闻

没人永远年轻 但青春如此无敌还是离谱了些

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

打断妻子多根肋骨 上市公司创始人被公诉

科技要闻

iPhone 16会杀死大模型APP吗?

汽车要闻

售17.68万-21.68万元 极狐阿尔法S5正式上市

态度原创

艺术
旅游
时尚
本地
公开课

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

旅游要闻

@毕业生,江苏这些景区可享免票或优惠

中年女性还是穿连衣裙最有气质!裙摆过膝、腰部收紧,巨显瘦

本地新闻

粽情一夏|海河龙舟赛,竟然成了外国人的大party!

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版