网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

单演示通关蒙特祖玛：AI模仿学习的新极限

2026-05-07 00:01:03　来源: 字节漫游指南

北京举报

0

分享至

强化学习在稀疏奖励环境一直是个老大难问题。DeepMind团队最近放出一项研究，只用一段人类通关视频，就让AI学会了《蒙特祖玛的复仇》——这款以难度著称的经典游戏。

关键突破在于"单演示"设定。传统方法需要成千上万次试错，或者大量人工标注数据。而这次的核心思路是：让AI先"看懂"人类怎么玩，再自己摸索优化。

技术层面，团队设计了两阶段训练。第一阶段从单段演示中提取抽象意图，比如"拿到钥匙""开门"这些高层目标；第二阶段让AI在模拟环境中尝试复现，同时允许偏离演示路径探索更优解。

结果相当扎实。AI不仅成功通关，部分关卡还找到了比人类演示更高效的路线。这说明单条轨迹里的信息密度，远比想象中高。

更值得玩味的是应用场景。游戏是可控实验场，但类似逻辑可以迁移到机器人操作、自动驾驶这些"试错成本极高"的领域——你没法让无人车在真实路况撞一千次来学规则。

当然，演示质量仍是瓶颈。如果人类操作本身有瑕疵，AI会原样继承还是自主修正？论文没给出完整答案，但这正是下一步值得盯紧的方向。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

女子拿爱心冰箱的免费水洗脚，下一秒“现世报”滑倒跪地，网友：善有善报，恶有恶报

BRTV新闻 2026-05-08 21:12:25
879 跟贴 879
媒体：沙特被美国激怒海湾国家或将深化与中国关系

澎湃新闻 2026-05-08 17:48:29
3931 跟贴 3931

外卖小哥冒死冲进火场救火被物业收取50元“灭火器使用费”

闪电新闻 2026-05-09 09:31:06
7222 跟贴 7222

天舟飞船为什么不回收而是坠入大海？专家：增加返回功能会挤占运货空间，飞船大部分结构烧蚀气化，少量残骸不会造成威胁

极目新闻 2026-05-08 21:58:00
5544 跟贴 5544
后唐太祖李克用容貌被复原这个“东西方混血儿”长啥样？｜文史笔谈

封面新闻 2026-05-06 19:44:06
47 跟贴 47

茶颜悦色，装不下去了

中国新闻周刊 2026-05-07 22:15:57
298 跟贴 298

“排队3小时，打卡1分钟”，多景区迎“泼天流量”

澎湃新闻 2026-05-06 00:04:10
3858 跟贴 3858
襄阳百亩地疑遭奶牛场污染调查组：已送检11处水体翻耕300亩地，将依法依规处置

封面新闻 2026-05-09 11:24:05
74 跟贴 74

“排队火过迪士尼”？上海这个“小花园”一年只开1个月！最新：已增加每周开放时间！

新民晚报 2026-05-08 16:56:04
168 跟贴 168
河北多地漫天杨絮似大雪纷飞省绿办：多年前曾定下治理时间表每年都有打药等防治措施

闪电新闻 2026-05-09 12:40:08
158 跟贴 158
“你们下车吧，再打一辆车”，网约车司机提出要求，他转身上了驾驶座

环球网资讯 2026-05-09 11:57:10
20 跟贴 20
iOS 26.5下周正式推送，一口气上线五大新功能

环球网资讯 2026-05-08 10:49:06
542 跟贴 542
罕见！韩媒：韩国总统、国会议长、韩执政党党首同日落泪

环球网资讯 2026-05-09 11:57:09
35 跟贴 35
海关总署：前4个月中国货物贸易进出口总值增长14.9%

财联社 2026-05-09 10:57:06
1277 跟贴 1277
汉坦疫情船周日靠岸，港口工人抗议，卫生部门严阵以待：乘客按国籍乘小型充气艇上岸

红星新闻 2026-05-09 16:00:27
36 跟贴 36
中国气象局辟谣“将迎最热夏天”！汛期华南有阶段性高温热浪

南方都市报 2026-05-09 10:42:09
80 跟贴 80
厨房湿巾测评：KINBATA微生物超标，苏软软去油率不佳

南方都市报 2026-05-09 18:22:14
1 跟贴 1
增加受教育年限提升人才红利——“十五五”时期经济社会发展主要指标解读⑥

中国经济网 2026-05-09 07:40:09
9 跟贴 9
商务部：中俄贸易连续三年突破2000亿美元

界面新闻 2026-05-09 10:17:43
146 跟贴 146
比亚迪李云飞：不胜其烦！

南方都市报 2026-05-09 16:10:27
28 跟贴 28
新华全媒头条|“能源的饭碗必须端在自己手里”——我国加快能源强国建设筑牢安全发展根基

新华社 2026-05-09 00:26:03
235 跟贴 235
“点亮网络文明之光”2026年网上主题宣传活动在浙江宁波启动

金台资讯 2026-05-09 13:43:42
1 跟贴 1
乡村儿童音乐公益课堂怀安站：每个孩子心里，都有一条没走过的路

农视网 2026-05-09 18:23:27
4 跟贴 4
上海中年男子崩溃！邻居凌晨3点爬进自己家，还有更离谱举动……噩梦持续，警方无从插手

环球网资讯 2026-05-09 19:33:11
0 跟贴 0
事发北仑沿海中线！电瓶车闯红灯，出事了

北仑发布 2026-05-09 19:38:46
0 跟贴 0
知名五星级饭店起火！大量黑烟翻涌而出！官方通报

珠海消防 2026-05-09 19:35:21
0 跟贴 0
“4只皮皮虾1035元”当事人否认想吃白食，删除评论；隔壁海鲜店发声

上观新闻 2026-05-09 09:58:08
0 跟贴 0
路口贸然横穿，一秒酿成事故

贵港交警 2026-05-09 19:30:26
0 跟贴 0
盲人女孩走盲道被撞飞，肇事男子却逃逸！这事后续处理绝不该仅道歉

潇拾亿郎 2026-05-09 19:36:39
0 跟贴 0

老顾客为皮皮虾店发声：店里签字确认后才做，价格不合适包退

老顾客为皮皮虾店发声：店里签字确认后才做，价格不合适包退

映射生活的身影

2026-05-09 14:50:11

大厂永远理解不了梁文锋

凤凰网科技

2026-05-09 15:41:13

央视：邝兆镭昨日未加入U17国足合练，今日出战日本存疑

央视：邝兆镭昨日未加入U17国足合练，今日出战日本存疑

懂球帝

2026-05-09 14:37:04

长期吸烟的人，不妨自测一下烟瘾，如果小于3分，提示戒烟容易

长期吸烟的人，不妨自测一下烟瘾，如果小于3分，提示戒烟容易

垚垚分享健康

2026-05-09 15:59:17

下周，40℃要来了！气象专家回应“史上最热夏天”

下周，40℃要来了！气象专家回应“史上最热夏天”

新浪财经

2026-05-09 10:09:55

B费45%得票当选英格兰足球先生！专家投空白票抗议

B费45%得票当选英格兰足球先生！专家投空白票抗议

体坛周报

2026-05-09 12:07:36

国际足联主席回应来了，给全球球迷撂下狠话

国际足联主席回应来了，给全球球迷撂下狠话

回京历史梦

2026-05-09 11:50:11

河南博物院洗手间被指毫无隐私，女士进入洗手间必须路过男士小便池区域；回应：深表歉意，立马整改

河南博物院洗手间被指毫无隐私，女士进入洗手间必须路过男士小便池区域；回应：深表歉意，立马整改

环球网资讯

2026-05-09 11:06:24

3-0！美和+早田双逆转！日乒双杀德国队，决赛首队诞生，静候国乒

3-0！美和+早田双逆转！日乒双杀德国队，决赛首队诞生，静候国乒

大秦壁虎白话体育

2026-05-09 19:39:54

省下20亿这是好事啊！钱不拿来造航母，难道要交转播版权费不成？

省下20亿这是好事啊！钱不拿来造航母，难道要交转播版权费不成？

大又元

2026-05-09 16:06:44

韩国女队阵容引争议：故意安排输给孙颖莎的战术背后

韩国女队阵容引争议：故意安排输给孙颖莎的战术背后

林子说事

2026-05-09 11:12:41

猝死去世的人越来越多？医生再次强调：宁可吃猪肉，也别做这5事

猝死去世的人越来越多？医生再次强调：宁可吃猪肉，也别做这5事

垚垚分享健康

2026-05-09 17:53:13

开国十位大将代表的“山头”

祁州校尉

2026-05-09 17:00:15

海参崴的街头，谁在出卖我们的历史尊严？

海参崴的街头，谁在出卖我们的历史尊严？

迷世书童H9527

2026-05-07 14:55:09

康熙长子被圈禁26年，疯狂纳妃生下20个孩子，却因祸得福成赢家

康熙长子被圈禁26年，疯狂纳妃生下20个孩子，却因祸得福成赢家

浩渺青史

2026-05-06 00:41:01

5月20官宣三婚！头发都白了，何洁现状惹人心疼

5月20官宣三婚！头发都白了，何洁现状惹人心疼

陈意小可爱

2026-05-07 16:55:39

特朗普来华前夕，鲁比奥突然在台湾问题上改口，这番话笑里藏刀

特朗普来华前夕，鲁比奥突然在台湾问题上改口，这番话笑里藏刀

张斌说

2026-05-09 19:17:34

文班亚马这么打，森林狼是真没招

文班亚马这么打，森林狼是真没招

只关于篮球

2026-05-09 13:44:07

弘一法师悟道：人活着，其实就两件事，想通了，一辈子都顺了

弘一法师悟道：人活着，其实就两件事，想通了，一辈子都顺了

心理观察局

2026-05-09 09:10:05

26岁女学霸实名举报长江学者六年操控，顶尖高校至今沉默

26岁女学霸实名举报长江学者六年操控，顶尖高校至今沉默

原谅你

2026-05-07 18:08:08

字节漫游指南

有态度网友ytd

3478文章数 38关注度

往期回顾全部

科技要闻

美国政府强力下场苹果英特尔达成代工协议

头条要闻

王菲出新歌首用陕西话唱戏腔时隔24年与张艺谋再合作

头条要闻

王菲出新歌首用陕西话唱戏腔时隔24年与张艺谋再合作

体育要闻

成立128年后，这支升班马首夺顶级联赛冠军

娱乐要闻

50岁赵薇脸颊凹陷沧桑得认不出！

财经要闻

存储芯片上演造富潮

汽车要闻

轴距加长/智驾拉满阿维塔07L定位大五座SUV

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

艺术

亲子

本地

旅游

公开课

艺术要闻

齐白石紫藤蜜蜂

亲子要闻

别被骗，沈阳铁西公布147所合规幼儿园，孩子免费上托咋报销

本地新闻

用苏绣的方式，打开江西婺源

旅游要闻

告别“打卡式”旅游境外游客来杭15分钟即可换证自驾

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版