网易首页 > 网易号 > 正文 申请入驻

谷歌AlphaGo赢了围棋,却在游戏店栽了:人类3小时通关

0
分享至


1997年,IBM的深蓝击败国际象棋大师卡斯帕罗夫。2016年,AlphaGo战胜李世石。2025年,你走进一家游戏店,随手拿起一款没玩过的独立游戏——这时候,人类依然能碾压最顶尖的AI。

纽约大学计算机科学教授Julian Togelius团队的最新研究给出了一个反直觉的结论:在"零样本游戏学习"这个赛道上,人类玩家平均只需要3到10分钟理解核心机制,而当前最先进的AI模型面对完全陌生的游戏,结果几乎是确定的失败。

这不是怀旧情结。研究团队测试了多款大语言模型(LLM,即支撑ChatGPT等产品的底层技术)在全新游戏环境中的表现。当游戏规则需要实时探索、物理直觉和常识推理时,AI的表现堪称灾难。

AI的"肌肉记忆"陷阱

问题的根源在于训练方法的差异。强化学习(reinforcement learning)让AI通过数百万次试错迭代,在封闭环境中打磨出超人类表现。DeepMind 2015年征服Atari游戏库,OpenAI Five在Dota 2中击败职业选手,都是这一路径的胜利。

但Togelius指出,这种"暴力美学"有个致命盲区:AI学到的不是"理解游戏",而是"记住这个特定游戏的奖励函数"。换个角度说,AlphaGo能下赢围棋,是因为它把围棋的19×19棋盘当成了宇宙的全部真理。你让它改玩五子棋,它不会觉得"规则类似但更简单",而是直接归零重启。

人类玩家则完全不同。我们走进游戏店,看到平台跳跃类游戏,会本能地联想到重力、惯性、碰撞体积——这些来自现实世界的"迁移知识"。研究团队观察到,面对一款从未见过的2D解谜游戏,人类能在几分钟内建立假设、验证机制、调整策略,而AI往往卡在"这个按钮按下去会发生什么"的基础探索阶段。

「如果你把一个大语言模型扔进它没见过的游戏,结果几乎是确定的失败。」Togelius在论文中写道。

开放世界 vs. 封闭沙盒

游戏类型决定了AI的狼狈程度。在规则明确、目标单一的竞技游戏中(星际争霸2、Dota 2),AI可以靠算力堆出天花板级的微操。但一旦进入"开放目标"或"物理沙盒"类游戏——比如需要理解"这个箱子可以垫脚""那个杠杆能开门"的场景——AI的认知框架就会暴露短板。

研究团队设计了一组对比实验:同一款平台跳跃游戏,人类玩家平均死亡12次后找到通关路径;GPT-4级别的模型在相同时间限制内,有73%的概率完全无法触发关键机制,陷入随机按键的循环。

更讽刺的是,当AI被赋予"用自然语言描述当前状态"的能力时,表现反而下降。模型会生成冗长的场景分析("我看到一个红色方块在蓝色平台上方"),却延迟了实际操作——这种"想太多"的特质在实时游戏中是致命的。

人类玩家的优势不是反应速度,而是"常识压缩"的能力。我们知道火焰危险、重力向下、门通常需要钥匙或开关——这些来自现实世界的先验知识,让游戏学习变成了"模式匹配"而非"从零推导"。

通用智能的试金石

Togelius团队的研究动机远不止游戏本身。游戏被AI领域长期视为"通用智能的简化实验室",正是因为它们有清晰的目标、可量化的表现、可重复的环境。如果连这个简化版都搞不定,AGI(通用人工智能)的路线图就需要重新校准。

当前大模型的训练数据包含了海量游戏攻略、直播视频和论坛讨论,但这恰恰制造了"数据污染"的陷阱。当AI在《塞尔达传说》中表现优异时,很难判断它是"真正理解了物理谜题",还是"在训练集中见过类似布局"。

研究团队提出的解决方案指向"具身认知"(embodied cognition)——让AI像人类一样,通过物理交互积累世界模型,而非仅靠文本和像素预测。这解释了为什么机器人领域的进展(波士顿动力的Atlas、Figure AI的人形机)与游戏AI形成了有趣的对照:前者笨拙但适应性强,后者华丽却脆弱。

「游戏测试揭示了一个被忽视的维度:智能不仅是解决问题,更是快速定义问题。」论文合著者、MIT博士后研究员Anurag Banerjee补充道。

玩家的隐藏价值

这项研究对游戏行业有直接的商业含义。 procedurally generated games(程序化生成游戏,如《我的世界》《无人深空》)依赖算法创造无限内容,但测试这些内容的可玩性至今仍需要大量人类QA。如果AI无法像人类一样"盲玩"新游戏,自动化测试的愿景就存在根本性的天花板。

更深层的问题关乎AI产品的设计哲学。ChatGPT和Claude等工具被包装为"通用助手",但游戏测试表明,它们的"通用性"是有边界的——高度依赖训练数据的分布,对分布外的任务缺乏人类式的弹性。

Togelius在访谈中打了个比方:「现在的AI像是那种考试前把整本教科书背下来的学生,题目稍微变个花样就懵。人类玩家则是真正理解了概念,所以能应付没见过的题型。」

这个类比或许不够严谨,但指向了一个紧迫的研发方向。2024年以来,多家AI实验室将"智能体"(agent)能力作为优先目标,试图让模型不仅能对话,还能在数字环境中自主行动。游戏,作为最丰富、最安全、最便宜的数字环境,正在成为这场竞赛的主战场。

谷歌DeepMind的SIMA项目、OpenAI的"Operator"、Anthropic的"Computer Use"功能,都在尝试突破"零样本游戏学习"的瓶颈。但Togelius的论文提供了一个冷静的基准线:在通用游戏智能这个指标上,人类依然领先至少一个数量级。

下一次当你因为手残被游戏Boss虐到摔手柄时,可以换个角度安慰自己:你面对陌生机制时的适应速度,仍然是价值数十亿美元的AI产业尚未攻克的堡垒。问题是,这个领先优势,我们还能保持多久?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
形势大变,以德为首的西方国家齐发声:中国已在换电关键领域崛起

形势大变,以德为首的西方国家齐发声:中国已在换电关键领域崛起

无月可归辛
2026-04-08 11:04:56
悲催!东莞一工厂因拖欠近两年租金及违约金660万,被限十日搬离

悲催!东莞一工厂因拖欠近两年租金及违约金660万,被限十日搬离

火山詩话
2026-04-08 08:33:23
中俄动作都很快,审判已开始,高市被催下台,特朗普也炮轰日本

中俄动作都很快,审判已开始,高市被催下台,特朗普也炮轰日本

南宗历史
2026-04-08 17:23:02
令人惊讶!那些喜欢嫖娼的男性,竟在某些方面存在这几个共同特征

令人惊讶!那些喜欢嫖娼的男性,竟在某些方面存在这几个共同特征

皓皓情感说
2026-04-07 23:33:28
嫣然回应陈光标捐千万!钱已收到,但无法解决租金,律师再曝猛料

嫣然回应陈光标捐千万!钱已收到,但无法解决租金,律师再曝猛料

老黯谈娱
2026-04-09 00:51:01
恭喜这位中国王牌锋霸,已获得英国劳工证,将出战英超青年联赛

恭喜这位中国王牌锋霸,已获得英国劳工证,将出战英超青年联赛

懂个球
2026-04-08 23:02:57
张怡宁买菜被嘲寒酸,17年后大魔王打脸港媒

张怡宁买菜被嘲寒酸,17年后大魔王打脸港媒

悠悠说世界
2026-04-08 20:25:56
谋女郎刘浩存太绝了,这灰衣黑裤下的逆天长腿,谁看了不迷糊?

谋女郎刘浩存太绝了,这灰衣黑裤下的逆天长腿,谁看了不迷糊?

娱乐领航家
2026-04-08 22:00:03
越南选出新领导层,哪些变与不变?

越南选出新领导层,哪些变与不变?

新民周刊
2026-04-08 09:10:05
无视停战协议,以色列疯狂打击,特朗普罕见失声,巴总理前后两难

无视停战协议,以色列疯狂打击,特朗普罕见失声,巴总理前后两难

书纪文谭
2026-04-08 13:45:53
伊朗突然接受临时停火原来是这个原因

伊朗突然接受临时停火原来是这个原因

八桂知事
2026-04-08 17:16:20
学费大调整!2026年教育收费全面改革,5大变化直接影响每个家庭

学费大调整!2026年教育收费全面改革,5大变化直接影响每个家庭

复转这些年
2026-04-05 18:03:58
发达了!广西一男子全包家族清明拜祖费用,网友:这就是光宗耀祖

发达了!广西一男子全包家族清明拜祖费用,网友:这就是光宗耀祖

火山詩话
2026-04-07 18:41:53
全红婵遭群聊辱骂再升级!国家一锤定音,主谋被扒,势力大也没用

全红婵遭群聊辱骂再升级!国家一锤定音,主谋被扒,势力大也没用

揽星河的笔记
2026-04-08 20:18:29
狂轰21-2逆转!郭昊文20+8+9同曦双杀北控 佩里空砍31+8

狂轰21-2逆转!郭昊文20+8+9同曦双杀北控 佩里空砍31+8

醉卧浮生
2026-04-08 21:38:53
项立刚:光刻机这颗明珠很快要变成玻璃珠了!中国已拿下光刻机

项立刚:光刻机这颗明珠很快要变成玻璃珠了!中国已拿下光刻机

Thurman在昆明
2026-04-08 03:08:38
韩国女星怀孕后,每天和丈夫一起洗澡,节目画面公开后惊呆全场

韩国女星怀孕后,每天和丈夫一起洗澡,节目画面公开后惊呆全场

好贤观史记
2026-04-07 11:26:38
原来我们都被骗了?离婚无儿无女的尼格买提,如今已活成人生赢家

原来我们都被骗了?离婚无儿无女的尼格买提,如今已活成人生赢家

做一个合格的吃瓜群众
2026-02-07 08:42:02
明天上海或迎今年首个30℃,大风雷雨也来了,气象部门:4月上旬“破三”不多见

明天上海或迎今年首个30℃,大风雷雨也来了,气象部门:4月上旬“破三”不多见

纵相新闻
2026-04-09 00:44:05
这是我见过最富态的女性,没有之一

这是我见过最富态的女性,没有之一

动物奇奇怪怪
2026-04-09 01:48:19
2026-04-09 03:40:49
灰度测试中
灰度测试中
生活正在重构,目前还在灰度测试阶段,暂不全量发布。
946文章数 12关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

伊朗武装部队:伊朗对美以绝不信任

头条要闻

伊朗武装部队:伊朗对美以绝不信任

体育要闻

40岁,但实力倒退12年

娱乐要闻

侯佩岑全家悉尼度假,一家四口幸福满溢

财经要闻

天津海河乳业回应直播间涉黄

汽车要闻

20万级满配华为全家桶 华境S是懂家庭的大六座

态度原创

本地
数码
房产
旅游
公开课

本地新闻

跟着歌声游安徽,听古村回响

数码要闻

小米多款新品本月发,看看你期待哪款?

房产要闻

正式动工!珠城马场地块,签约华尔道夫!

旅游要闻

三大花海已浪漫盛放!来这里“花”点时间!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版