网易首页 > 网易号 > 正文 申请入驻

不用喂数据,AI也能玩懂《逆转裁判》了

0
分享至

这些年来,AI打游戏的出色表现已经让人见怪不怪了。

2018年《星际争霸》举办了AI挑战赛,参赛队伍八仙过海、各显神通;2019年,《王者荣耀》的绝悟在世界冠军杯表演赛中打赢了五个现役职业选手;2022年,《暗区突围》推出了号称全球首个能用语音指挥的AI 队友F.A.C.U.L.,直接拉满了竞技类游戏的最高配置。

不过,这些AI玩家都属于“单游戏智能体”,专门针对单一游戏训练,且需要海量数据支持。

说人话就是,这些AI必须提前学习识别场景中的建筑、物体、装饰、可交互物件,对局中的微操和战术配合,也只能靠人工标记和强化训练,投入游戏中使用还会耗费大量算力。

即便是谷歌2022年推出的多游戏智能体Transformer,能玩41款雅达利游戏,但也依赖于大量预先学习的数据。

说白了,它们都必须模仿人类,需要靠“看攻略”来维持智商。

但最近,加州大学圣地亚哥分校的Hao AI实验室进行了一项特别的AI推理能力测试,他们选取了四个不同的AI模型,在没有任预先前训练的情况下,直接让它们玩《逆转裁判》——四位“参赛选手”分别是Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 Maverick以及OpenAI o1。

换句话说,整个过程需要AI自主理解游戏画面、剧情与机制,并推动游戏进程——几乎和第一次接触这款游戏的新玩家没什么区别。

而最终的结果也令人意外:Llama-4 Maverick在游戏一开始就早早出局,Gemini 2.5 Pro和Claude 3.7 Sonnet进入了第二章《逆转姐妹》,而OpenAI o1则是一口气打到了第二集结尾,虽然没有完全通关,但表现令人称道。

为什么选择《逆转裁判》来考验AI?

根据Hao AI实验室的解释,主要目的有三个:一是为了考验AI的长语境推理能力,《逆转裁判》需要AI交叉引用先前的对话和证据,发现其中的矛盾;二是考验视觉理解能力,观察AI能否辨认出、反驳虚假陈述的图像;三是考验动态决策能力,何时施压、出示证据或隐瞒,AI需要在有限的试错次数内做出正确的选择。

而最终,AI也的确仅依靠自身的推理能力,就能够表现出了接近人类的理解和处理问题能力。

在打游戏这件事上,AI显然变得越来越聪明了。

五个月前,在《精灵宝可梦 红/绿》的测试中,Claude 3.0 Sonnet还没法走出真新镇,如今迭代过的Claude 3.7 Sonnet,已经能在游戏中完成超过30000次互动,并自主击败三位道馆馆长。可以想见,OpenAI通关《逆转裁判》大概也只是时间问题。

Claude 3.7 Sonnet玩《精灵宝可梦 红/绿》的数据

X轴为交互次数,y轴为进度成就,包括收集道具、抵达区域或击败BOSS

武能架枪丢手雷,文能拍桌喊异议,随着AI特定游戏走向跨游戏泛用,或许在不久的未来,我们真能拥有一个全能的AI队友,既能在FPS里“指哪打哪”,又能一起在RPG里推理解谜,不拖后腿、不吵架、不掉线,最重要的是——永远不会放你鸽子。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刚毕业的我给富婆当司机,一次她来我家,对我提出了一个要求

刚毕业的我给富婆当司机,一次她来我家,对我提出了一个要求

青青会讲故事
2025-03-29 13:22:24
研究发现:那些长期喝酒的老人,到七十岁以后,大多变成了这样

研究发现:那些长期喝酒的老人,到七十岁以后,大多变成了这样

泠泠说史
2025-09-30 10:21:48
秦朝竹简破译,历史再无秘密!秦始皇被黑2000年,这下“大白”了

秦朝竹简破译,历史再无秘密!秦始皇被黑2000年,这下“大白”了

铭记历史呀
2026-01-16 14:13:16
你去看一个人的家里,他过得好不好,你就去看这个人,这个家里…

你去看一个人的家里,他过得好不好,你就去看这个人,这个家里…

明智家庭教育
2026-01-15 22:33:50
单论军事指挥能力而言,十大元帅该怎么排名,徐帅肯定不是第八

单论军事指挥能力而言,十大元帅该怎么排名,徐帅肯定不是第八

兴趣知识
2026-01-16 14:56:20
秘书:一种精密的中介者

秘书:一种精密的中介者

疾跑的小蜗牛
2026-01-16 23:09:20
明天四九第一天,牢记“吃三样,喝一汤,忌二事”习俗,养精蓄锐

明天四九第一天,牢记“吃三样,喝一汤,忌二事”习俗,养精蓄锐

花小厨
2026-01-16 15:37:38
伊朗高层48小时转移15亿美元出境,哈梅内伊儿子转了3.28亿美元

伊朗高层48小时转移15亿美元出境,哈梅内伊儿子转了3.28亿美元

桂系007
2026-01-15 14:15:21
广东将遇“过山车式”气温升降

广东将遇“过山车式”气温升降

中国能源网
2026-01-16 17:58:04
章泽天播客“翻车”:在深度内容面前,资本不是万能的

章泽天播客“翻车”:在深度内容面前,资本不是万能的

陈列共和
2026-01-16 21:31:19
顶着骂名给中国送技术,年薪超4亿的她,为何敢和美国对着干

顶着骂名给中国送技术,年薪超4亿的她,为何敢和美国对着干

余們搞笑段子
2026-01-17 01:29:05
克鲁尼举家“逃离美国”?川普一语戳破好莱坞左派的虚伪

克鲁尼举家“逃离美国”?川普一语戳破好莱坞左派的虚伪

斌闻天下
2026-01-14 07:15:03
4个老婆,全家移民,享受正师级待遇,潘长江身上哪个标签是真的

4个老婆,全家移民,享受正师级待遇,潘长江身上哪个标签是真的

春秋论娱
2025-12-30 07:19:06
“特朗普级”战列舰,造价公布

“特朗普级”战列舰,造价公布

极目新闻
2026-01-16 11:58:33
续约反转!皇马新帅变阵,维尼修斯回归左路开心,姆巴佩搭档确定

续约反转!皇马新帅变阵,维尼修斯回归左路开心,姆巴佩搭档确定

万花筒体育球球
2026-01-16 19:18:41
花生再次被关注!调查发现:糖尿病常吃花生,不过半年或有6好处

花生再次被关注!调查发现:糖尿病常吃花生,不过半年或有6好处

蜉蝣说
2025-11-20 14:40:39
比恒大还惨!中国第二大民企轰然倒塌,负债7500亿,创始人被带走

比恒大还惨!中国第二大民企轰然倒塌,负债7500亿,创始人被带走

甜柠聊史
2025-12-24 18:22:43
《爸爸去哪儿》夏天长这么大了!暂不考虑进娱乐圈

《爸爸去哪儿》夏天长这么大了!暂不考虑进娱乐圈

娱乐顺风车666
2026-01-16 12:02:48
向太太敢说了!向华强今年已经78了,但是她和向华强还有X生活!

向太太敢说了!向华强今年已经78了,但是她和向华强还有X生活!

心静物娱
2025-12-24 11:02:28
U23亚洲杯神剧情:东南亚劲旅加时激战3-2绝杀晋级

U23亚洲杯神剧情:东南亚劲旅加时激战3-2绝杀晋级

阿衃体育
2026-01-17 02:44:32
2026-01-17 03:32:49
游研社 incentive-icons
游研社
为你带来有趣而专业的游戏内容
7057文章数 85865关注度
往期回顾 全部

游戏要闻

为什么CF迷失边城没人玩了?热度连新寂静村一半都不如

头条要闻

美媒披露:美国出动海军陆战队和福特号航母

头条要闻

美媒披露:美国出动海军陆战队和福特号航母

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

房产
健康
教育
数码
手机

房产要闻

喜封金顶 臻境初呈丨中粮·铂悦壹号3#楼封顶大吉!

血常规3项异常,是身体警报!

教育要闻

初试成绩出来了!404分...

数码要闻

熊猫MX34U7 34英寸带鱼屏显示器发布,售价1299元

手机要闻

真我Power再曝,6.78英寸曲面屏、万级大电池

无障碍浏览 进入关怀版