网易首页 > 网易号 > 正文 申请入驻

GPT-4o玩《黑神话》!精英怪胜率超人类,无强化学习纯大模型方案

0
分享至

小明 发自 凹非寺
量子位 | 公众号 QbitAI

AI玩黑神话,第一个精英怪牯护院轻松拿捏啊。

有方向感,视角也没有问题。

躲闪劈棍很丝滑。

甚至在打鸦香客和牯护院时,AI的胜率已经超过人类。

而且是完全使用大模型玩,没有使用强化学习

阿里巴巴的研究人员们提出了一个新型VARP(视觉动作角色扮演)智能体框架。

它能直接将游戏截图作为输入,通过视觉语言模型推理,最终生成Python代码形式的动作,以此来操作游戏。

以玩《黑神话·悟空》为例,该智能体在90%简单和中等水平战斗场景中取胜。

GPT-4o、Claude 3.5都来迎战

研究人员以《黑神话·悟空》为研究平台,一共定义了12个任务,75%与战斗有关。

他们构建了一个人类操作数据集,包含键鼠操作和游戏截图,一共1000条有效数据。

每个操作都是由原子命令的各种组合组成的序列。原子命令包括轻攻、闪避、重攻击、回血等。

然后,他们提出了VARP智能体框架。

主要包含动作规划系统和人类引导轨迹系统。

其中动作规划系统由情境库、动作库和人类引导库组成,利用 VLMs 进行动作推理和生成,引入分解特定任务的辅助模块和自我优化的动作生成模块。

人类引导轨迹系统利用人类操作数据改进智能体性能,对于困难任务,通过查询人类引导库获取相似截图和操作,生成新的人类引导动作。

同时VARP还包含3个库:情景库、动作库和人工引导库。

这些库中存储了agent自我学习和人类指导的内容,可以进行检索和更新。

动作库中,“def new_func_a()”表示动作计划系统生成的新动作,“def new_func_h()”表示人导轨迹系统生成的动作。”def pre_func()”代表预定义的动作。

动作案例研究和相应的游戏截图。第一行和第二行中的操作是预定义的函数。第三行动作由人工制导轨迹系统生成。

SOAG会在玩家角色与敌人的每次战斗互动后总结第四行和第五行中的新动作,并将其存储在动作库中。

框架分别使用了GPT-4o(2024-0513版本)、Claude 3.5 Sonnet和Gemini 1.5 Pro。

对比人类和AI的表现结果,可以看到小怪部分AI们的表现达到人类玩家水平。

到了牯护院时,Claude 3.5 Sonnet败下阵来,GPT-4o胜率最高。

但是对于新手玩家普遍头疼的幽魂,AI们也都束手无策了。

另外研究还提到,由于VLMs推理速度受到限制,是无法实时输入每一帧画面的。它只能间隔输入关键帧,这也会导致AI在一些情况下错过boss攻击的关键信息。

以及由于游戏中没有明确的道路引导且存在很多空气墙,在没有人类引导下,智能体也不能自己找到正确的路线。

如上研究来自阿里团队,一共有5位作者。

后续相关代码和数据集有发布计划,感兴趣的童鞋可以蹲下。

One More Thing

AI打游戏并不是一个新鲜事了,比如AI基于强化学习方法打《星际争霸II》已经可以击败人类职业高手。

利用强化学习方案,往往需要输入大量对局。商汤此前训练的DI-star(监督学习+强化学习),就用了“16万场录像”和“1亿局对战”。

但是纯大模型也能打游戏,还是很出乎意料的。在本项研究中,数据集中的有效数据为1000条。

论文地址:
https://arxiv.org/abs/2409.12889

项目地址:
https://varp-agent.github.io/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
连底漆都刷不满,地球的水只占0.02%,凭什么撑起了整片海洋?

连底漆都刷不满,地球的水只占0.02%,凭什么撑起了整片海洋?

半解智士
2026-05-05 12:58:23
英格兰右后卫之争:为什么有人愿意"每天选他"

英格兰右后卫之争:为什么有人愿意"每天选他"

绿茵狂热者
2026-05-05 09:47:23
CBA季后赛,8进4!预测四强球队

CBA季后赛,8进4!预测四强球队

男足的小球童
2026-05-05 18:42:58
警告!旧金山或发生大地震,800万人面临危险

警告!旧金山或发生大地震,800万人面临危险

大洛杉矶LA
2026-05-05 06:11:30
韩氏父子700亿骗局:上海贵酒兴衰退市路

韩氏父子700亿骗局:上海贵酒兴衰退市路

陈腕特色体育解说
2026-05-05 14:35:16
美军出手!六艘伊朗快艇被击沉,伊朗惊人消息让人心惊胆战!

美军出手!六艘伊朗快艇被击沉,伊朗惊人消息让人心惊胆战!

菁菁子衿
2026-05-05 10:54:45
中美同时向全球下达禁令,各国都傻眼了!美媒:中国此举史无前例

中美同时向全球下达禁令,各国都傻眼了!美媒:中国此举史无前例

沧海一书客
2026-05-06 05:03:19
大S临终前执念全是汪小菲!私信字字恳切催人泪下,朱孝天公开发声

大S临终前执念全是汪小菲!私信字字恳切催人泪下,朱孝天公开发声

八卦王者
2026-05-05 16:05:43
林诗栋讲王皓甩脸后续,王楚钦赢球却留隐患,陪练坐错地方遭投诉

林诗栋讲王皓甩脸后续,王楚钦赢球却留隐患,陪练坐错地方遭投诉

三十年莱斯特城球迷
2026-05-05 22:47:18
冼恒汉按正军职离休,被留党察看两年,他认为上级对自己处理草率

冼恒汉按正军职离休,被留党察看两年,他认为上级对自己处理草率

翠羽
2026-05-05 10:15:09
女演员宣布:已产下一个大胖小子!

女演员宣布:已产下一个大胖小子!

喜欢历史的阿繁
2026-05-05 00:04:32
5.6凌晨世乒赛16强全:国乒强势反击大获全胜 韩乒完败 张本再爆冷

5.6凌晨世乒赛16强全:国乒强势反击大获全胜 韩乒完败 张本再爆冷

等等talk
2026-05-06 09:13:24
世界第一!亚洲第一!中国第一!中国曾规划三座高楼!现在怎样?

世界第一!亚洲第一!中国第一!中国曾规划三座高楼!现在怎样?

宝哥精彩赛事
2026-05-05 21:15:11
王思聪洛杉矶近照曝光:LV装扮显老态,钱难买回精气神

王思聪洛杉矶近照曝光:LV装扮显老态,钱难买回精气神

调侃国际观点
2026-05-06 04:09:41
脱单太难了!28岁女儿五一回家被母亲念叨五天,引发评论哭声一片

脱单太难了!28岁女儿五一回家被母亲念叨五天,引发评论哭声一片

火山詩话
2026-05-06 11:26:00
大众威然这次豁出去了!给出 12.29 万优惠,网友:夯爆了

大众威然这次豁出去了!给出 12.29 万优惠,网友:夯爆了

汽车网评
2026-05-05 23:10:28
伊朗一商场发生火灾,致8死36伤,现场画面显示该商场多层楼起火,大量黑烟升起

伊朗一商场发生火灾,致8死36伤,现场画面显示该商场多层楼起火,大量黑烟升起

极目新闻
2026-05-06 08:16:21
伊朗总统办公室官员否认总统辞职传闻

伊朗总统办公室官员否认总统辞职传闻

新华社
2026-05-05 23:07:08
球员通道画面流出!利物浦四大球星遭怒斥:不尊重曼联太轻浮

球员通道画面流出!利物浦四大球星遭怒斥:不尊重曼联太轻浮

夜白侃球
2026-05-06 09:25:01
普京丢地盘,俄军4月撤退116平方公里,战线首次明显后退

普京丢地盘,俄军4月撤退116平方公里,战线首次明显后退

桂系007
2026-05-04 15:43:34
2026-05-06 12:03:00
量子位 incentive-icons
量子位
追踪人工智能动态
12573文章数 176461关注度
往期回顾 全部

游戏要闻

索尼PS5独占新游惨被造谣黑人女同!玩家通关愤怒反击

头条要闻

牛弹琴:高市终于下跪了 中韩等亚洲人内心感到气愤

头条要闻

牛弹琴:高市终于下跪了 中韩等亚洲人内心感到气愤

体育要闻

全世界都等着看他笑话,他带国米拿下冠军

娱乐要闻

神仙友谊!杨紫连续10年为张一山庆生

财经要闻

人形机器人七小龙:谁真能卖 谁在讲故事?

科技要闻

告别废话文学与幻觉!GPT-5.5 Instant发布

汽车要闻

吉利原生新能源越野架构亮相 AI如何带来极致越野

态度原创

房产
教育
本地
亲子
军事航空

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

教育要闻

孩子摆烂躺平,家长放任不管能靠他自己好起来?

本地新闻

用青花瓷的方式,打开西溪湿地

亲子要闻

四个半月大的宝宝过隧道,下一秒表情亮了…… #睡个好觉

军事要闻

特朗普威胁伊朗不要向美国船开火

无障碍浏览 进入关怀版