网易首页 > 网易号 > 正文 申请入驻

基于大型语言模型的游戏智能体综述

0
分享至

来源:专知

游戏智能体的发展在推进向人工通用智能(AGI)的道路上扮演着至关重要的角色。大型语言模型(LLMs)及其多模态对应物(MLLMs)的进展为在复杂的电脑游戏环境中赋予游戏智能体类似人类的决策能力提供了前所未有的机会。本文从一个全面的视角对基于LLM的游戏智能体进行了综述。首先,我们介绍了基于LLM游戏智能体的概念架构,围绕六个基本功能组件:感知、记忆、思考、角色扮演、行动和学习。其次,我们调研了文献中记录的现有代表性的基于LLM游戏智能体,这些智能体在方法论和跨六大游戏类型的适应性灵活性方面进行了探讨,包括冒险、沟通、竞争、合作、模拟以及制作与探索游戏。最后,我们展望了这一新兴领域未来研究和发展的方向。维护并可访问的相关论文精选列表位于:https://github.com/git-disl/awesome-LLM-game-agent-papers。

智能在代理与环境的互动中以及作为感觉运动活动的结果而出现。——体现认知假说 [1]

大型语言模型(LLMs),如ChatGPT [2]所示,代表了自然语言理解(NLU)和生成性人工智能(Gen-AI)中的一个重要里程碑。通过在包含数百亿参数的大量多样化网络来源上进行生成性训练,LLMs展示了从庞大文本语料库中概括知识的惊人能力,并以接近人类水平的NLU表现展示对话智能。多模态LLMs(MLLMs),如GPT-4V [3]和Gemini [4]的出现,标志着另一个里程碑,使LLMs能够感知和理解视觉输入。我们推测,LLM技术的成功为追求类人人工通用智能(AGI)提供了前所未有的机会:以前认为仅限于人类的认知能力,如推理、规划和反思,以及自我控制、自我理解和自我改进的程度,现在通过适当提示集成了内置认知智能的LLMs来实现。

我们将基于LLM的智能体(LLMA)定义为一个智能实体,它使用LLMs1作为执行类人决策过程的核心组件 [5]。尽管LLMAs能够进行类似人类的认知处理,但现有LLMAs与类人AGI之间的区别是显而易见的:当前的LLMAs依赖于解码和概括来自预训练数据的预先存在的知识 [6],而AGI能够通过在现实世界中的实验和经验发现和学习新知识 [7; 8]。受到人类婴儿智力发展过程的启发,体现认知假说 [1] 假设智能体的智能源于观察和与其环境的互动,即,将智能体植入一个集成了物理、社会和语言经验的世界对于促进有利于发展类人智能的条件至关重要。

数字游戏被认为是培养AI智能体的理想环境,因为它们具有复杂性、多样性、可控性、安全性和可复制性。从经典的国际象棋和扑克游戏 [9; 10; 11] 到现代视频游戏如Atari游戏 [12]、星际争霸II [13]、Minecraft [14] 和DOTA II [15],长期以来一直是推进AI研究的工具。与基于传统强化学习(RL)的智能体 [10; 16; 17; 18] 不同,这些智能体通过行为级策略学习做出决策,目标是最大化预期奖励,构建能够运用认知能力获得游戏玩法基本洞察力的基于LLM的游戏智能体(LLMGAs)可能更贴近AGI的追求。

先前关于LLMs [19; 20; 21] 或LLMAs [22; 23; 24] 的综述论文主要关注审查行业和学术研究团队开发的现有LLMs,以及LLMAs的一般应用,较少关注游戏代理领域。同时期的综述论文 [25; 26] 显著强调了游戏开发,并涵盖了有限数量的LLMGAs出版物。为了弥补这一差距,本文试图对LLMGAs的最新发展进行全面和系统的综述。具体而言,本综述分为三个相辅相成的部分:首先,我们提供了一个统一的参考框架,在其中我们描述了构建LLMGAs所需的基本模块,涵盖六个核心功能组件:感知、记忆、思考、角色扮演、行动和学习。其次,我们介绍了一个将现有文献分类为六个游戏类别的分类法,包括冒险、竞争、合作、模拟和制作与探索。对于每个类别,我们描述了技术挑战、支持的游戏环境,以及常用的优化策略。在第三部分和最后一部分,我们设想LLMGAs未来进步的不同方向。

总之,这篇综述论文作为对LLMGAs文献的全面回顾,提供了六个游戏类别的分类,以增强理解并促进各种LLMGAs的开发和评估。它旨在促进这一新兴研究领域的进步,并激发LLMGAs的研究和开发中的进一步创新。鉴于这是一个新兴且蓬勃发展的研究领域,这篇综述论文将持续更新,以跟踪最新研究。维护并可访问的相关文献精选列表位于https://github.com/git-disl/awesome-LLM-game-agent-papers。

统一的LLMGAs架构

图1提供了LLMGAs的概念架构,包括六个基本功能组件及其工作流程:对于每个游戏步骤,感知模块捕获游戏状态信息,为智能体理解其当前环境提供必要的数据。思考模块处理感知到的信息,基于推理、规划和反思生成思考,以便做出明智的决策。记忆作为一个外部存储,过去的经验、知识和精心挑选的技能被保留,并可以为将来使用而检索。角色扮演模块使智能体能够在游戏中模拟特定角色,展示与每个角色的特征和目标一致的可信行为。行动模块将生成的文本决策转换为可执行的动作,允许智能体有效地与游戏元素互动和操纵。学习模块通过在游戏环境中积累的经验和互动,不断改善智能体的认知和游戏技能。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
但斌最新演讲:不要错失一个伟大的时代

但斌最新演讲:不要错失一个伟大的时代

格隆汇
2026-07-02 20:28:43
王曼昱/蒯曼直落三局 晋级WTT美国大满贯女双决赛

王曼昱/蒯曼直落三局 晋级WTT美国大满贯女双决赛

北青网-北京青年报
2026-07-03 10:54:18
C罗哭了:若塔在天堂指引我们 赛前就预料到会有点球 相信自己能进

C罗哭了:若塔在天堂指引我们 赛前就预料到会有点球 相信自己能进

风过乡
2026-07-03 10:09:22
WTT大爆冷!世冠一输再输,日乒女队3-0零封,国乒新星全胜立大功

WTT大爆冷!世冠一输再输,日乒女队3-0零封,国乒新星全胜立大功

刘哥谈体育
2026-07-03 13:08:39
国乒16强全军覆没 比惨败更可怕的是这3件事 林诗栋或打不回来了

国乒16强全军覆没 比惨败更可怕的是这3件事 林诗栋或打不回来了

南海浪花
2026-07-03 12:32:24
世界杯刚出线!佛得角转头就把公务车全换成了比亚迪

世界杯刚出线!佛得角转头就把公务车全换成了比亚迪

快科技
2026-07-01 19:20:05
腾讯终于被逼走了,估计这是深圳房东做过最蠢的一件事

腾讯终于被逼走了,估计这是深圳房东做过最蠢的一件事

流苏晚晴
2026-07-02 19:35:38
女子惊呆!人在广东却收到上海亚朵5晚入住订单,前台电话问什么时候退房

女子惊呆!人在广东却收到上海亚朵5晚入住订单,前台电话问什么时候退房

新民晚报
2026-07-03 12:11:57
刚刚预报:有大到暴雨!天津雨情有变!今日高温飙至37℃+

刚刚预报:有大到暴雨!天津雨情有变!今日高温飙至37℃+

天津人
2026-07-03 10:32:37
全国统一新规7月1日执行,年满65岁老人注意,5件好事提前清楚

全国统一新规7月1日执行,年满65岁老人注意,5件好事提前清楚

三农雷哥
2026-07-02 17:04:29
1965年,毛主席对官二代留下2大预言,20年后,竟一一应验

1965年,毛主席对官二代留下2大预言,20年后,竟一一应验

墨策史
2026-07-03 00:07:52
WTT美国大满贯女单8强战:张本美和强势晋级蒯曼迎考验

WTT美国大满贯女单8强战:张本美和强势晋级蒯曼迎考验

舊事別提
2026-07-01 22:50:45
WTT美国大满贯:大爆冷!国乒女单3人被淘汰,王艺迪11:1世界冠军

WTT美国大满贯:大爆冷!国乒女单3人被淘汰,王艺迪11:1世界冠军

国乒二三事
2026-07-03 05:55:12
陈麟,任成都市政府副市长!武汉市委统战部副部长何文娟,拟任新职!

陈麟,任成都市政府副市长!武汉市委统战部副部长何文娟,拟任新职!

王姐懒人家常菜
2026-07-03 13:10:20
近日,沈腾一家人在阿那亚被拍到,他和老婆王琦,孩子父母都在,王琦目测最少160斤,腰粗膀圆虎背熊腰,现在就是普通大妈的形象

近日,沈腾一家人在阿那亚被拍到,他和老婆王琦,孩子父母都在,王琦目测最少160斤,腰粗膀圆虎背熊腰,现在就是普通大妈的形象

牛油果生活观
2026-07-02 17:32:53
这很科学:89%的人幻想过同时和多人发生性行为,算精神出轨吗?

这很科学:89%的人幻想过同时和多人发生性行为,算精神出轨吗?

宇宙时空
2026-05-26 18:20:10
“封锁”台湾可能吗?

“封锁”台湾可能吗?

野书文
2026-07-02 14:57:01
省市合并,又一枪打响了

省市合并,又一枪打响了

国民经略
2026-07-02 11:55:33
HTC手机不死:但公司已转型的你快不认识

HTC手机不死:但公司已转型的你快不认识

快科技
2026-07-03 09:24:05
刘强东没心情谈兄弟情义了

刘强东没心情谈兄弟情义了

正见TrueView
2026-07-02 12:42:07
2026-07-03 14:39:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4864文章数 37483关注度
往期回顾 全部

科技要闻

特斯拉交付超预期7.4万辆,股价却大跌7.5%

头条要闻

曾一次性选出100名副会长 "中字头"协会会长任上被查

头条要闻

曾一次性选出100名副会长 "中字头"协会会长任上被查

体育要闻

C罗穿已故队友若塔球衣谢场 眼中含泪

娱乐要闻

黄晓明深夜约会美女,分手原因曝光

财经要闻

AI“鬼故事”不断,市场开始重估?

汽车要闻

极氪9X五座版官宣,如图!

态度原创

手机
家居
房产
健康
数码

手机要闻

苹果iPhone 18 Pro Max电池首曝:5187mAh容量,欣旺达生产

家居要闻

传奇筑 日常诗

房产要闻

好惨!房地产专业,正在海南消失!

这4类消化病患者 吃粘食管住嘴

数码要闻

299元双8K旗舰款!雷神X7s Pro Max鼠标预售:全球首发PAW3955 Turbo

无障碍浏览 进入关怀版