网易首页 > 网易号 > 正文 申请入驻

大模型研究: 社交场景下,AI讲义气吗?人类能信任它吗?

0
分享至

基本信息

Title:Playing repeated games with large language models

发表时间:2025.5.8

Journal:Nature human behavior

影响因子:15.9



省流总结

GPT-4 在涉及自利决策(如囚徒困境)时表现优异,展现出强烈的“理性自保”倾向,但在需要协调、轮流让步的情境(如性别之争)中表现拙劣,缺乏策略弹性和社会适应力。更值得注意的是,这些行为模式并非 prompt 的偶然产物,而是具有结构性的一致性。所幸,通过SCoT (社交链式思维,作者创新)提示,GPT-4 的协调行为得以显著提升,也更容易被人类误判为“有血有肉的对手”。

研究动机

在当今社会,人们对大语言模型(LLMs)的依赖日益加深,无论是信息获取、决策辅助,还是日常沟通,这些模型正逐步成为人类互动的常见对象。这一趋势也引发了一个根本性的问题:以GPT-4为代表的大语言模型,是否值得我们信任?它们是否具备足够的社会智能,能够作为可靠的合作伙伴,与人类或其他智能体进行有效的协作?尤其当这些互动是重复发生、甚至涉及自身与集体利益冲突时,以大语言模型为代表的AI是否仍然值得信任?

正是在这样的背景下,作者提出用“博弈行为”这一经典社会决策框架,系统研究大语言模型在合作与协调情境中的表现,借此评估它们在复杂社会互动中是否展现出类似人类的理性与可预测性,通过深入理解大模型的工作机制,为其未来的广泛应用奠定行为科学基础。

实验设计

作者采用了一种经典的实验方法——2×2博弈,即每个玩家在每轮博弈中只能选择两个选项之一,在这些博弈任务中,最具代表性的两个游戏是:囚徒困境和性别之争,具体来说:

囚徒困境是一个经典的游戏:想象你和你的搭档一起犯罪被抓了,警察把你们分开审讯,给出如下提议:

  • 如果你咬出对方,对方没招供,那你立刻释放,对方坐牢10年;
  • 如果你们都咬出对方,那你们各判5年;
  • 如果你们都不说,证据不足,各判1年。

现在,问题来了:你敢相信对方不会出卖你吗?假设你很想合作(都不说话,判一年),但又担心他出卖你(你就吃大亏)。你也可以先下手为强出卖他,确保自己不吃亏,……这就是所谓的“困境”:理性人都应该背叛(因为不论对方干什么,背叛都更划算),但如果大家都这么想,结果却比合作更糟糕。

性别之争也是当下比较有意思的游戏,简单来说就是你和你的另一半协商去哪里约会,假设你喜欢看足球,对方喜欢看芭蕾。你们都想一起行动,分开各看自己喜欢的反而谁都不开心。

游戏的规则是这样的:

  • 如果你们都去看足球:你很开心,对方稍微开心;
  • 如果你们都去看芭蕾:你稍微开心,对方很开心;
  • 如果你们没去同一个地方:你们都不开心。

这时候问题就来了:你让一次还是他让一次?你们能不能轮流迁就?这不是一个“最优解”的游戏,而是一个需要建立默契与协调机制的互动场景。人类往往会采取“轮流来”的方式,比如今天听你的、明天听我的。而大语言模型是否能学会轮流、配合、妥协,能否像人一样解决“偏好冲突中的合作问题”仍不清楚

在实验中,作者设计了多重对局,包括:模型与模型之间的对局(如GPT-4、Claude 2、LLaMA 2等)、模型与人工策略对局、模型与人类玩家博弈。为了为了深入理解大模型的决策过程,作者还设计了不同的提示词(Prompt)设置方式,包括:

基础提示:只给出游戏规则和历史记录,观察模型自然做出的选择;

行为暗示:向模型说明“对方可能会犯错”,模拟更真实的人类误操作,从而测试模型是否愿意原谅;

社交链式思维(SCoT)提示,也是本文的核心亮点之一:先让模型预测对方的下一步行为,再基于预测做出选择,这种设计引导模型进行“像人类一样的社会推理”。

基本假设

基于上面两个博弈任务,我们不禁会好奇,当LLMs面对重复的博弈场景时,它们如何选择策略?是只顾自己得分,还是会尝试与他人合作协调?

作者提出了三个核心假设:

  • LLM在自利型游戏中表现良好(如囚徒困境);
  • LLM在需要协调的游戏中(如性别之争)表现较差;
  • 可以通过特定“提示方法”(例如让它预测对方意图)来改善其行为。

核心发现

发现一:GPT-4 在以自利为导向的博弈中表现优越,尤其是在囚徒困境类游戏中

在评估特工如何合作和叛逃的经典囚徒困境中,作者发现 GPT-4 会反复报复,GPT-4 一旦发现对方背叛一次,就完全不再合作,哪怕之后对方持续合作,也不原谅,GPT-4 擅长这些游戏,因为它特别无情和自私

In the canonical Prisoner’s Dilemma, which assesses how agents cooperate and defect, we find that GPT-4 retaliates repeatedly, even after having experienced only one defection. Because this can indeed be the equilibrium individual-level strategy, GPT-4 is good at these games because it is particularly unforgiving and selfish.

GPT-4 never cooperates again when playing with an agent that defects once but then cooperates on every round thereafter. Thus, GPT-4 seems to be rather unforgiving in this set-up



Fig. 3: Overview of the Prisoner’s Dilemma. a, Heat maps showing the player 1 defection rate in each combination of players and the scores accrued by player 1 in each game. b, Example gameplays between GPT-4 and an agent that defects once and then cooperates, and between GPT-4 and text-davinci-003. These games are also highlighted in red in the heat maps.

发现二:GPT-4 在需要协调偏好的游戏(如性别之争)中表现差,无法建立合作机制

GPT-4 无法与简单的、类似人类的agent进行协调,无法捕捉“轮流合作”的模式,总是坚持自己偏好。GPT-4 不擅长这些游戏,因为它不协调

GPT-4 does not manage to coordinate with simple, human-like agents that alternate between options over trials. Thus, GPT-4 is bad at these games because it is uncoordinated

GPT-4 seemingly does not adjust its choices to the other player but instead keeps choosing its preferred option.



Fig. 5: Overview of the Battle of the Sexes. a, Heat maps showing rates of successful collaboration between the two players and the rates of player 1 choosing its preferred option football. GPT-4 SCoT and GPT-4 performance comparisons are highlighted in red. b, Gameplay between GPT-4 and an agent that alternates between the two options (left) and gameplay between GPT-4 and GPT-4 SCoT that represents a GPT-4 model prompted using the SCoT method to first predict the opponent’s move before making its own move by reasoning about its prediction (right). Both games are also highlighted in blue in the heat maps.

发现三:通过“社交链式思维(SCoT)提示”可以显著改善 GPT-4 的合作与协调行为

GPT-4 在通过预测对方意图之后,会从第5轮开始尝试轮流协调行为,更接近人类策略。

Applying this method improved GPT-4’s behaviour, and it started to alternate from round 5 onwards



Fig. 6: Prediction scenarios in the Battle of the Sexes. Top: GPT-4 is a player of the game and predicts the other player’s move. Bottom: GPT-4 is a mere observer of a game between player 1 and player 2 and predicts player 2’s move.

发现四:SCoT 提示还提升了人类对 LLM 的“类人性”认知,尤其在性别之争中提升显著

人类参与者在性别之争中与 SCoT 提示版本的 GPT-4 协作更成功,并更容易误以为对方是人类。

SCoT prompting leads to more successful coordination and joint cooperation between participants and LLMs and makes participants believe more frequently that the other player is human.

Author information

第一作者兼通讯作者:Elif Akata

Institute for Human-Centered AI, Helmholtz Munich, Oberschleißheim, Germany

慕尼黑亥姆霍兹中心 - Human-Centered 人工智能研究所(德国奥伯施莱斯海姆)

最后作者:Eric Schulz

Institute for Human-Centered AI, Helmholtz Munich, Oberschleißheim, Germany

慕尼黑亥姆霍兹中心 - Human-Centered 人工智能研究所(德国奥伯施莱斯海姆)

Abstract

Large language models (LLMs) are increasingly used in applications where they interact with humans and other agents. We propose to use behavioural game theory to study LLMs’ cooperation and coordination behaviour. Here we let different LLMs play finitely repeated 2 × 2 games with each other, with human-like strategies, and actual human players. Our results show that LLMs perform particularly well at self-interested games such as the iterated Prisoner’s Dilemma family. However, they behave suboptimally in games that require coordination, such as the Battle of the Sexes. We verify that these behavioural signatures are stable across robustness checks. We also show how GPT-4’s behaviour can be modulated by providing additional information about its opponent and by using a ‘social chain-of-thought’ strategy. This also leads to better scores and more successful coordination when interacting with human players. These results enrich our understanding of LLMs’ social behaviour and pave the way for a behavioural game theory for machines.

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蹊跷!上海阿姨感觉 “家里东西被移动过”!女儿一查:曾异常断电10分钟

蹊跷!上海阿姨感觉 “家里东西被移动过”!女儿一查:曾异常断电10分钟

上观新闻
2026-01-26 12:19:03
阿斯:皇马重拾全队协同高位逼抢,姆巴佩和维尼修斯参与其中

阿斯:皇马重拾全队协同高位逼抢,姆巴佩和维尼修斯参与其中

懂球帝
2026-01-26 22:06:19
联合国乱了?秘书长候选人诞生,对华态度坚决,中方看破美国心思

联合国乱了?秘书长候选人诞生,对华态度坚决,中方看破美国心思

通文知史
2026-01-25 21:30:02
燕云十六州,到底在哪?为何中原王朝300多年都收不回?

燕云十六州,到底在哪?为何中原王朝300多年都收不回?

长风文史
2026-01-24 19:30:27
军备反腐动真格!饭局上的肺腑之言,戳中亿万国人的心!

军备反腐动真格!饭局上的肺腑之言,戳中亿万国人的心!

达文西看世界
2026-01-26 21:41:28
我是真的想不通章泽天这波操作!32岁的年纪老公刘强东有钱有实力

我是真的想不通章泽天这波操作!32岁的年纪老公刘强东有钱有实力

小光侃娱乐
2026-01-26 20:05:03
华裔后代成日本女党首,短发干练颜值高,婚内出轨还拍大尺度写真

华裔后代成日本女党首,短发干练颜值高,婚内出轨还拍大尺度写真

牛牛叨史
2025-12-20 21:08:09
和李亚鹏先生的一面之缘

和李亚鹏先生的一面之缘

茅塞盾开本尊
2026-01-26 22:20:22
恐怖20-0!澳网第2位前八种子出局 萨巴伦卡创历史 王欣瑜目标8强

恐怖20-0!澳网第2位前八种子出局 萨巴伦卡创历史 王欣瑜目标8强

侃球熊弟
2026-01-26 00:20:03
国行iPhone Air,死于上市3个月后

国行iPhone Air,死于上市3个月后

雷科技
2026-01-25 21:31:22
鲈鱼卖不动了,菜市场摊贩愁得睡不着,家长称:这鱼不敢给孩子吃

鲈鱼卖不动了,菜市场摊贩愁得睡不着,家长称:这鱼不敢给孩子吃

原广工业
2026-01-20 12:22:36
“开年第一甜”韩剧的涨分秘诀

“开年第一甜”韩剧的涨分秘诀

犀牛娱乐
2026-01-25 21:36:26
2018年,意方单方面撕毁和中国企业的高铁合同,拒不支付 70 亿违约金,后续的下场如何?

2018年,意方单方面撕毁和中国企业的高铁合同,拒不支付 70 亿违约金,后续的下场如何?

文史明鉴
2026-01-26 17:18:15
离谱!挪威帝王蟹堆成山,中国人买一只却要花上千,原因太现实

离谱!挪威帝王蟹堆成山,中国人买一只却要花上千,原因太现实

李健政观察
2026-01-25 19:40:23
拒绝当冤大头!法国硬刚冯德莱恩:再援乌1分钱,就直接退出欧盟

拒绝当冤大头!法国硬刚冯德莱恩:再援乌1分钱,就直接退出欧盟

老嘪科普
2026-01-26 11:52:07
她赴英留学,却与上千外国男子有染并拍成视频,父母与她断绝关系

她赴英留学,却与上千外国男子有染并拍成视频,父母与她断绝关系

阿胡
2026-01-21 17:34:15
河南大学1.3亿元招标项目被指“以捐换标”,监督部门:已有人质疑,正在处理

河南大学1.3亿元招标项目被指“以捐换标”,监督部门:已有人质疑,正在处理

现代快报
2026-01-26 20:34:09
香港财库局与上金所签重磅协议:3年内计划储金超2000吨,香港黄金中央清算系统年内将试运行

香港财库局与上金所签重磅协议:3年内计划储金超2000吨,香港黄金中央清算系统年内将试运行

每日经济新闻
2026-01-26 12:27:05
许家印案“掀翻天”,涉案人员可能远超当年赖昌星的特大走私案

许家印案“掀翻天”,涉案人员可能远超当年赖昌星的特大走私案

小莜读史
2026-01-15 20:44:16
中瑞男团、中韩女团同组 | 伦敦世乒赛小组赛签表出炉

中瑞男团、中韩女团同组 | 伦敦世乒赛小组赛签表出炉

乒乓世界
2026-01-26 21:39:31
2026-01-26 22:56:49
PsyBrain脑心前沿
PsyBrain脑心前沿
追踪脑科学新动态,聚焦认知与神经新研究
136文章数 10关注度
往期回顾 全部

科技要闻

印奇再上牌桌,阶跃融资50亿

头条要闻

C919新年交付开门红 被指今年有望实现每15天造一架

头条要闻

C919新年交付开门红 被指今年有望实现每15天造一架

体育要闻

叛逆的大公子,要砸了贝克汉姆这块招牌

娱乐要闻

张雨绮被抵制成功!辽视春晚已将她除名

财经要闻

从美式斩杀线看中国社会的制度韧性构建

汽车要闻

宾利第四台Batur敞篷版发布 解锁四项定制创新

态度原创

家居
房产
数码
手机
教育

家居要闻

流韵雅居,让复杂变纯粹

房产要闻

突发!三亚官宣,调整安居房政策!

数码要闻

首发可用NVIDIA DLSS 4.5,480帧的《明日方舟:终末地》体验如何

手机要闻

小米REDMI Turbo5系列确认魏思琪主讲,卢伟冰赠其灭霸无限手套

教育要闻

取消中考选拔功能、普通高中全员直升 ,浙江嵊泗教改细节披露 ,2025学年全县266名填报普高的初三...

无障碍浏览 进入关怀版