网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

在经典经济博弈中测试的AI模型，揭示了与人类思维的重大差异

2026-01-08 19:00:33　来源: 白天的太阳晚上的月亮

四川举报

0

分享至

2024到2025年间，高等经济大学的研究团队做了个有意思的测试。

他们找了GPT-4o、Gemini、Claude、Llama这五种主流大语言模型，让它们玩一个简单的猜数字游戏。

游戏规则很明确，在0到100之间选个数，目标是最接近所有参与者平均值的三分之二。

本来想看看这些顶尖AI的表现有多出色，但后来发现，实验结果背后藏着的问题，比想象中更关键。

这个猜数字游戏不是随便设计的，它是凯恩斯“选美竞赛”理论的现代版本。

1936年凯恩斯就用报纸选美比赛打比方，说参与者选的不是自己觉得最美的，而是大多数人觉得最美的。

这种多层次推理，正是战略决策的核心。

研究团队设置了16个不同场景，每个模型在每个场景里都要重复50次选择，总共出了4000份回复。

场景变量很丰富，有的改了计算规则，用中位数或最大值代替平均值，有的给对手定了不同身份，比如经济学新生、会议专家，还有的给对手赋予了愤怒、悲伤这类情绪状态。

而且所有模型都没法从之前的轮次里学经验，只能靠自身推理。

人类在这个游戏里的表现早就有定论了。

1995年纳格尔的经典实验里，目标是平均值三分之二时，人类平均会选37，目标是一半时，平均选27。

但这些AI的表现完全不一样，所有模型选的数都远低于人类，有些甚至接近博弈论里的纳什均衡点，零。

就算是选数稍高的GPT-4o，也比人类平均水平低不少。更有意思的是模型规模的影响。

研究团队测试了不同参数量的Llama模型，从10亿到4050亿不等。

结果很明显，规模越小的模型，选数越接近人类，通常在50左右，规模越大，选数越低，越靠近理论预测的最优解。

这说明大模型确实能进行更深层次的思考，但这种思考，未必是件好事。

可能有人会觉得，AI选数更接近理论最优解，难道不是更理性、更聪明吗？我一开始也这么想，但深入分析后才发现，这恰恰暴露了AI的致命缺陷。

它默认对手会和自己一样进行深度战略推理，却完全忽略了人类决策里常见的情绪、直觉和有限理性。

还有个关键细节被忽略了。

在双人博弈里，选零其实是弱占优策略，不管对手选什么数，选零都不会吃亏，表现永远不会比其他选择差。

但所有AI模型都没认出这个逻辑，也没解释过相关思路，只是一个劲地对其他玩家的可能行为做逐步推理。

这和正规经济学训练里的思维方式，有着明显差距。AI对语境的敏感度倒是和人类高度吻合。

把游戏设定成电视竞赛，再用不同措辞描述提示，AI的反应和人类很像。

比如对手被描述成愤怒时，不管是人类还是AI，都倾向于选更高的数，对手是悲伤状态，选择幅度就会变小，如果对手被定义为更有分析能力，双方猜的数都会比面对直觉型对手时低。

其中GPT-4oMini和Llama对措辞变化的反应最强烈。

领导研究的德米特里・达加耶夫就说过，这些结果说明AI对游戏结构变化的反应和人类相似，但核心问题在于，AI总是高估对手的策略水平。

这种高估，不是简单的判断失误，而是对人类决策模式的根本误判。

这可不是单纯的学术问题。

现在AI已经开始在很多领域取代人类，提升业务流程的经济效率，但达加耶夫强调，很多决策里，类人行为依然至关重要。

AI的这种误判，放到现实场景里，很可能引发一系列问题。

就拿金融领域来说，2025年有家大型证券机构用GPT-4o辅助预测散户交易行为，结果因为算法低估了散户的非理性追涨杀跌，预测准确率降了不少，还让客户蒙受了直接损失。

商业定价领域也有类似情况，某头部电商用AI制定定价策略，因为高估了竞争对手的策略深度，把价格提了20%，最后市场份额掉了15%。

2025年不少学术研究都聚焦在LLM的博弈表现上，从囚徒困境到最后通牒游戏，相关探索越来越多。

有的研究提出了LLM-Nash框架，想指导AI代理的决策，还有的研究发现，人类往往期待AI表现出理性和合作倾向，这反而会进一步加剧决策偏差。

这项发表在《经济行为与组织杂志》上的研究，给AI应用提了个醒。

搞清楚AI在哪些地方和人类契合，哪些地方不契合，直接决定了这些系统在市场、政策和日常生活中的应用方式。

当AI被用来预测市场趋势、制定商业策略或辅助政策决策时，开发者和使用者都得清楚，这些系统可能因为过于理性，而无法准确模拟人类的实际行为。

AI确实在变得越来越聪明，但毫无疑问，它还需要学会“不那么聪明”。

只有真正理解了人类的有限理性、情绪和直觉，才能真正融入人类社会，发挥出应有的价值。

毕竟，在人类主导的世界里，脱离实际的超理性，从来都不是最优解。

声明：个人原创，仅供参考

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

美媒：特朗普作出迄今最直白的世界观表述

澎湃新闻 2026-01-09 13:57:08
1801 跟贴 1801
黄鹤楼景区应修北门？建议来了

极目新闻 2026-01-06 10:23:04
818 跟贴 818

全球用户大面积中招：鼠标突然就“坏了”！不少人按到“手抽筋”，重装卸载也不管用，罗技回应

每日经济新闻 2026-01-08 20:15:12
520 跟贴 520

重庆市涪陵区政府原一级巡视员赵昌辉接受审查调查

界面新闻 2026-01-09 19:04:28
0 跟贴 0
何中伟任浙江省副省长

新京报政事儿 2026-01-09 16:36:21
3 跟贴 3

事发济南！游客趵突泉拍照，珍稀古币掉入泉池！“想跳下去捞它”，后续来了

环球网资讯 2026-01-09 13:36:15
11 跟贴 11

广汽埃安称将对“湘超”冠军队票选13人赠车！永州足协回应

南方都市报 2026-01-09 15:38:21
6 跟贴 6
“放大版”和“缩小版”！四个月小女儿和爸爸长得超像犹如“复制粘贴”

北青网-北京青年报 2026-01-09 15:22:32
23 跟贴 23

加钱也买不到山姆499元羽绒服被卖爆武汉门店已断货

极目新闻 2026-01-09 12:45:05
0 跟贴 0
“金属牛市”恐怕今年就会戛然而止，金银铜被重点列出！

中国能源网 2026-01-09 09:54:12
149 跟贴 149
内存价格创历史新高商家喜忧参半

证券时报 2026-01-09 06:23:02
79 跟贴 79
灯光暗、跑道裂、公厕脏！深圳一公园被市民吐槽，街道办回应

南方都市报 2026-01-09 14:34:08
40 跟贴 40
热闻|英超争冠悬念再起！阿森纳0-0利物浦，布拉德利吊射中楣+伤退

齐鲁壹点 2026-01-09 07:00:13
87 跟贴 87
这回，国足让人满意了？

新民晚报 2026-01-09 10:23:18
174 跟贴 174
独家|万达4亿美元债展期方案获通过

财联社 2026-01-09 18:09:09
28 跟贴 28
英伟达聘请谷歌云高管担任其首席营销官

财联社 2026-01-09 13:26:13
30 跟贴 30
多平台公布涉“AI魔改”违规视频处置情况——今日辟谣（2026年1月9日）

今日辟谣 2026-01-09 18:52:11
3 跟贴 3
丽江，出现百万退单

中国新闻周刊 2026-01-09 20:16:32
0 跟贴 0
两年“风噪”夜夜难眠多方联动终除“心病”

南方都市报 2026-01-09 20:16:26
0 跟贴 0
【遭起】南部男子损坏交通护栏被处罚

南部微生活 2026-01-09 20:14:45
0 跟贴 0

被解放军战机锁定，F-16座舱里疯狂乱叫，台军飞行员只想退役保命

被解放军战机锁定，F-16座舱里疯狂乱叫，台军飞行员只想退役保命

古事寻踪记

2026-01-09 07:15:51

刘纪鹏教授：如果推行这个政策，大盘站稳5000点可期

刘纪鹏教授：如果推行这个政策，大盘站稳5000点可期

中中聊财经

2026-01-09 18:28:47

郁亮35年万科生涯落幕

每日经济新闻

2026-01-08 23:13:05

中国赚钱在美国花？老戏骨祖孙三代，在美奢华享乐过上人上人生活

中国赚钱在美国花？老戏骨祖孙三代，在美奢华享乐过上人上人生活

墨兰史书

2026-01-09 08:20:05

武汉一小学老师公积金曝光，在武汉属于什么水平！

武汉一小学老师公积金曝光，在武汉属于什么水平！

阿离家居

2026-01-07 13:04:42

苹果Apple Watch“房颤历史”功能获国家药品监督管理局批准

苹果Apple Watch“房颤历史”功能获国家药品监督管理局批准

IT之家

2026-01-09 10:25:06

老用户成“冤大头”？新号29元100G 老号89元不够用 3招破局不换号

老用户成“冤大头”？新号29元100G 老号89元不够用 3招破局不换号

Thurman在昆明

2026-01-03 15:59:21

项立刚再次鼓吹战争之思：最可怕的是，邪恶灵魂裹上爱国外衣

项立刚再次鼓吹战争之思：最可怕的是，邪恶灵魂裹上爱国外衣

读鬼笔记

2026-01-06 19:42:20

多哈冠军赛八强争夺战，国乒11胜1负优势巨大，陈熠迎来苦战

多哈冠军赛八强争夺战，国乒11胜1负优势巨大，陈熠迎来苦战

小鬼头体育

2026-01-09 05:22:13

张学良烟酒不离手活 101 岁，赵四小姐曝：软禁 55 年靠吃法续命

张学良烟酒不离手活 101 岁，赵四小姐曝：软禁 55 年靠吃法续命

唠叨说历史

2025-12-30 17:37:11

事发上海地铁！男子弄丢5万元婚戒，找到时戴在别人手上摘不下来……

事发上海地铁！男子弄丢5万元婚戒，找到时戴在别人手上摘不下来……

环球网资讯

2026-01-09 14:39:17

成龙在人民日报撰文

新民周刊

2026-01-08 18:58:40

女人坐了28年牢，出狱去办证，民警一查系统，当场愣了

女人坐了28年牢，出狱去办证，民警一查系统，当场愣了

卡西莫多的故事

2025-10-30 11:33:46

66岁倪萍庐山落泪：身家过亿难买儿媳，儿子拒婚背后隐情太扎心

66岁倪萍庐山落泪：身家过亿难买儿媳，儿子拒婚背后隐情太扎心

闻识

2026-01-09 14:52:01

广东4名干部被通报

南粤女声

2026-01-09 11:36:02

一觉醒来，伊朗采取极端措施了

牛弹琴

2026-01-09 07:41:40

鲁比奥称联合国无关紧要后，不到48小时，美国退出了66个国际组织

鲁比奥称联合国无关紧要后，不到48小时，美国退出了66个国际组织

古史青云啊

2026-01-09 19:39:48

赵睿歇了，高诗岩也歇了，唯独胡明轩不行？杜锋，请你放过他吧

赵睿歇了，高诗岩也歇了，唯独胡明轩不行？杜锋，请你放过他吧

多特体育说

2026-01-09 19:27:35

中方考虑断供稀土，日本不能接受！日媒：或对华断供光刻胶光刻机

中方考虑断供稀土，日本不能接受！日媒：或对华断供光刻胶光刻机

单手搓核弹

2026-01-09 10:12:43

不装了？当着联合国的面美国大使公然宣称：西半球就是我们的！

不装了？当着联合国的面美国大使公然宣称：西半球就是我们的！

嫹笔牂牂

2026-01-09 11:51:02

白天的太阳晚上的月亮

白天的太阳晚上的月亮

158文章数 49关注度

往期回顾全部

科技要闻

市场偏爱MiniMax：开盘涨42%，市值超700亿

头条要闻

女子"出轨"已婚985高校博士后看到其聊天记录吓傻了

头条要闻

女子"出轨"已婚985高校博士后看到其聊天记录吓傻了

体育要闻

金元时代最后的外援，来中国8年了

娱乐要闻

关晓彤鹿晗风波后露面不受影响状态佳

财经要闻

投资必看!瑞银李萌给出3大核心配置建议

汽车要闻

助跑三年的奇瑞接下来是加速还是起跳？

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

教育

旅游

家居

数码

这些新疗法，让化疗不再那么痛苦

教育要闻

直播预告！中小学英语数字化教学与实践成果展评 | AI+教师发展公益行·惠州站

旅游要闻

云南沙溪古镇的风景不错，但更吸引我的，还是这里的纯色山鹪莺

家居要闻

木色留白演绎现代自由

数码要闻

HKC亮相CES 2026：1080Hz刷新率等前沿显示技术引领风潮

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版