网易首页 > 网易号 > 正文 申请入驻

【闲聊杂谈】思想的多样性:博弈论的有效与无效

0
分享至

来源:宽远资产


物理学家凯莉·克兰西在《游戏的力量》中为我们展开了一部恢弘的博弈论历史画卷。她将游戏描绘为一场深远的探险,从远古的骰子游戏到现代的虚拟现实,游戏的演变不仅反映了技术的进步,也映射出人类对规则、策略和命运的探索。作者告诉我们,世界不是线性的,也不是逻辑所能穷尽的。我们所能做的,只是成为一个更清醒的玩家。我们十分关注作者对于博弈论的观点:博弈论作为一种理论工具,虽然承诺能揭示理性与优化的真谛,但在实践中却常常忽视了人类行为的复杂性和社会背景的多样性。

■ “极小化极大策略”

整个20世纪20年代,数学家和物理学家冯·诺依曼在基础数学和量子物理学方面发表了开创性的研究成果,探讨了原子的概率性质。1926年,他在一次关于博弈的演讲中,以附带的形式提出了博弈论的雏形。也是在这一年,他发表了一篇论文,描述了所有有限的二人零和博弈中的参与者行为。所谓零和博弈指的是,如国际象棋或扑克这类完全对抗性的游戏,其中一方的收益必然导致对方同等的收益。除了零和博弈之外,还有正和博弈和负和博弈。正和博弈能增加所有参与者的总价值,例如合作完成一个项目以获得共同晋升;而负和博弈,如战争,会导致价值被摧毁。

冯·诺依曼证明,在所有的二人零和博弈中,总存在一种策略,能让每位玩家最大限度地减少对手的收益。这意味着无论对手有多高明,总有一个预先确定的甚至有些悲观的最佳结果。“在这样的二人博弈中,很容易想象到各种力量在互相较量。‘玩家一的收益’的价值受到两方力量的拉扯:一方面来自‘玩家一’,他希望将其最大化;另一方来自‘玩家二’,他希望将其最小化。”每位玩家的目标都应是尽可能减少对手的最大化收益。在零和博弈中,这等同于最大化自己的最小收益。这被称为“极小化极大”,代表了一个玩家所能期待的最高回报——即使是在最坏情况下,即使对对手的策略一无所知。

无论对手采取何种行动,理性的玩家都会选择这种策略。假设两位玩家都是理性的,即都试图最大化自己的收益,那么两者都会倾向于采用这种极小化极大策略。这便是系统的均衡点。这时游戏的结果完全由游戏规则决定,而非玩家的心理状态。游戏的全部复杂性和戏剧性都凝聚在了这一均衡点上。这就是所谓的“极小化极大定理”。

有人可能认为极小化极大的思路过于保守,玩家当然希望能做得更好,而不仅仅是尽量减少自己可能遭受的最大损失。这又被称为“大中取大策略”。事实证明,大中取大策略过于乐观,最终是不理性的,它常常为幼稚的玩家和小孩子所采用。之所以称其不理性,是因为它没有考虑到对手的策略。

冯·诺依曼也认识到博弈动态与社会科学之间的紧密联系。他提到了“斗争”的概念,强调任何互动都可以被描述为一场博弈。在注释中,他小心翼翼地在自己的研究与经济学之间建立了联系,将策略比作“古典经济学的主要问题:在特定的外部环境下,绝对自私的‘经济人’将如何行动?”极小化极大策略后来不仅成为社会科学的基础概念,还成为计算机科学、决策理论、人工智能和伦理学的基石。

正如人们曾经认为机遇可以被量化极其荒谬一样,将心理学从游戏中剥离出来的想法同样令人感到陌生。冯·诺依曼写道:“两位玩家中谁更擅长心理学并不重要,因为游戏本身并不对这类因素敏感,结果总是趋于一致。”他的工作呼应了20世纪最具影响力的数学家之一大卫·希尔伯特的愿景:数学终将统治所有知识领域。1928年,数学家们已经在希尔伯特的公理化计划上取得了显著进展,希尔伯特甚至宣称该计划已几近完成。

两年后,逻辑学家库尔特·哥德尔提出了一项革命性的证明。哥德尔发现,形式系统无法证明其自身的一致性。这意味着人们无法为所有数学领域定义一套公理。数学永远是不完备的,因为有时无法证明某些真实的陈述。冯·诺依曼后来反思道:“我个人认为,哥德尔已经表明希尔伯特的计划基本无望。”他很快做出调整,放弃了在数学基础领域的工作,转而探索应用领域。

■ 构建表达动态之工具

维也纳数学家卡尔·门格尔于1934年出版了《道德、决策与社会组织:走向伦理逻辑》一书。他试图为道德奠定数学基础。受门格尔思想的启发,经济学家奥斯卡·摩根斯坦也希望能将经济学系统化。因为他在20世纪30年代所做的大部分研究都是对经济学领域的批评。经济学家们在定义相同量概念时前后矛盾,而他们的研究又建立在不可能的假设之上。

物理学家用平衡来描述静止状态下的系统,经济学家从他们那里借鉴了这一概念。但是,摩根斯坦对经济学中的平衡模型的方法持怀疑态度,因为它们缺乏活力。静止模型仅仅是对真实市场的粗略模拟。在摩根斯坦看来,一个经济模型如果不能解释事物发生变化时会发生什么,“就几乎不配被称为理论和科学”。此外,平衡模型要求市场参与者拥有完美的预见性。摩根斯坦质问道:“谁的预见?针对什么样的事物或事件?针对什么样的局部关系?哪段时间?”在对其他人进行推理时,预见性又意味着什么?如何才能在不陷入无限循环的情况下相互猜测?

摩根斯坦喜欢借用福尔摩斯侦探小说中的一个场景来阐释他的观点:福尔摩斯为了躲避宿敌莫里亚蒂,登上了开往多佛的火车。不幸的是,福尔摩斯在火车离站时看到了莫里亚蒂赶来,他刚好瞥见福尔摩斯。福尔摩斯必须决定是否继续乘坐火车到达终点,还是在途中下车。他的决策必须基于他认为莫里亚蒂会先去哪里,而莫里亚蒂会去哪里,则取决于他认为福尔摩斯会做什么。如此循环往复,无穷无尽。

这一难题的根源可以追溯到卡尔·马克思约70年前指出的一个问题。孤立个体思想实验是道德哲学的标准,而经济学家也乐于采用这一传统。马克思指出:“鲁滨逊·克鲁索的经历是政治经济学家们钟爱的一个主题。”克鲁索是《鲁滨逊漂流记》中的主人公。他被困在一个孤岛上几十年,最后终于获救。在受困期间,他自食其力创造了生活所需的一切物质。在经济学家看来,克鲁索就像一个不可分割的市场原子,他们基于这一观念构建了自己的模型。但是,他们忽视了构成市场到个体之间的互动。马克思认为,这导致经济模式从根本上被客体化,将人排除在主体之外,将经济模式塑造成一种客体经济,即一群自我沉溺、互不干涉的个体的集合。

摩根斯坦不仅反对从同行的草率,还反对经济学家提出问题的方式。大多数经济理论不过是对某种制度结构下的价格预测:假设市场完全竞争在供应量为x、需求量为y的条件下,确定某种商品的价格。但这样的结构制度首先是如何产生的?与其假定某种制度是既定的,并预测相应的价格,经济学家应该应对一个更有趣的问题:在给定规则的情况下,有哪些制度和价格搭配是可能的?经济学家不应该仅仅描述现有的动态,而应努力构建能够表达任何可能动态的工具。简而言之,经济学是一个支离破碎的领域,其从业者用错误的工具提出了错误的问题。提供了建立在不可能的假设基础上的无用的静态模型。

1938年,摩根斯坦前往普林斯顿高等研究院工作。在那里,他与冯·诺伊曼发现了共同的兴趣——将人类互动形式化。冯·诺伊曼从博弈论角度进行研究,摩根斯坦则从经济学角度出发。他们合作将冯·诺依曼早期的研究扩展成经典著作《博弈论与经济行为》,该书于1944年出版。在书中,他们描述了在特定的假设和条件下一种理想化的、相互作用的参与者如何制定策略以实现回报最大化。他们希望满意地证明,经济行为的典型问题能够与适当的策略博弈的数学概念严格对应。通过博弈论的阐释,经济学开始转变为一门更加严谨的学科,至少在表面上是这样的。

■ 动力学的最小模型

冯·诺伊曼和摩根斯坦将博弈研究与牛顿的苹果进行比较。正如苹果落地的平淡轨迹揭示了物理学定理,解释了行星尺度运动,博弈也可以被认为可以构建出更复杂的动力学的最小模型。牛顿力学描述的是有质量的实体如何相互影响,而博弈论描述的则是有欲望的实体如何相互作用。以博弈为基础,研究者可以从被动物质的力学中推导出具有偏好和目标的主动实体的力学。正如地心引力牵引苹果落地,自我利益也将玩家引向预定的策略,让他们在数学上做出最佳表现。冯·诺伊曼坚信,他的模型准确地捕捉到了人类行为的现实。

冯·诺伊曼和摩根斯坦为经济学家之前仅模糊理解的概念赋予了具体的定义。功利概念最早出现于18世纪,通常被认为是哲学家杰里米·边沁和约翰·斯图亚特·穆勒的贡献。功利旨在衡量个体从某事中获得的快乐和好处,但其量化并非易事。人们不仅偏好各异,其衡量标准也截然不同。从理论上来说,一个人能体验到的最大快乐可能低于另一个人体验到的最小快乐。

1937年,经济学家保罗·萨缪尔森给出一个对功利的定义,这个定义可以用纯粹可观察的术语来衡量,而无需考虑隐藏的心理因素。他的这一见解被称为“揭示偏好理论”,其基础是数学家丹尼尔·伯努利的观点,即行为体行动的目的是为了最大化他们的收益或效用。行为体的选择揭示了他们对结果的重视程度,即结果对他们而言的功利性。某一事物的功利性是通过行为体对该事物的一贯选择来衡量的。行为体之所以是行为体,是因为他们的行为是为了实现功利最大化。

冯·诺依曼将萨缪尔森的见解进一步形式化,并将风险的概念明确纳入玩家的选择之中。每个选择都像是一场赌博,冯·诺依曼将其进行了模型化。例如,当我们购买某种股票时,我们并不清楚其未来的价值。我们会估算其上涨的可能性,并在赌注看起来相对安全时考虑购买。即使成功的可能性较低,我们也可能会选择这样的赌注,因为赌注的结果是我们渴望的。在这一框架下,理性的行为体总是会在他们对选择的渴望与该选项的风险之间取得平衡,选择他们认为能最大化预期效应的选项。根据某些假设,人们的偏好可以通过一个孤立函数来描述,该函数可以用于预测人们的策略和选择。冯·诺伊曼的表述将主观的个体欲望转化为一个共同的参照框架,这一框架完全由行为体在集体竞技场中的行动所定义。摩根斯坦后来在日记中写道,冯·诺伊曼在短短一天之内解决了困扰经济学家多年的难题。

博弈论的前提是假定参与者是理性的,但多年来博弈论对“理性”的定义一直在演变。冯·诺伊曼和摩根斯坦的概念过于严格,要求博弈者拥有无限的预见能力和计算能力,以便计算出最优选择。这种技术性的定义与参与者是否逻辑清晰,是否不受情绪影响甚至是否聪明都无关。在更广阔的层面上,理性是由参与者所做的选择来定义的。理性的参与者做出的选择会使其收益或功利最大化,这就要求他们有一致且明确的偏好。比如,某个参与者喜欢苹果胜过橙子,喜欢橙子又胜过香蕉,那么他就应该选择苹果而非香蕉。理性的行为体应能对其偏好的不同结果进行排序,推断出哪些行为会导致哪些结果,并做出符合自己偏好的选择。只要满足这些标准,我们就可以说行为体是理性的。对经济学家而言,只要了解行为体的偏好,便能够预测他们的选择。

然而,正如诺贝尔经济学奖得主阿马蒂亚·森在其经典论文《理性的傻瓜》中指出的那样,我们很难仅凭“理性”行为体在选择上的一致性就认定其选择是有意义的、明智的。明智的选择并非一成不变,而是取决于具体情况。例如,一个人在冬天可能更喜欢穿派克大衣而不是背心,但在游览热带岛屿时可能就不同了。同样,一个人在睡前可能会使用牙刷而不是防弹背心,但在战斗中情况则截然相反。因此,博弈论的基本假设会因博弈本身的存在而失效。

■ 博弈论的有效和无效

与“鲁滨逊·克鲁索经济学”不同,博弈论提供了描述互动关系所需的框架。摩根斯坦希望博弈论能成为经济学家研究社会规则下制度或社会秩序的出现的工具。然而,《博弈论与经济行为》几乎并未解决摩根斯坦对经济理论现状的疑虑。

摩根斯坦一生都在批评经济学家使用不切实际的模型,然后建立了一个以具有完美预见力的行为体为模型的领域。然而,博弈论也是静态的。冯·诺伊曼和摩根斯坦虽然都承认动态理论无疑会更完整,因此也更可取,但他们同时也指出,其他的科学证据表明,在了解静态情况之前建立动态理论是徒劳的。摩根斯坦最终放弃了他的崇高抱负。

随着时间的推移,赫伯特·西蒙提出了“有限理性”的概念,认为人们的决策能力是有限的,他们常常会做出虽非最优但足够合适的选择。这个新理论的最大问题或许在于它仅限于零和博弈,这使经济学家们普遍认为它是一个相当不理想的工具,因为市场应该是正和博弈,目的是创造价值。但零和博弈的限制却是一种方便的数学技巧,其功能类似于物理学中的守恒定律。在零和博弈中,由于参与者之间的利益是相互平衡的,因此极小化极大策略就成了一个平衡点,使理论家可以在一定程度上把握参与者的心理。在二人零和博弈中,参与者永远不会陷入“我明白你了解我清楚……”的无限循环,因为无论对方如何行动,极小化极大策略都有效。无论对手采取何种策略,参与者的表现都不会比极小化极大策略差,因为所有参与者都倾向于选择这个策略。

相比于摩根斯坦,冯·诺依曼并不太关心如何对他们的模型进行经济学解释。摩根斯坦曾预测,要想让经济学家们接受博弈论需要相当长的时间。他的预言果然成真了:几十年来,经济学家们一直对《博弈论与经济行为》视而不见,认为其过于狭隘,无法解决任何值得关注的问题。在博弈论诞生的最初几十年,主要是数学家而非经济学家推动了该理论的发展。博弈论一直处于边缘地位,直到半个世纪后才逐渐将经济学领域纳入其范畴。

1950年,约翰·纳什仅凭一篇仅有一页纸的论文,为经济学思想注入了新的活力。纳什提出了一个更广泛的博弈均衡定义,它适用于任意数量的参与者和任何形式的收益结构。不论是零和博弈、正和博弈还是负和博弈。在纳什均衡中,每个参与者的策略都是对所有其他参与者的选择的最佳回应。纳什均衡的特点在于,一旦每个参与者同时公开其策略,便没有人愿意再做出改变。例如,即使没有交通法规强制规定必须靠哪一侧行驶,所有司机也会选择一侧并坚持不变。人们自然而然地就会去选择靠左或靠右行驶的策略。除非其他人都同意改变行驶方向,否则改变方向对任何人都没有好处。这篇简短的论文研究,为他赢得了1994年的诺贝尔经济学奖。

简而言之,博弈论中的参与者并非真实存在的人类,而是抽象的概念。博弈论并不预测人类行为。由于博弈论基于数学重言式,所以它无法直接触及现实世界。博弈论描述的数学模型中的“选择”只是其效用函数的逻辑结果。在博弈论中,行为体不过是一个方程式、一组偏好,旨在采取最大化这些偏好的行动。当博弈论的预测与现实中观察到的人类行为有所出入时,这并不能证明博弈论本身的错误。博弈论不能通过实证观察来反驳,因为它并不是基于实证的。但这并不意味着博弈论没有价值或无用。我们应该警惕,不要将博弈论的教诲简单地套用到传统的常识领域中。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
81国批准了,新群总部落户中国?四架包机离京,特朗普酝酿大动作

81国批准了,新群总部落户中国?四架包机离京,特朗普酝酿大动作

boss外传
2026-02-06 20:00:03
泪目!蹲在高速服务区的蓝猫苦等主人,300公里奔赴的拥抱看哭了

泪目!蹲在高速服务区的蓝猫苦等主人,300公里奔赴的拥抱看哭了

夜深爱杂谈
2026-02-05 22:37:04
36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

释凡电影
2025-08-14 09:33:19
第一集就这么变态,这部新剧真敢拍

第一集就这么变态,这部新剧真敢拍

天天美剧吧
2026-02-06 20:12:11
宋小宝脸上动了 600 多刀,沈腾:还不如不动

宋小宝脸上动了 600 多刀,沈腾:还不如不动

没有偏旁的常庆
2026-02-05 06:20:03
首例对不满16岁未成年人行拘案例,天津警方披露详情

首例对不满16岁未成年人行拘案例,天津警方披露详情

澎湃新闻
2026-02-07 15:25:05
俄前司法部副部长浴缸溺亡

俄前司法部副部长浴缸溺亡

观察者网
2026-02-07 09:42:11
“乱港”分子黄之锋:21年父母抛弃他跑路,如今下场大快人心

“乱港”分子黄之锋:21年父母抛弃他跑路,如今下场大快人心

小莜读史
2026-02-02 20:52:53
大跌眼镜——俄军空袭乌方导弹命中率首次为0

大跌眼镜——俄军空袭乌方导弹命中率首次为0

史政先锋
2026-02-07 20:38:56
广厦险胜吉林挺进四强:国内球员总共只得13分,郭士强做对一件事

广厦险胜吉林挺进四强:国内球员总共只得13分,郭士强做对一件事

姜大叔侃球
2026-02-07 19:52:37
白嫖月子中心后续: 13天白吃白住还借钱 深夜抱孩子跑路 警方介入

白嫖月子中心后续: 13天白吃白住还借钱 深夜抱孩子跑路 警方介入

离离言几许
2026-02-06 22:01:56
当年举报毕福剑的那位告密者竟然变成这样了!谁能想到啊?

当年举报毕福剑的那位告密者竟然变成这样了!谁能想到啊?

霹雳炮
2026-02-06 13:48:54
阵风6、7级!大风、寒潮双预警中!明起,气温开始变化——

阵风6、7级!大风、寒潮双预警中!明起,气温开始变化——

石景山区新媒体
2026-02-07 16:05:58
近五年跌得最惨的10只中字头股票,有的区间跌幅超90%!

近五年跌得最惨的10只中字头股票,有的区间跌幅超90%!

财经智多星
2026-02-07 19:44:05
郑爽彻底疯狂!街头抱娃与张恒家争执,满头白发穿搭邋遢,孩子哭晕

郑爽彻底疯狂!街头抱娃与张恒家争执,满头白发穿搭邋遢,孩子哭晕

八卦王者
2026-02-06 16:45:29
吴君如很早就说过了,陈妍希私下就是这样穿

吴君如很早就说过了,陈妍希私下就是这样穿

八星人
2026-01-21 15:14:26
阿玛尼,让全世界记住意大利国旗

阿玛尼,让全世界记住意大利国旗

设计癖
2026-02-07 13:15:28
64岁前央视主持徐俐现状:离婚带娃定居农村,守着小院看花开花落

64岁前央视主持徐俐现状:离婚带娃定居农村,守着小院看花开花落

小徐讲八卦
2026-02-05 18:30:43
万科走向深渊的最大推手——郁亮

万科走向深渊的最大推手——郁亮

地产微资讯
2026-02-06 10:15:49
西贝的贾总再次发言,网友:来教育消费者,其实是给自己补第二刀

西贝的贾总再次发言,网友:来教育消费者,其实是给自己补第二刀

魔都姐姐杂谈
2026-02-07 15:17:40
2026-02-07 21:44:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2141611文章数 5389关注度
往期回顾 全部

艺术要闻

摄影大赛获奖作品赏析,这才是真正的大片

头条要闻

解散日众议院依靠媚美反华 高市押注选举想"一石三鸟"

头条要闻

解散日众议院依靠媚美反华 高市押注选举想"一石三鸟"

体育要闻

主队球迷唯一爱将,说自己不该在NBA打球

娱乐要闻

何超欣说和何猷君没竞争,实力遭质疑

财经要闻

金价高波动时代来了

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

汽车要闻

工信部公告落地 全新腾势Z9GT焕新升级

态度原创

家居
数码
亲子
时尚
教育

家居要闻

现代轻奢 温馨治愈系

数码要闻

冠捷推出26.5英寸AOC G4白色显示器:LGD四代WOLED,2919元

亲子要闻

怀孕的女人闹情绪有多离谱?网友:觉得洗衣机太累了,让我给它道歉

今日热点:《惊蛰无声》终极预告;韩国翻拍《解忧杂货店》……

教育要闻

教育纵深 | 为“阅读”立法有何深意

无障碍浏览 进入关怀版