路漫漫其修远兮分享 http://blog.sciencenet.cn/u/zhpd55 追求科学,勇于探索,苦海无涯,愿作小舟。

博文

[转载]杨六省:囚徒困境让博弈论和经济学界蒙羞

已有 4103 次阅读 2020-6-30 21:31 |个人分类:数学研究|系统分类:论文交流| 博弈论, 囚徒困境, 悖论 |文章来源:转载

说明:因杨六省(13572503691@163.com)老师之邀,将其一篇关于“囚徒困境让博弈论和经济学界蒙羞”吗的回答新作转载于下,请行家进行评议,也可以直接与杨六省老师联系。

囚徒困境让博弈论和经济学界蒙羞

杨六省

问题:

两名嫌犯A和B被警方抓获,被分别关押在不同的房间里接受警方的盘问。他们被告知:如果一人认罪,另一人不认罪,认罪者可获释,不认罪者将获刑20年;如果两人都认罪,他们将均获刑10年;如果两人都不认罪,他们将均获刑1年。为简明起见,我们用下表反映问题条件。

image.png

两人各会有什么盘算呢?

嫌犯A可能会这样想:假设B选择认罪,我若不认罪,将获刑20年,若认罪,只获刑10年,当然选择认罪有利;假设B选择不认罪,我若也不认罪,将获刑1年,我若认罪,则可获释,显然还是认罪有利。总之,不管对方选择认罪还是不认罪,认罪对我都是最佳选择。

同样,嫌犯B的盘算结果也是认为,选择认罪是最佳方案。然而,如果两人都选择不认罪的话,他们都只会获刑1年,而不是10年。

上述这个与客观事实(指两个囚徒都应该选择不认罪的策略)相矛盾的推理结论(指两个囚徒都应该选择认罪的策略),就是著名的囚徒困境,也叫囚徒悖论。

作者评析:参与者追求个人利益最大化是博弈活动的灵魂。但是,这个灵魂(策略选择的动机)不应该像一匹脱缰的野马那样任性,因为赛场上还有其他的马匹也参与比赛。所以,这个灵魂应该由“一根缰绳”来约束,“这根缰绳”就是一致性原则。如果把前者(参与者追求个人利益最大化的动机)叫做“本能”,那么,后者(遵守一致性原则)所反映的就是“理性”,换句话说,参与者既是自私的,但也应该是理性的,这是我们讨论问题的假设前提。但遗憾的是,人们常常只考虑前者而忽视了后者,甚至误以为,理性人概念的全部意义似乎只在于追求个人利益最大化,而不考虑其做法是否符合一致性原则。这种原则性的错误所引发的矛盾有时会是令人惊讶的!例如,在囚徒困境中,声称认罪是每个参与者的占优战略(占优策略是指,无论什么情况都应该采取的策略选择),但这一结论却被客观事实(题目条件)所否决。

任何一个理论系统,如果它是合理的,那么,其自身必然是无矛盾的,与其他学科必然是相容的,与客观事实必然是相一致的。学术界尚未解决的难题比比皆是。但是,目前尚无能力解决难题是一回事,而容忍矛盾的存在,甚至为矛盾的存在进行辩护则是另一回事。前者并不令人蒙羞,但后者会令学界蒙羞!囚徒困境问题的现状就属于后者,例如,学界认为,“认罪是每个参与者的占优策略”,但两人都认罪却不是问题的最优解;纳什均衡是反映稳定性的概念,但最优解(两人都不认罪)却不是纳什均衡;最优解明明客观存在,却认为不可证,即理由不可知;帕累托最优是个合理的概念,但学界却认为纳什均衡概念与帕累托最优概念是冲突的;亚当·斯密的“看不见的手原理”是合理的,但学界却认为纳什均衡概念挑战了亚当·斯密的“看不见的手原理”;当推理结论(指囚徒应该选择认罪策略)与客观事实发生冲突时,不是去质疑推理,否定推理,而是容忍冲突,为冲突辩护,说什么这种冲突是因为个人理性与集体理性相矛盾的缘故,试问,一个具有一致性的理论,其个人理性与集体理性难道会是不相容的吗?……上述种种矛盾是应该拒斥和消除的,但博弈论和经济学界却容忍上述矛盾,并为之进行辩护,这着实让博弈论和经济学界蒙羞!

囚徒困境所引发的矛盾和冲突是如此之多,这足以表明,博弈论与经济学必须为博弈行为制订规矩。

博弈行为准则:任何一个参与者,其策略选择的动机均在于追求利益最大化,但不得违反一致性原则,即不得引发矛盾。

    “假设对方选择不认罪策略,则我应当选择认罪策略”这一观点似乎已为学界所公认,并被冠以“个人理性”之美名!下面我们就来说明,以往人们的推理为什么是无效的,错误究竟出在哪里?

嫌犯A既然以“假设B选择不认罪策略”作为推理前提,依据博弈行为准则,A就得认可B的这种策略选择是为了达到、并且也应该达到其收益大于或等于A的收益。但是,当A又利用“假设自己选择认罪策略”进行推理时,就是又认可了自己的策略选择动机,即要使自己的收益大于或等于B的收益,但依据警方告知的条件,两人的策略选择动机不可能是相容的,这表明A在推理中应用了互不相容的条件,这是有效推理所不允许的(注:错误之处不在于假设前者,而在于在假设前者的前提下又假设后者,或者更确切地说,错误在于,最终没有否定后者),所以,A关于“假设对方选择不认罪策略,则我应当选择认罪策略”的证明是无效的。此说法对于B同样成立,因为B和A在博弈中所充当的角色是对称的。

纳什因纳什均衡概念的提出而获得诺贝尔经济学奖。诺贝尔经济学奖得主梅耶森认为,发现纳什均衡的意义,可以和生命科学中发现DNA的双螺旋结构相媲美。但笔者认为,纳什均衡概念的内涵是有缺陷的,是不完整的,因此,梅耶森对纳什均衡的评价显然是过誉了。事实上,“在科学院的投票中,纳什与1994年度诺贝尔经济学奖的另外两名候选人勉强以微弱多数胜出,这是历史上最接近失败的一次评选。”(参见《美丽心灵——纳什传》第469页) 

本帖只是一个引子。关于囚徒困境问题的详细讨论,参见杨六省著《悖论是什么——70个悖论的消解》,汉斯出版社,2020年6月出版。

 杨六省老师原文:

囚徒困境让博弈论和经济学界蒙羞.doc




https://wap.sciencenet.cn/blog-212210-1240110.html

上一篇:“代数几何”(14-XX)2020年6月份最新论文题录(70条)
下一篇:焚烧农作物秸秆谁来管?
收藏 IP: 61.134.23.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 20:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部