囚徒困境理论 囚徒困境理论认为囚徒最佳的选择是什么


囚徒困境理论 囚徒困境理论认为囚徒最佳的选择是什么

文章插图
大家好,小跳来为大家解答以上的问题 。囚徒困境理论认为囚徒最佳的选择是什么,囚徒困境理论这个很多人还不知道,现在让我们一起来看看吧!
1、囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择 。
2、虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况 。
3、【经典的囚徒困境】1950年 , 由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境” 。
4、经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪 。
5、于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年 。
【囚徒困境理论 囚徒困境理论认为囚徒最佳的选择是什么】6、若二人都保持沉默(相关术语称互相“合作”) , 则二人同样判监半年 。
7、若二人都互相检举(互相“背叛”) , 则二人同样判监2年 。
8、【解说】如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益 。
9、参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话 , 此策略称为“严格劣势”,理性的参与者绝不会选择 。
10、另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略 。
11、囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口 。
12、就个人的理性选择而言,检举背叛对方所得刑期 , 总比沉默要来得低 。
13、试设想困境中两名理性囚徒会如何作出选择:若对方沉默、我背叛会让我获释,所以会选择背叛 。
14、若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛 。
15、二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛 。
16、背叛是两种策略之中的支配性策略 。
17、因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年 。
18、这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案 。
19、以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年 , 总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳 。
20、但根据以上假设,二人均为理性的个人,且只追求自己个人利益 。
21、均衡状况会是两个囚徒都选择背叛 , 结果二人判监均比合作为高,总体利益较合作为低 。
22、这就是“困境”所在 。
23、例子华丽地证明了:非零和博弈中,帕累托最优和纳什均衡是互相冲突的 。
本文到此分享完毕,希望对大家有所帮助 。