什么是“囚徒困境”

什么是“囚徒困境”,第1张

囚徒困境”是博弈论非零和博弈中比较典型的例子。

用文字的形式描述如下:警察逮捕了A和B两个囚犯,但是证据不足,目前有以下三种选择,第一种选择是有一个人举报对方的同时对方保持沉默,那么举报者会被释放,沉默者被判十年。第二种选择是两人都保持沉默,那么都被判半年。第三种是两人都互相举报,则两个人都被判两年。在这个例子中,如果对方沉默,我举报我会获释,如果对方举报我不举报我获得刑期会比我选择举报增长,所以我还是选择举报。无论对方的选择是什么,基于自己的利益最大化考虑,我都会选择举报。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都举报对方,结果两人都获刑两年。

可以明显看出,这场博弈的纳什均衡,对于全体利益而言,并不是最佳的选择,因为如果两人都保持沉默的话,两人都会只被判半年。这个例子也充分的证明了,在零和博弈中,帕累托最优和纳什均衡是相冲突的。

1、囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择;

2、困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,会频繁出现类似情况;

3、单次发生的囚徒困境,和多次重复的囚徒困境结果不一样,在重复的囚徒困境中,博弈被反复进行,每个参与者都有机会去惩罚另一个参与者前一回合的不合作行为,这时,合作可能会作为均衡的结果出现;

4、欺骗的动机可能被受到惩罚的威胁所克服,从而能导向一个较好的合作结果,作为反复接近无限的数量,纳什均衡趋向于帕累托最优;

5、囚徒困境的主旨是囚徒们虽然彼此合作,坚不吐实可为全体带来最佳利益,但在资讯不明的情况下,因为出卖同伙可为自己带来利益,也因为同伙把自己招出来也可为他带来利益,因此彼此出卖虽违反最佳共同利益,但自己获得最大利益;

6、在实际上,因为囚徒必须考虑刑期以外之因素,而无法完全以执法者所设立之利益作考量

囚徒困境用来分析两个寡头企业的情况说明了企业为了避免最差的结果将不能得到最好的结果

一:囚徒困境(prisoner'sdilemma)是指两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护、人际关系等方面,也会频繁出现类似情况。

二:“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。

三:如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确凿,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。

四:囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在对方的表现不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。

五:但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作为必须考量的因素。

        囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判十年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。

        还看过一个关于类似的故事,觉得比这个好些,大概是讲如果两个人互相选择对方有利的就可以得到4个3分,两个人都可以成功。不过记不太清了。

        看过一些经济学或者博弈论的人都知道这个抽象出来典型故事。这是一个关于选择和结果的判断过程。这个故事的重点在于囚徒本人理性上不可能选择最优的结果。与此相关还有一些心理学习的总结。实际上最终问的是是否将利人作为自己的选择。也可以是在问仁与善到底从何来来。其实我很不喜欢用这个故事做隐喻,警察,囚徒的身份在心中有很多先验性的判定。

        实际上这个问题还可以在物理学上的宏观和微观层面上得到解释。也可以在说明一个问题,一个文化的其终极意义。得到理论上的最优结果,并建立起群体为之付出的理念。所以这里说的也并不是某一次选择,而是很多次的选择。

        现在运用计算机程序已基本上模拟出下面这个结果。

        两次竞赛中获胜的策略——平均得分最高——都是所提交的策略中最简单的策略:针锋相对(TIT FOR TAT)。这个策略是数学家拉普波特(Anatol Rapoport)提交的,第一个回合合作,然后在后面的回合中采取对手在前一回合中所使用的策略。也就是说针锋相对策略愿意合作,并且对愿意合作的对手以礼相待。但如果对方背叛,针锋相对策略就会回之以背叛,直到对手又开始合作为止。

        让人吃惊的是,这样简单的策略竟然打败了其他所有策略,尤其是第2次竞赛时参赛者已经知道了针锋相对策略,可以有针对性地与它对抗。然而,在参赛的几十位专家中,没有人能设计出更好的策略。

        采取“友善、报复、宽恕、明确”的原则,正是阿克塞尔罗德在重复囚徒困境中指出的成功所需的条件。

        上面囚徒困境来自百度百科,计算机实验摘自《复杂》。

        计算机的模拟将远远大于生命的长度。可是个体的人还是得面对一次又一次单个的选择。总有那么一些人,傻傻的选择了美好。再回头看看那些令人感动的就是这些傻傻的美好。

囚徒困境(Prison Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。

在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。

囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。

举个例子:

1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

若二人都互相检举(互相“背叛”),则二人同样判监2年。

用表格概述如下:

甲沉默(合作) 甲认罪(背叛)

乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年

乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年

囚徒困境是美国的梅里尔弗勒德和梅尔文德雷希尔所提出的相关困境理论。

之所以将这种困境理论称之为囚徒困境,主要是由于一个模拟困境实验所引起的,接下来就介绍一下囚徒困境的模拟试验相关内容以及囚徒困境的应用。

如果两个犯罪人员同时被关入监狱,这两个犯罪人员属于共同犯罪,但是在监狱当中不能够互相沟通,在这种情况下,如果两个人都不揭发对方,那么由于证据不确凿,每个人只需要坐一年牢就可以。

如果其中某一个人揭发另一个人,而另一个人没有任何表示,在这种情况下,揭发者会立刻获释,而沉默者则入狱十年。如果两个罪犯互相揭发那么两个人都会被判刑八年。所以说这两个罪犯,之后会如何选择?所涉及到的就是一种博弈的模型,也就是所说的囚徒困境。

囚徒困境所涉及的和所应用的领域:

囚徒困境所涉及的和所应用的领域是比较多的,比如说在政治领域、经济领域,企业经营的过程当中和企业组织管理的过程当中都可能会遇到。

在这种情况下,如果想要获得更大的生存和发展,最大的秘诀就是通力合作,力求双赢,不仅需要彼此之间的信任,还需要讲究一些策略。

囚徒困境给我们的提示就是,如果双方采取一种博弈的态度,那么对于双方而言都没有好处,如果双方采取合作的态度,就会达到共赢的局面,任何一种怀疑或者是不信任,都会导致双方关系的破裂。

以上就是关于什么是“囚徒困境”全部的内容,包括:什么是“囚徒困境”、对囚徒困境的理解、囚徒困境用来分析两个寡头企业的情况说明了什么等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:聚客百科

原文地址: http://juke.outofmemory.cn/life/3667362.html

()
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-25
下一篇 2023-04-25

发表评论

登录后才能评论

评论列表(0条)

保存