什么是囚徒困境？

超体22023-02-08 31

囚徒困境：说明为什么甚至在合作对双方都有利时，保持合作也是困难的；启示是：人类的个人理性有时能导致集体的非理性-聪明的人类会因自己的聪明而作茧自缚，或者损害集体的利益。

囚徒困境（prisoner's dilemma）是指两个被捕的囚徒之间的一种特殊博弈，说明为什么甚至在合作对双方都有利时，保持合作也是困难的。

囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护、人际关系等方面，也会频繁出现类似情况。

囚徒困境所反映出的深刻问题是，人类的个人理性有时能导致集体的非理性-聪明的人类会因自己的聪明而作茧自缚，或者损害集体的利益。

扩展资料

注意事项：

是敌是友对于想对囚徒困境作现实分析的人将是有用的。注意到，参与者只能进行一次，所以所有涉及重复进行博弈的观点都不适用，“以牙还牙”策略也无法发展出来。

在是敌是友中，每个参赛者被允许做一个声明，使另一半友在双方秘密决定合作或背叛之前，确信他的友善。

可能“打破制度”的方法将是一个参与者告诉他的对手：“我会选择做敌人。如果你相信我后来会和你分奖品的话，就选择做朋友。否则，如果你选择做敌人，我们都会空手而回。”一个更贪婪的版本将是：“我将选择做敌人。

我会给你百分之X，剩下的百分之（100-X）归我。所以，要或不要，要么我们都得到一些，要么我们都一无所获。”（在最后通牒博弈中时。）

如今，奸计就是去尽量减少那个百分之X，并保持另一个竞争者仍然选择做朋友。基本上，这个参与者必须知道这个界限，在这里他的对手从看到他一无所获中得到的效用，要超过他从肯定能赢得的金钱中得到的效用，如果他顺利的话。

参考资料来源：百度百科-囚徒困境

囚徒困境（prisoner's dilemma）是指两个被捕的囚徒之间的一种特殊博弈，说明为什么甚至在合作对双方都有利时，保持合作也是困难的。

在这个博弈中，参与者必须反复地选择他们彼此相关的策略，并且记住他们以前的对抗。阿克塞尔罗德邀请全世界的学术同行来设计计算机策略，并在一个重复囚徒困境竞赛中互相竞争。参赛的程序的差异广泛地存在于这些方面，算法的复杂性、最初的对抗、宽恕的能力等等。

阿克塞尔罗德发现，当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后，从利己的角度来判断，最终“贪婪”策略趋向于减少，而比较“利他”策略更多地被采用。他用这个博弈来说明，通过自然选择，一种利他行为的机制可能从最初纯粹的自私机制进化而来。

囚徒困境的条件：

1、友善

最重要的条件是策略必须“友善”，这就是说，不要在对手背叛之前先背叛。几乎所有的高分策略都是友善的。因此，完全自私的策略仅仅出于自私的原因，也永远不会首先打击其对手。

2、报复

但是，阿克斯洛德主张，成功的策略必须不是一个盲目乐观者。要始终报复。一个非报复策略的例子是始终合作。这是一个非常糟糕的选择，因为“下流”策略将残酷地剥削这样的傻瓜。

3、宽恕

成功策略的另一个品质是必须要宽恕。虽然它们不报复，但是如果对手不继续背叛，它们会一再退却到合作。这停止了报复和反报复的长期进行，最大化了得分点数。

以上内容参考：百度百科—囚徒困境

转载请注明原文地址:http://juke.outofmemory.cn/read/2924704.html

囚徒