什么是囚徒困境?
囚犯的困境是决策分析中的一个悖论,其中两个人为了自己的利益行事并不能产生最佳结果。 典型的囚徒困境是这样建立的,双方都选择保护自己,而牺牲另一方参与者。 结果,两个参与者都发现自己比在决策过程中相互合作时处于更糟糕的状态。 囚徒困境是现代博弈论中最著名的概念之一。
重要要点
- 囚徒困境是指个体决策者总是有动力选择一种方式,从而给整个群体带来的结果都不是最优的。囚徒困境出现在经济的许多方面。 尽管个人奖励措施显然不利,人们已经开发出许多方法来克服囚徒困境,选择更好的集体结果。
囚徒困境
了解囚徒困境
囚徒的困境造成了这样一种情况,即两个彼此分开且无法沟通的当事方必须在彼此合作与否之间做出选择。 当双方选择合作时,对双方的奖励最高。
经典囚犯的困境是这样的:一群银行抢劫犯的两名成员戴夫(Dave)和亨利(Henry)已被捕,并在单独的房间中受到讯问。 当局没有其他证人,只有他们能够说服至少一名强盗背叛他的同伙并为罪行作证,才能证明对他们的指控。 每个抢劫银行者都面临选择与同伙合作,保持沉默或从团伙叛逃并为起诉作证的选择。 如果他们既合作又保持沉默,那么当局只能以较少的游荡罪将他们定罪,这意味着每次入狱一年(戴夫1年+亨利1年=总共2年监禁)时间)。 如果一个人作证而另一个人不作证,那么一个作证的人将获得自由,而另一个人将获得三年(有缺陷的人为0年,有罪的人为3年=共计3年)。 但是,如果双方作证,则各自对抢劫负部分责任将被判入狱两年(戴夫2年+亨利2年=总共4年监禁)。
在这种情况下,每一个强盗总是有诱因去叛逃,而不管对方做出的选择。 从戴夫的角度来看,如果亨利保持沉默,那么戴夫可以与亨利合作并入狱一年,或者叛逃并获释。 显然,在这种情况下,他最好背叛亨利和该团伙的其他成员。 另一方面,如果亨利(Henry)背叛并反对戴夫(Dave)作证,那么戴夫(Dave)的选择要么保持沉默,三年,要么谈,并入狱两年。 再一次,显然,他宁愿在三年内完成两年。
在这两种情况下,无论亨利是与戴夫合作还是对起诉人有缺陷,如果戴夫本人背叛并作证,他都会更好。 现在,由于亨利面临着完全相同的选择,他也总是会更好地背叛。 囚徒困境的悖论是这样的:两个劫匪只有在两个人合作的情况下(总共两年),才能最大限度地减少他们两个人的总监禁时间,但是他们各自面对的诱因总是会驱使他们每个人最终导致两者之间的最长总服刑时间(共4年)。
囚徒困境的例子
经济中充满了囚徒困境的例子,其结果可能对整个经济和社会都是有利或有害的。 共同点是,每个选择的决策者所面对的激励都会促使他们的行为方式使他们集体变得更糟,而每个人都避免选择会使得他们集体变得更好的选择。有些合作选择。
一个这样的例子就是公地的悲剧。 保存并重新投资于共同库自然资源的传播以便能够继续消费,可能是每个人的集体优势,但是每个人总是有动力去尽可能快地消费。然后耗尽资源。 寻找某种合作方式显然会使这里的每个人都变得更好。
另一方面,卡特尔的行为也可以被视为囚徒的困境。 卡特尔的所有成员都可以通过限制产出以保持各自获得的足够高的价格来捕获消费者的经济租金,从而共同丰富自己,但每个卡特尔成员都有动机诱骗该卡特尔并增加产出,从而从中获取租金其他卡特尔成员。 就卡特尔所服务的整个社会的福利而言,这是一个例子,说明囚犯打破卡特尔的困境有时实际上可以使整个社会变得更好。
逃离囚徒困境
随着时间的流逝,人们为解决囚徒的困境制定了各种解决方案,以克服个人动机,以支持共同利益。
首先,在现实世界中,大多数经济和其他人与人之间的互动不止一次地重复。 真正的囚徒困境通常只玩一次,否则就被归类为反复的囚徒困境。 在一个反复的囚徒困境中,玩家可以选择策略来奖励合作或随着时间的推移惩罚叛逃。 通过与同一个人反复互动,我们甚至可以有意识地从一次囚犯困境转变为反复囚徒困境。
其次,人们制定了正式的制度策略来改变个人决策者面临的激励措施。 通过声誉,规则,法律,民主或其他集体决策来实施合作行为的集体行动,以及对叛逃者的明确社会惩罚,将许多囚犯的困境转化为更集体有利的合作成果。
最后,一些人和一群人随着时间的推移出现了心理和行为偏见,例如彼此之间的信任度更高,在反复互动中的长期未来取向以及倾向于合作行为的正向互惠或缺陷行为的负向互惠。 这些趋势可能通过一段时间内社会中的一种自然选择或跨不同竞争性社会的群体选择而演变。 实际上,它们导致一群人“非理性地”选择实际上对他们所有人最有利的结果。
综合考虑这三个因素(反复的囚徒困境,打破囚徒困境的正规机构以及破坏囚徒困境中“理性”个人选择的行为偏见)有助于解决我们否则将面临的许多囚徒困境。