囚徒大家或许知道是什么意思,可是囚徒困境、囚徒困境博弈以及 囚徒效应 是什么意思,大家能理解吗?今天就跟着花镇小编脑补一下这些知识吧。
一、囚徒困境是什么意思?
囚徒困境是博弈论中非零和博弈的代表性的例子,反映个人最佳选择并非团体最佳选择。或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。虽然困境本身只属模型性质,但现实中囚徒困境的例子屡见不鲜。
“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。
囚徒困境(prisoner's dilemma ):两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护、人际关系等方面,也会频繁出现类似情况。
二、囚徒困境博弈
如同博弈论的其他例证,囚徒困境博弈假定每个参与者(即“囚徒”)都是利己的,即都寻求自身利益,而不关心另一参与者的利益,这也就是经典经济学中的“理性人假设”。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
整理囚徒困境的基本博弈结构,可更清楚地分析囚徒困境。 实验经济学常用这种博弈的一般形式分析各种论题。以下是实现一般形式的其中一例:
有两个参与者和一个庄家。参与者每人有一式两张卡片,各印有“合作”和“背叛”。参与者各把一张卡片文字面朝下,放在庄家面前。文字面朝下排除了参与者知道对方选择的可能性。然后,庄家翻开两个参与者卡片,根据以下规则支付利益:
· 一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。
· 二人都合作:各得3分(合作报酬)。
· 二人都背叛:各得1分(背叛惩罚)。
简单博弈获得的点数可以得出一些一般化的结论。
若以T(Temptation)=背叛诱惑,R(Reward)=合作报酬,P(Punishment)=背叛惩罚,S(Suckers)=受骗支付,以个人选择得分而言,可得出以下不等式。
T>R>P>S
(解:从5>3>1>0获得以上不等式)
若以整体获分而言,将得出以下不等式。
2R>T+S或2R>2P
(解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及单独背叛的共得5分,显然合作获分比背叛高。合作在团体而言是支配性策略。)
而重复博弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T+S。就是说将使参与者脱离困境。以上理论是道格拉斯·霍夫施塔特(侯世达)创建的。
三、什么是囚徒效应?
囚徒效应的核心态念:博弈全输,合作双赢,怀疑或不信任导致失败。
囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚,或者损害集体的利益。
而囚徒效应相信大家能从这个故事中了解到。
四、囚徒的困境
《囚徒的困境》是2011年北京理工大学出版社出版的图书,作者是威廉姆·庞德斯通(William Poundstone)。该书揭露了战后令人毛骨悚然的一些政府间的尔虞我诈,是一本关于博弈论及其在冷战和核军备竞赛中的作用的出色的社会历史教科书。
本书用简明易懂的方式阐明了博弈论,是一部真正具有独创性的作品,体现在它以丰富的史料,开阔的视野和合乎逻辑的分析,以生动和直率的方式向读者讲述了冷战的历史,核时代的策略游戏和冯·诺伊曼的生平。揭露了战后令人毛骨悚然的一些政府间的尔虞我诈,是一本关于博弈论及其在冷战和核军备竞赛中的作用的出色的社会历史教科书。
本书的视角十分广阔。作者围绕冯·诺伊曼的生平和博弈论这两条主线,实际上向读者展现了二战以后、冷战初期国际政治舞台上的矛盾和冲突,并试图分析其根源。这部书让我们比较详细地了解了美国以至整个西方在战后围绕要不要发展原子武器,围绕关于“先发制人的战争”所展开的大辩论,比较详细地了解了20世纪60年代初震动全世界的古巴导弹危机的经过和内幕。
威廉·庞德斯通以《囚徒的困境》作为探寻这位美籍数学家的生平和20世纪广阔历史的透镜,让读者看到了一位有血有肉、活灵活现的科学家,看到了抽象难懂的数学概念如何变成生活中的思维工具,看到了“二战”之后国际政治舞台上的矛盾和冲突……
时间:2024-04-09
时间:2024-01-27
时间:2024-04-15
时间:2024-01-27
时间:2024-04-08
时间:2024-01-27
时间:2024-01-27
时间:2024-04-09
时间:2024-01-27
时间:2024-04-15
时间:2024-04-09
时间:2024-01-27
时间:2024-01-27
时间:2024-04-11
时间:2024-01-27
时间:2024-04-08
时间:2024-01-27
时间:2024-01-27
时间:2024-04-15
时间:2024-01-27