信游平台:囚徒困境中的几个问题

发布日期:2019-03-06 10:45 来源:

囚徒困境是博鳌理论的重要范式。对这个问题的研究涉及广泛的领域,如经济学,政治学,社会学,哲学和伦理学。本文简要介绍和评述了中外学者在研究这一问题上取得的成就以及在解释过程中提出的各种意见。由囚犯困境引发的个人理性与集体理性,个人主义和道德主义之间的关系加深了对这些问题的理解。最后,本文介绍了计算机博弈方法研究重复囚徒困境和合作问题的结果,分析了“一报一报”过程成功的原因和条件。合作。

关键词囚徒困境理性道德合作

1.囚犯的困境是什么?

1994年10月12日,瑞典皇家科学院向John Nash,J。Harsanyi和Reinhard Zellten宣布了诺贝尔经济学奖。 (reinhardselten)表彰他们对博弈论(也称为博弈论或博弈论)应用于现代经济分析的杰出贡献。以此为契机,1995年,中国引入了一个小“热”的博鳌理论。许多读者可能已经注意到,引入博理论的几乎所有文章都提到了所谓的囚犯的困境。

囚徒困境的原始文本是个人的困境,这也被解释为囚徒困境,囚犯问题等等。这个问题最早是在1950年由社会心理学家Merrill M. Merilm.flood和经济学家Melvindresher发现的,后来由Albert W. Albertw.tucker清楚地描述了这个“困难”[1,p。 3]。纳什在1950年和1951年分别发表了两篇关于非合作博鳌的文章。有人认为塔克与纳什的工作一起“基本上奠定了现代非合作博弈论的基石。[2]囚徒困境的重要性和意义不难想象。

所谓的囚徒困境可简要描述如下

涉嫌串谋犯罪的两名嫌犯被逮捕并被警方分开关押。他们所面临的选择要么是坦率的,要么是沉默的(即不承认)。他们被告知,如果嫌疑人被供认并且他的同谋没有供认,忏悔者是自由的,并且拒绝供认并被判处10年徒刑;如果两人都被供认,则两人均被判处五年徒刑;如果两人都没有供认,两人都被判处一年徒刑。

在上述情况下,我们还可以使用支付矩阵来表达以下内容

怀疑B

弗兰克沉默

信游平台:囚徒困境中的几个问题

嫌疑人忏悔-5,-50,-10沉默-10,0-1,-1

在这种情况下,两位嫌疑人将如何决定和选择?

在对囚徒困境的分析和推论中,有以下前提设置:1游戏中的每个人(两名囚犯陷入困境)都知道“博鳌规则”和“博鳌结果”的支付规则;游戏中的人都是理性的,这里所谓的“理性”意味着只有两种选择。他总会选择一个对他更有利的人;三个玩家是相互隔离不能“勾结”而不能“对齐”。

在这种情况下,两名囚犯如何分析问题并运用“合理性”以及结果如何?

从A的“位置”,有两种可能的情况。第一种可能性是B采用坦诚的策略。这时,如果他也供认不讳,他将被判入狱5年。如果他不承认,他将被判处10年徒刑。比较两者,他得出结论认为他应该“承认”“B的忏悔策略。第二种可能性是B采取沉默策略。如果他保持沉默,他将被判处一年徒刑。如果他承认,他将会另一方面,结论是他应该坦率地处理B的“沉默”策略。综合以上两种可能情况的结论,“一般结论”是B是采用认罪策略还是沉默策略,A采取坦率的策略作为一种更“好”的对策;因此,A采用了一种忏悔策略。

显然,上述推理也适用于B.

通过这种方式,两名囚犯在“谨慎推理”后采取了坦率的策略,结果是两人都被判处五年徒刑。

不难看出这种推理似乎有一些矛盾的因素;因为如果囚犯A和B都采取沉默策略,他们两人都只被判入狱一年,显然这比两人好。两人都被判入狱5年,结果更好。然而,两位富有“理性计算”精神的囚犯在计算出“逻辑正确”后采取了坦率的策略,并获得了被判五年徒刑的结果。

这里,“逻辑正确”是因为A和B都基于以下推理形式。

(1)p或q

(2)如果p,那么r

(3)如果q,那么r

信游平台:囚徒困境中的几个问题

所以r

显然,这是一种正确的逻辑推理形式。

需要指出的是,上述案例中的具体数字并不重要,即使四种可能的结果组合是否可以“数字化”并不重要;问题的关键是四种可能结果的结合。对于各方而言,“好”和“信游平台:坏”的程度构成了有序的“序列”。也就是说,各方(上述案例中的“囚犯”)可以将这四个结果与他们认为的“最佳”,“次佳”,“第三最佳”和“最差”顺序进行比较。

为了更加突出和突出地显示囚徒困境中的“两难”甚至“悖论”因素,有些人捏造了一种更“典型”的情景[1,p.6](根据以下中文评论,为了理解,略有变化)假设在上述“案件”中,法院向两名囚犯“宣布”了新的“判决规则”。如果他们两个都承认他们的供词,他们将被判刑。如果两人保持沉默,两人将被无罪释放并赔偿1000元;如果一个人供认,一个人保持沉默,那么供认将是免费的,一万元将得到奖励,消音器将被推迟。执行。在这个“案例”中,“无情”和“严格”的逻辑将使两个“理性”的囚犯共同选择一个忏悔策略,从而用一把锋利的刀开始断头台,而不是选择一起沉默以获得自由而你也可以把1000元放在包里。这实际上是“理性人”的“理性”选择吗?其次,对囚徒困境的一些分析和实例

在库恩的“范式”理论中,范式的重要意义就是一个例子。然而,许多人只关注范式作为“理论框架”和“科学方法”,忽视范式作为一个例子。事实上,在科学理论体系和科学活动中,范式所起的作用不容小觑。不难看出,囚徒困境是游戏理论中的一个重要例子。

人们可能会认为,囚徒困境只是“象牙塔”中理论家的“思想游戏”,或者是一个罕见的特例。这真是一种错觉。

应该承认,囚徒困境最初是“象牙塔”中“抽象理论思维”的“产物”。像象牙塔中的许多其他产品一样,人们越来越意识到它实际上与“现实世界”密切相关。

已经发现,在经济学,政治学,社会学和现实生活中存在许多囚犯困境。

博鳌专家,经济学家,政治学家,社会学家,哲学家,伦理学家和社会心理学家对囚犯困境的原因,条件,性质和重要性的许多方面进行了大量研究。 。

有人指出,在囚犯困境的“案例”中,两个局内的人无法相互沟通是一种限制性条件,因此他们设想这是囚徒困境的“原因”。例如,有些人说“囚犯的苦恼是他们不能讨论沟通。” [3]因此,有些人提出了以下解决问题的方法。两个局可以“沟通,然后合作”。

反对者认为这没有帮助,也无法解决问题。 “显然,一个囚犯保持沉默的意图不会导致另一个囚犯有同样的意图.——如果对方无视这个意图。没有沟通的假设对于囚犯的困境并不重要。可以增加沟通条件,但这仍然没有任何区别。只假设每个人对可能结果的偏好与以前相同,并且每个人都可以自由选择与另一个人的意图相悖的策略。每个囚犯都可以对另一个囚犯,如果你保持沉默,那么我将保持沉默';然而,只有一个囚犯可以自由地说一套和另一套,那么这种困境不会改变。 “有些人可能会认为可能存在强制性协议条款,例如违反协议的具体处罚,这将改变囚犯的优先顺序。这些假设将改变原始决策问题的结构。我们一直认为,一方只对可能获得的最有利结果感兴趣,并严格遵守他的偏好顺序。在这种假设下,合作'协议'似乎没有区别。“([1],Pp.9-10)

从上面的分析可以看出,囚徒困境的“危害”不是沟通问题。有些人可能会认为,囚犯困境的“危害”在于,局内每个人只关心自己的利益,对别人的利益漠不关心。他甚至毫不犹豫地为了自身利益而违反“协议”。这是囚徒困境的“伤害”。因此,有些人提出了相应的问题答案而不是自我主义者。“至少在目前的叙述方面,这个答案是基于误解而失败。在这种情况下,对'自我主义者'最自然的解释是那些——不仅仅是——,而只关注个人因此,只关心他将在监狱中待多久的囚犯是一个利己主义者。然而,显然囚犯的困境不一定局限于这种意义上的自身利益。可以构建一些例子。在他们选择的环境中,他们是无私的。读者可以回忆起游戏中玩家的所有偏好只有一定的顺序。这个序列背后的动机可能是自私,利他或两者兼而有之。 “我们可以说,我们可以很容易地构建另一个示例场景和条件,与本文开头的示例相同,但假设两个囚犯正在做决策时,确定订单的标准优先选择并不是唯一完全且只是自我利益的,而是唯一的利他主义标准。结果会改变吗?没有。在这个“利他主义者”的“情景”中,所谓的囚徒困境仍然是一个“困难”。因此,囚犯困境的前提条件是偏好的分歧而不是自私或对他人漠不关心[1,p。 10]

值得注意的是,当中国学者对囚徒困境进行介绍,解释和评论时,许多人特别强调囚犯的困境凸显了个体理性与集体理性之间的矛盾。例如,张维迎说“囚徒困境反映了一个非常深刻的问题,即个体理性与集体理性之间的矛盾。”([2],第123页)郑业富说“理性的个体,一起变为非“一个理性的社会。” [3]毛玉玺说:“囚犯的问题具有深刻的意义。它解释了为什么目标短视的利益会导致每个人的不良后果。” [4]李子江使用专业学者。该术语指出,在囚徒困境中,“双方将选择最大化自身利润并最小化风险的策略,从而导致出现稳定的对策平衡点。”这就是所谓的纳什均衡点(定义为其他参与者不改变)。战略,任何单一参与者都无法通过单边转型策略来改善其支付方式)。但是这个纳什均衡点并不是全局最优解(帕累托最优)。 “可以看出,当双方采用最优战略时,整个对策系统质量低劣。” [5]这些术语的含义被“易于理解”一词所取代,也被认为是囚犯的困境揭示了“个人理性和集体理性之间存在着内在的矛盾”。

中国学者引用了许多我们读者都熟悉的囚犯困境的例子。

在人民公社制度下,“如果每个人都做得好,食物就更多了,难道你们都不会变得更好吗?问题是我做得好,你做得不好,我痛苦,你做得好,我我做得不好。我利用它,所以纳什均衡是每个人都做得不好,而且他们很饿。“ ([2],第124页)在囚犯困境中,两名囚犯都选择了坦诚的忏悔策略。 “这个结果与他们是否真的有罪无关(根据本段的方便性,当引用略微改为原文时,但原文的原意没有修改),他们甚至会承认如果他们没有罪。选择。在宽容的承认和对严格政策的抵制中的“文化大革命”使得许多人有可能承认他们自己的“罪行”,而神秘就在于此。 [4]此外,每个人都经常挤公交车,每个人都讨厌风的贿赂也是囚徒困境的“表现”。

实际的现实生活很复杂。已经发现,囚徒困境的“社会影响”并不总是消极的。在某些条件下,它也可能具有一些社会效益。

经济学中最常被引用的例子是卡特尔欺骗和寡头垄断的定价[6] [7]。想象一下两个寡头垄断的制造商。如果遵守协议的垄断价格,两个寡头都可以获得高额利润。如果一方违反协议以降低价格,它将获得更高的利润,而另一方只会因产品销售缓慢而获得少量利润。这两位寡头根据这种“思考”考虑了定价策略。结果,每个人都没有遵守协议并降低了售价。结果,他们无法获得高额利润,但只有较少的利润。很容易看出卖方在这种情况和条件下的垄断寡头集团陷入了囚徒困境,有利于消费者和社会。因此,法律上不允许许多国家垄断与卖方的垄断价格协议。

引用

[1] r.campbelandl.sowden(ed。),paradoxesofrationalityandcooperation,prisoner \'sdilemmaandnewb \'sproblem,vancouver,the university ofbritishcolumbiapress,1995。

[2]张维迎从1994年诺贝尔经济学奖(1-7)看到主流经济学的新发展,最初出版《经济学信息报》,转载于报刊杂志《理论经济学》,1985年,第6期, 119-131页。

[3]郑也夫《走出囚徒困境》,光明日报出版社,1995年,第3页。 201。

[4]毛玉珍《生活中的经济学》,上海人民出版社,智慧出版有限公司,1993年,第254-256页。

[5]李子江《关于纳什均衡点的研究》,《学术研究》,1995年第2期,第43-49页。

[6] Lloyd Reynolds《微观经济学》,由Mabin翻译,商业出版社,1986年,第218-219页。[7]范瑞安《微观经济学现代观点》费芳玉等翻译,上海三联书店,1992年,第7页。 599。

[8] Yueyin“失败的垄断”,《中国经济时报》,1996年2月23日,第1版。

[9] John Rawls《正义论》,何怀红译,中国社会科学出版社,第260,564页。

[10] Robert Nozick《无政府、国家与乌托邦》,何怀红译,中国社会科学出版社,1991,p。 124。

[11] d.r.hofstadter“囚犯的谜题计算机游戏表明合作是如何演变的”,《科学》,1983年,第9期,第91-98页。

[12]北京大学外国哲学史系编辑《西方哲学原著选读》Vol。,Commercial Press,1982,pp.397-398。

[13]张昕的“对策论”,由唐敏和毛玉玺编着《现代经济学前沿专题》第一集,商务印书馆,1989年,p。 235。