永发信息网

囚徒困境中一定会出现纳什均衡吗?在有关囚徒困境的问题中,是不是一

答案:1  悬赏:70  手机版
解决时间 2021-01-03 21:30
囚徒困境中一定会出现纳什均衡吗?在有关囚徒困境的问题中,是不是一样可以应用纳什均衡进行解释?初学者求解析。
最佳答案
纳什均衡,Nash equilibrium,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。纳什均衡是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。
囚徒困境,prisoner's dilemma ,两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护、人际关系等方面,也会频繁出现类似情况。
纳什均衡和囚徒困境是完全两种不同的策略组合。
假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡。
换言之,纳什均衡是最优策略。
囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的个体的理性要求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚,或者损害集体的利益。
单次和多次的囚徒困境,结果不会一样。
在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为平衡的结果出现。欺骗的动机这时可能被惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。反复的、接近无限的重复次数时,纳什均衡趋向于帕累托最优,从互相背叛趋向于互相忠诚。
囚徒困境则是明知最优策略却不能选最优策略。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
石油的英语怎么说
面积最大的洲和面积最大的洋分别是A.亚洲、太
苹果保修需要带什么
手出现裂缝,痒,挠了起水泡是怎么回事?
The news spread quickly through the villag
成吉思汗的出生地当时是我国领土吗?
单选题对下列词语的理解有误的一项是A.异端:
如何去除车漆上的水泥点
下列度数不能够直接用一副三角尺拼出来的是A.
虫加此念什么
JAKARTA, INDONESIA - Walking with long ste
单选题Aftersheputthebabyinbed,shegotd
手机如何建立文件夹
下列说法正确的是A.曲线运动不可能是匀变速运
和暴怒嘶吼差不多的喊法
推荐资讯
百色市住房公积金管理中心乐业管理部地址在什
单选题有关香港环境的说法正确的有A.香港特别
微信被停用朋友圈功能怎么办
单选题洗衣机的洗涤容量为A.0.5kgB.5kgC.50kg
有像方正阿帕比一样的网站吗?
如果|a-1|=a-1,那么a的取值范围是________.
闽侯县国土资源局地址有知道的么?有点事想过
概组什么词
选出下列词语中注音有误的一项A.裁度duó 玷d
苏州旅游路线
下列多项式中是二次三项式的是A.x+1-x2B.x+y+
开普勒第三定律在圆轨道和椭圆轨道之间成立吗
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?