您当前的位置:首页 > 养生 > 内容

纯战略纳什均衡(纯策略纳什均衡计算)

本篇文章给大家谈谈纯战略纳什均衡,以及纯策略纳什均衡计算对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。

1什么是纳什均衡,有何作用?

纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。

当每个球员的平衡策略是达到其预期收益的更大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。

扩展资料;

纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。

要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。

所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略 *** 是玩家可以执行的纯策略 *** 。

混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到更优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。

当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。

因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。

然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。

参考资料来源;百度百科——纳什平衡

2纳什均衡

 

定义 :

指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。

纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在。

分类 :

纯策略纳什均衡”和“混合策略纳什均衡

“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱币问题”就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。

 

案例:  

1. 价格战

两家公司打价格战时,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash均衡。

 

2. 囚徒困境

有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

囚徒困境博弈分析

A╲B坦白抵赖

坦白   -8, -80, -10

抵赖  -10, 0-1,  -1

关于案例,更好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。

从“纳什均衡”中引出“看不见的手”原理的一个悖论: 从利己目的出发,结果损人不利己,既不利己也不利他。

3. 智猪博弈

猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

 

4. 饿狮博弈

假设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。假设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?

为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。假设狮子E睡着了,狮子F敢不敢吃掉狮子E?答案是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。

继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。

再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以答案是狮子A不敢吃掉绵羊。

推理结果如下图:

但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的答案变成了狮子A敢吃掉绵羊。

对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。

 

影响:

纳什均衡理论 奠定了现代主流博弈理论和经济理论的根本基础 。

纳什均衡的影响可以概括下边六个方面:

1. 改变了经济学的体系和结构

非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。

2. 扩展了经济学研究经济问题的范围

原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析 *** ,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念 *** ,为经济学家们提供了深入的分析工具。

3. 加强了经济学研究的深度

纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。

4. 形成了基于经典博弈的研究范式体系

即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析 *** 和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。

5. 扩大和加强了经济学与其他社会科学、自然科学的联系

纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。

6. 改变了经济学的语言和表达 ***

在进化博弈论方面相当有造诣的日本经济学家神取道宏(Kandori Michihiro,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。

3博弈论(2)—纳什均衡

如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和使用头像一致。

又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作 更佳应对 。 如果两个博弈的局中人的策略组合分别构成各自的 更佳应对 ,那么这个组合就被定义为纳什均衡。

在给出纳什均衡解释前,我们先得把一个概念说清楚更佳应对。

纳什均衡是刻画局势,如果一个局势下,每个局中人的策略都是相对其他局中人当前策略的更佳对应,则称该局势是一个 纳什均衡

如果一个局中人的某个策略对其他局中人的任何策略都是更佳对应,那么这个策略就是该局中人的 占优策略

在纳什均衡下,局中人没有人会想要改变改变,因为谁改变谁就可能在博弈中处于不利地位。

首先我们来看一看在囚徒困境中纳什均衡,对于囚徒困境的问题的纳什均衡是 双方都坦白 ,属于占优策略

其实不管局中人 2 是抗拒还是坦白,对于局中人的更佳应对都是坦白。从而可以看出纳什均衡点并不一定是整体的更优解。有人可能会说那么为什么不是对于两个人都有利的(抗拒,抗拒)呢,这里更佳应对是无论对手进行策略对自己都是更佳策略,在最后 maxmin 时候就更会了解为什么他们会做出坦白选择,这是一个规避风险的策略。

img src="./image_003/005.jpg"

这就是纯策略纳什均衡,混合策略下纳什均衡,女生看舞蹈概率 p 看足球的概率就是 1 - p,男生看舞蹈概率 q 看足球的概率就是 1 - q

妻子随机性的目的: 使丈夫无机可乘,不管丈夫选择哪个策略,其期望收益均相同

当丈夫给出概率分布不会让妻子在看足球和看,关于

以我对丈夫了解他更喜欢看足球,

局中人 1 的策略选择分布记为 , 局中人 2 的策略选择分布记为 。假设局中人 1 的策略分布不变,局中人 2 策略选择的效用为

剪刀—石头—布的混合 纳什均衡态

任何有限博弈(参与人与策略数目均为有限)都至少存在一个纳什均衡,这个均衡可能是纯策略纳什均衡(例如剪刀-石头-布),也可能是混合策略均衡,纳什均衡的多重性(例如性别之战)

好了,关于纯战略纳什均衡和纯策略纳什均衡计算的分享到此就结束了,不知道大家通过这篇文章了解的如何了?如果你还想了解更多这方面的信息,没有问题,记得收藏关注本站。


声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,谢谢。

上一篇: 喝普洱茶有什么好处及坏处(喝普洱茶好处和坏处)

下一篇: 法最早产生于原始社会末期(法最早产生于原始社会)



推荐阅读

网站内容来自网络,如有侵权请联系我们,立即删除! | 软文发布 | 粤ICP备2021106084号