《自己的博弈论》PPT课件.ppt
《《自己的博弈论》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《自己的博弈论》PPT课件.ppt(67页珍藏版)》请在装配图网上搜索。
博弈与信息GamesandInformation,潘瑞姣panruijiao,课程框架,博弈论博弈规则混合策略对称信息动态博弈重复博弈不对称信息动态博弈,信息经济学道德风险逆向选择信号传递信息甄别,应用讨价还价拍卖,第一讲博弈规则,博弈论关注的是意识到其行动将相互影响的决策者们的行为。,案例1酷暑,两个因赶路而又饿又渴的人在路边发现了一个免费的西瓜。怎样将西瓜在这两个人之间尽可能地公平分配?,案例25个海盗在一个荒岛上发现了100颗钻石,其中每一颗都价值连城。这5个海盗在返航途中被一个国王擒获。国王给这5个海盗出了个难题。国王首先让这5个海盗抽签决定每个人号码,即1、2、3、4、5,抽到1号码的人第一个提出分配方案,交有5个海盗表决,如果得到一半以上海盗(即三个海盗,包括本人)的支持,按该方案分配钻石,海盗可以安然离开。否则号码为1的海盗一颗钻石也得不到,而且要被扔到海里喂鲨鱼。海盗之间不准就分配方案进行商量。,如果1的方案没有被通过,然后由号码为2的海盗再提出分配方案,同样如果得到剩余海盗一半以上(包括本人,即3个海盗)的支持,即按该方案执行,否则号码为2的海盗象号码为1的海盗一样,一颗钻石也得不到,而且要被扔到海里处死,给鲨鱼吃。如果2的方案没有被通过,再由3提出方案,依次类推。,问题:如果你是5个海盗中的一个,并且有幸或不幸抽中了第一个号码,你将提出什么样的分配方案?假设海盗是理性的,且只考虑自身利益的最大化,无暇顾及曾经并肩战斗的战友友谊。,案例3两家体育类报纸之间的竞争假设二者的发行完全市场化,所以主编在选择头版头条新闻的时候,首先要考虑哪一条新闻能吸引报摊前的买主。假如你是其中一个杂志的主编,你要决定明天的头版新闻。你面临的情况如下:有两条新闻可供选择,一个是有关姚明的NBA比赛新闻,一个是有关刘翔的田径比赛新闻。报摊前的买主只会在这两种报纸间进行选择,其中70的人对前者更感兴趣,30的人对后者更感兴趣。如果双方选择不同的新闻,则会分别获得70和30的份额。如果选择相同的新闻,则感兴趣的买主平分为两组,分别买两种报纸。两个杂志不能合谋,且都清楚上述情况。此时你会选择哪个新闻作为头版?,更多例子OPEC成员国选择其石油年产量公司董事会为其经理设立一项期股安排一名本科生决定是否报考硕士研究生美朝核问题、印巴核问题,描述一个博弈参与人(Players)行动(Actions)信息(Information)策略(Strategies)支付(Payoffs)结果(Outcome)均衡(Equilibrium),参与人是指作决策的个体。每个参与人的目标都是通过选择行动来最大化自身的效用。举例:OPEC1模型参与人:沙特阿拉伯(S)其他石油生产国(O)问题:日本,法国是否是参与人?,TheOrganizationofthePetroleumExportingCountries(OPEC)isapermanent,intergovernmentalOrganization,createdattheBaghdadConferenceonSeptember1014,1960,byIran,Iraq,Kuwait,SaudiArabiaandVenezuela.ThefiveFoundingMemberswerelaterjoinedbynineotherMembers:Qatar(1961);Indonesia(1962);SocialistPeoplesLibyanArabJamahiriya(1962);UnitedArabEmirates(1967);Algeria(1969);Nigeria(1971);Ecuador(1973)suspendeditsmembershipfromDecember1992-October2007;Angola(2007)andGabon(19751994).OPEChaditsheadquartersinGeneva,Switzerland,inthefirstfiveyearsofitsexistence.ThiswasmovedtoVienna,Austria,onSeptember1,1965.,虚拟参与人(Pseudo-players)自然是一个虚拟参与人,它在博弈的特定时点上以特定的概率随机选择行动。用D表示世界对石油的需求。需求在两个定值中取一个,在博弈之初,自然随机的决定石油需求是弱还是强,弱的概率是70%,强的概率是30%。一个博弈因随机变动的不同而有着不同的结果。,行动参与人i的行动以表示,是他所能做的某一选择。参与人i的行动(Actionset),是其可以采用的全部行动的集合。一个行动组合(Actionprofile)是一个由博弈中的n个参与人每人选取一个行动所组成的有序集,。,在OPEC1模型中,我们将所有参与人的行动集设定为相同的,要么选择高产量水平H,要么选择低产量水平L,以表示1988年沙特阿拉伯选择高产量水平。,行动顺序(Orderofplay)1,自然选择需求D=H,或D=L;2,沙特阿拉伯从如下行动集中选择其1988年和1999年的产量;其他石油生产国从其相应的行动集中选择行动。,信息集参与人在特定的时点对不同变量取值的了解。我们假定,在自然行动后,沙特阿拉伯知道世界石油需求的准确情况,但其他石油生产国不知道。因此,信息集为:其他生产者:D=强,D=弱沙特阿拉伯:D=强或D=弱参与人的信息集还包括对已发生的行动的了解,因此,信息集随着博弈进程的变化而变化。,策略参与人i的策略是如下一项规则:给定其信息集,该策略决定参与人在博弈的每一时点选择何种行动。参与人i的策略集(Strategyset)或策略空间(Strategyspace)是其可行策略的集合。策略组合(Strategyprofile)是由博弈的n个参与人每人选择一个策略所组成的有序集。策略仅仅是一个关于观察到的历史情况的函数,而不是关于当前行动或是关于别的参与人策略的函数。,沙特阿拉伯的策略集中的一个策略是:,L,如果D=弱H,如果D=强,L,如果D=弱,H,如果其他情况发生,因为参与人想采取的行动取决于自然和其他参与人过去的行动,所以策略的概念是不可或缺的。参与人的策略是一个关于其行动程序的完备集合,它告诉参与人在每种可预见的情况下选择什么行动,即使参与人并不预期那种情况真的会出现。策略与行动的不同之处在于策略是不可观测的。,支付参与人i的支付表示:(1)在所有参与人和自然都选择了各自的策略且博弈已经完成之后,参与人i获得的效用。(2)参与人i获得的期望效用,该期望效用是参与人i及其他参与人所选择的策略的函数。,结果一个博弈的结果指在博弈结束后,建模者从行动、支付和其他变量的取值中所挑选出来的他所感兴趣的要素的组合。OPEC1模型的一个结果是:,区分策略组合与结果结果可以由下述任一策略组合产生:黄金规则,无论如何都选择低产量:,沙特阿拉伯:,其他石油生产国:,白银规则:,沙特阿拉伯:,其他石油生产国:,均衡均衡是指由博弈中的n个参与人每人选取的最佳(均衡)策略所组成的一个策略组合。均衡策略(Equilibriumstrategies)是指由博弈中的n个参与人在最大化各自支付时所选取的策略。,优势策略:囚徒困境优势策略均衡如果无论其它参与人选择什么策略,策略都是参与人i的最佳应对,那么就称为优势策略(Dominantstrategy)。这意味着无论别人选择什么策略,都使参与人i的支付最大化。从数学上讲,就是:,对于参与人i而言较差的策略称为劣势策略(Dominatedstrategy)。优势策略均衡(Dominatestrategyequilibrium)是由每个参与人的优势策略所组成的策略组合。,囚徒困境(Theprisonersdilemma),(-1,-1),(0,-10),(-10,0),(-8,-8),囚徒困境的特点:两败俱伤军备竞赛,价格战,合作博弈与非合作博弈若参与人之间能达成有约束力的协议,则该博弈称为合作博弈(Cooperativegame),否则为非合作博弈(Non-cooperativegame)。,重复剔除优势均衡只有极少数的博弈存在优势策略均衡,但有时优势策略的思想仍然是有用的,即使它并不像在囚徒困境那样干脆利落的解决问题。,俾斯麦海之战1943年,日本海军上将木村受命将日本陆军运抵新几内亚,其间要穿越俾斯麦海。而美国海军上将肯尼欲对日本运输船进行轰炸。木村有两条路线可以选择,较短的北线和较长的南线。而肯尼必须决定将其飞机派往何处去搜索日军。如果肯尼将他的飞机派到了错误的路线,他虽然可以召回它们,但可供轰炸的时间就会减少,从而贻误战机。,俾斯麦海之战,北,南,北,南,肯尼,木村,(2,-2),(1,-1),(2,-2),(3,-3),弱优势策略对于参与人i的策略来说,如果存在有可能比好而绝不会比差的另一策略,即在某些策略组合下可带来更高支付而决不会产生更低支付,那么我们说弱劣于。从数学上讲,就是:,弱优势策略均衡(Weakdominantstrategyequilibrium)在剔除了每个参与人的全部弱优势策略后所得到的一个策略组合。但是,仅仅运用优势策略均衡的概念我们仍旧无法找到“俾斯麦海之战”中的均衡。为什么?重复剔除优势均衡我们首先从某一参与人的策略集里剔除掉一个弱劣策略,再重新考察各个参与人剩下的策略中哪些是弱劣的并剔除,继续这一过程直到每个参与人都仅剩一个策略。这样得到的策略组合就是重复提出优势均衡。,思考1:请运用重复剔除优势策略均衡的概念找到“俾斯麦海之战”的均衡。,思考2如果给你两个师的兵力,由你来当“司令”,任务是攻克敌人占据的一座城市,而敌军的守备力量是三个师,规定双方的兵力只能整师调动。通往城市的道路只有甲乙两条。当你发起攻击的时候,你的兵力超过敌人,你就获胜;你的兵力比敌人的守备兵力少或者相等,你就失败。那么,你将如何制定攻城方案?敌我双方哪一方获胜的概率更高?,分析:1,敌军有哪几种部署方案?2,我军有哪几种部署方案?,敌军,a,b,A,B,我军,(-,+),(+,-),(-,+),(-,+),C,D,c,(+,-),(-,+),(+,-),(+,-),(+,-),(+,-),(-,+),(-,+),零和博弈(Zero-sumgame)可变和博弈(Variablesumgame),纳什均衡对于决大多数博弈来说,重复剔除优势均衡也不存在。我们需要引入纳什均衡这一最重要且最常见的均衡概念。,JohnF.Nash:JohnNashand“ABeautifulMind”,1928-,1994年诺贝尔经济学奖获得者,他是个天才,Whenthe21-yearoldJohnNashwrotehis27-pagedissertationoutlininghisNashEquilibriumforstrategicnon-cooperativegames,theimpactwasenormous.WhentheyoungNashhadappliedtograduateschoolatPrincetonin1948,hisoldCarnegieTechprofessor,R.J.Duffin,wroteonlyonelineonhisletterofrecommendation:Thismanisagenius.,数学贡献,Asanundergraduate,hehadinadvertently(andindependently)provedBrouwersfixedpointtheorem.Lateron,hewentontobreakoneofRiemannsmostperplexingmathematicalconundrums.Fromthenon,Nashprovidedbreakthroughafterbreakthroughinmathematics.,不幸岁月,In1958,onthethresholdofhiscareer,Nashgotstruckbyparanoidschizophrenia.HelosthisjobatM.I.T.in1959(hehadbeentenuredtherein1958-attheageof29)andwasvirtuallyencapsulatedbythediseaseforthenexttwodecadesorso.HeroamedaboutEuropeandAmerica,finally,returningtoPrincetonwherehebecameasad,ghostlycharacteronthecampus-thePhantomofFineHallasRebeccaGoldsteindescribedhiminhernovel,Mind-BodyProblem.Thediseasebegantoevaporateintheearly1970sandNashbegantograduallytoreturntohisworkinmathematics.,智猪博弈,按键,等待,按键,等待,大猪,小猪,(5,1),(9,-1),(4,4),(0,0),大股东和小股东大企业和小企业,思考:该博弈是否存在优势策略均衡?,纳什均衡在一个策略组合中,在其他参与人都不会改变已有策略的条件下,如果没有参与人有激励去改变自身的策略,则称为纳什均衡。正式的,有,一个纳什均衡策略只需要是对其他纳什均衡策略的最佳应对,而不必是对全部可能策略的最佳应对。弱纳什均衡强纳什均衡,囚徒困境2,抵赖,坦白,抵赖,坦白,行,列,(0,0),(0,-10),(-10,0),(-8,-8),问题:1,囚徒困境2有没有强优势策略均衡?有没有弱优势策略均衡?2,囚徒困境2有没有纳什均衡?是强纳什均衡还是弱纳什均衡?,囚徒困境2,抵赖,坦白,抵赖,坦白,行,列,(0,0),(0,-10),(-10,0),(-8,-8),性别战(Battleofthesexes),拳击,芭蕾,拳击,芭蕾,男,女,(2,1),(0,0),(0,0),(1,2),问题:1,性别战中是否存在重复剔除优势均衡?2,是否存在纳什均衡?,性别战,拳击,芭蕾,拳击,芭蕾,男,女,(2,1),(0,0),(0,0),(1,2),纳什均衡与帕累托有效在性别战中,任一纳什均衡都是帕累托有效的,其他任一策略都不可能在不降低其他参与人支付的条件下提高另一参与人的支付。囚徒困境中的纳什均衡是否是帕累托有效的?,性别战的经济运用:同一行业内的两家企业选择行业标准问题,分级协调(计算机软驱选择问题),大,小,大,小,甲,乙,(2,2),(-1,-1),(-1,-1),(1,1),参与者会偏好哪个纳什均衡?如果允许参与者之间进行信息交流,则哪个均衡更可能实现?,危险的协调,大,小,大,小,甲,乙,(1,1),(-1000,-1),(-1,-1),(2,2),这时哪个均衡更可能实现?,思考题设想有一男一女,他们各自选择是去看拳击还是去看芭蕾。男方想看拳击,女方爱看芭蕾。但对他们来说更重要的是,男方处心积虑想和女方出现在同一场合,可女方却想方设法躲着他。(1)构造一个博弈矩阵来表示这个博弈,选择相应的数值以符合上面文字描述的情况。(2)若女方先采取行动,将发生什么情况?(3)此博弈中是否存在先动优势?(4)证明若参与人同时行动,则不存在纳什均衡。,- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自己的博弈论 自己 博弈论 PPT 课件
装配图网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文