博弈论复习题及答案

上传人:灯火****19 文档编号:49951773 上传时间:2022-01-19 格式:DOCX 页数:25 大小:210.55KB
收藏 版权申诉 举报 下载
博弈论复习题及答案_第1页
第1页 / 共25页
博弈论复习题及答案_第2页
第2页 / 共25页
博弈论复习题及答案_第3页
第3页 / 共25页
资源描述:

《博弈论复习题及答案》由会员分享,可在线阅读,更多相关《博弈论复习题及答案(25页珍藏版)》请在装配图网上搜索。

1、判断题( 每小题 1 分,共15 分 )囚徒困境说明个人的理性选择不一定是集体的理性选择。(,)子博弈精炼纳什均衡不是一个纳什均衡。(X)若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(X )纳什均衡一定是上策均衡。(X)上策均衡一定是纳什均衡。(,)在一个博弈中只可能存在一个纳什均衡。(X )在一个博弈中博弈方可以有很多个。(,)在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(,)在博弈中纳什均衡是博弈双方能获得的最好结果。(X)在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(X )上策均衡是帕累托最优的均衡。(X)因为零和

2、博弈中博弈方之间关系都是竞争性的、对立的, 因此零和博弈就是非合作博弈。(X)在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(X)在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如: 在斯塔克伯格模型中,企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。(X)纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(,)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博

3、弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(,)多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(,)如果阶段博弈G=A1,A2,An;u1,u2,un)具有多重Nash匀衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的tT,在t阶段 的结局并不是GNas也衡。(,)(或:如果阶段博弈G=A1,A2,An;u1,u2,un)具有多重Nash匀衡,那么I重复博弈G(T)的子博 弈完美均衡

4、结局,对于任意的tT,在t阶段的结局一定是GNash匀衡。)零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。(,)(或:零和博弈的无限次重复博弈中,可能 发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。(X)原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益: 采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此, 不管是重复有限次还是无限次,不会和一次性博弈有区别。(V)原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益, 但惟一的纳什均衡不是效率最高

5、的战略组合,存在潜在合作利益的囚徒困境博弈。(V)(或:原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,不存在潜在合作利益的囚徒困境博弈。(X) 根据参与人行动的先后顺序,博弈可以划分为静态博弈(staticgame) 和动态博弈(dynamicgame)。如果阶段博弈Gt唯一的Nash匀衡,那么对任意有限次T,重复博弈G(T)有唯一的 子博弈完美结局:在每一阶段取 GNas制衡策略。(V)四、名词解释(每小题 3 分,共 15 分 )参与人 (player)指的是博弈中选择行动以最大化自己效用( 收益 ) 的决策主体,参与人有时也称局中人,可以是个人,也可以是企

6、业、国家等团体;策略 (strategy)是参与人选择行动的规则,如“以牙还牙”是一种策略;信息 (information)是指参与人在博弈中的知识,尤其是有关其他参与人的特征和行动的知识;支付 (payoff) 函数是参与人从博弈中获得的效用水平,它是所有参与人策略或行动的函数,是每个参与人很关心的东西;结果 (outcome)是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩阵来表示;均衡 (equilibrium)是所有参与人的最优策略或行动的组合。静态博弈指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动;动态博弈指参与人的行动有先后顺序,且后行动者能够观察到

7、先行动者所选择的行动。博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。零和博弈:也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈

8、比较稳定的结果严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略合作博弈非合作博弈零和博弈常和博弈变和博弈上策均衡纳什均衡纳什均衡:在博弈中,如果由各个博弈方的各一个策略组成的某个策略组合中,G S1, Sn;u1, un*任一博弈方的策略,都是对其余博弈方策略的组合(si , sn )*的最佳对策,也即(si , si 1,si 1,.sn)*对任意ui(si,si1,si,si1,.sn)ui(si,si1,sij ,si1,.sn)sijSi都成立,则称为的一个纳什均衡(或纳什均衡是指这样一种策略组合,这种策略组合由所有参与人的最优策略组

9、成, 即给定别人策略的情况下,没有任何单个参与人有积极性选择其他策略,从而没有任何参与人有积极性打破这种均衡。)完全信息博弈混合策略:在博弈中,GhBf花的策吟问为,则博弈方以概率分布随机在其k个可选策略中选择的“策略”,称为一个“混合策略”,其中Si si1, sikpi ( pi1, pik)对都成立,且j 1, ,k帕累托上策均衡 0 pij 1pi1pik 1风险上策均衡聚点均衡重复博弈 指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。阶段博弈重复博弈中的每次博弈称为“阶段博弈”。贴现因子下一期的一单位支付在这一期的价值。触发战略(TriggerStrategy )首先试探合

10、作,一旦发现对方不合作,则也用不合作相报复的战略。子博弈精炼纳什均衡(夫妻博弈)一对新婚夫妻为晚上看什么电视节目争执不下,丈夫(记为I 方)要看足球比赛节目,而妻子(记为r方)要看戏曲节目.他们新蜡燕尔,相亲相爱,所以若这方面的行动不一致,则是很伤感情的. 因此,这对夫妻间的争执是一次非零和对策。二、计算与分析题(每小题15分,共45分)1、无限次重复博弈与有限重复博弈的区别:a. 无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互 制约关系,使重复博弈无法实现更高效率均衡的关键问题。b. 无限次重复博弈不能忽视不同时间得益的价值

11、差异和贴现问题,必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必 须以平均得益或总得益的现值为根据。c. 无限次重复博弈与有限次重复博弈的共同点:试图“合作”和惩罚“不合作”是实现理想均衡的关键,是构造高效率均衡战略的 核心构件。2、可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者 提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的 大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:(1)如果双方都不涨价,各得利润10单位;(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润 100,百事可乐利润-30;(3)如果可口可乐涨价,百

12、事可乐不涨价,可口可乐利润 -20,百事可乐利润 30;(4)如果双方都涨价,可口可乐利润 140,百事可乐利润35;求纳什均衡。博弈的稳定状态有两个:都不涨价或者都涨价(均衡),均衡称为博弈的解。3、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制 饲料供应的按钮。按一下按钮就会有 10个单位饲料进槽,但谁按谁就要付出 2 个单位的成本。谁去按按纽则谁后到;都去按则同时到。若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃 7个单位,小猪吃3个单位; 若小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除成本后的支 付矩阵可如下表示(每格第一个数字是大猪

13、的得益,第二个数字是小猪的得益):小猪按等待大猪 按5, 14, 4等待 9, -10, 0求纳什均衡。在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按, 小猪还是最好选择等待。即不管大猪选择按还是不按,小猪的最佳策略都是等待。 也就是说,无论如何,小猪都只会选择等待。这样的情况下,大猪最好选择是按, 因为不按的话都饿肚子,按的话还可以有4个单位的收益。所以纳什均衡是(大 猪按,小猪等待)。4、根据两人博弈的支付矩阵回答问题:abA2,30,0B0,04,2(1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈(6分)(2)找出该博弈的全部纯策略纳什均衡,并判断

14、均衡的结果是否是Pareto有效求出该博弈的混合策略纳什均衡。(7分)策略甲:A B乙:a b博弈树(草图如下:(2)PureNE(A,a);(B,b)都是Pareto有效,仅(B,b)是K H有效。(3)MixedNE(2/5,3/5);(2/3,1/3)5、用反应函数法求出下列博弈的所有纯战略纳什均衡。参与人2参与人abcdA2,33,23,40,3B4,45,20,11,2C3,14,11,410,2D3,14,1-1,210,1解答: 纯策略纳什均衡为(B, a)与(A, c)分析过程:设两个参与人的行动分别为4和a2,B,如果a2 a,_B,如果a? bplayer1的反应函数 R)

15、.中A,如果a2 cC或者D,如果a2 dc,如果a1player2的反应函数R2(a1)a,如果a1c,如果a1c,如果a1A B C D交点为(B, a)与(A, c),因此纯策略纳什均衡为(B, a)与(A, c)6、(entrydeterrence 市场威慑)考虑下面一个动态博弈:首先,在一个市场 上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新 企业展开竞争。在位者可能有两种类型,温柔型(左图)和残酷型(右图),回 答下面问题。进入者进入者左图:温柔型右图:残酷型(1)找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均 衡(12分)(2)已有企业

16、为温柔型的概率至少多少时,新企业才愿意进入(8分)温柔 NE(in,accommodate)和(outfight) 。 SPN助(in,accommodate) 残酷 NE(out,fight).SPNE 同理8、博弈方1和博弈方2就如何分10, 000元钱进行讨价还价。假设确定了以下 规则:双方同时提出自己要求的数额 A和B, 0A, B10 000,则该 笔钱就没收。问该博弈的纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额?为什么?答十、纳什均衡有无数个。最可能的结果是(5000, 5000)这个聚点均衡。9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如 果

17、它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利 润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格, 则合作的厂商获利将为零,竞争厂商将获利900000元。(1)将这一市场用囚徒困境的博弈加以表示。(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。答:(1)用囚徒困境的博弈表示如下表:北方航空公司合作新华航空公司合作500000, 5000000, 900000900000, 060000, 60000(2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(600000); 若新华航空公司选择合作,北方航空公司仍会选择竞争( 90000

18、050000。若 北方航空公司选择竞争,新华航空公司也将选择竞争( 600000);若北方航空公司选择合作,新华航空公司仍会选择竞争(9000000)。由于双方总偏好竞争, 故均衡结果为两家公司都选择竞争性策略, 每一家公司所获利润均为600000元。 12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒, 相应的 利润(单位:万元)由下图的得益矩阵给出:(1)有哪些结果是纳什均衡?(2)两厂商合作的结果是什么?答(1)(低价,高价),(高价,低价)(2)(低价,高价)13、A、B两企业利用广告进行竞争。若 A、B两企业都做广告,在未来销售中, A企业可以获得20万元利润,B企业可

19、获得8万元利润;若A企业做广告,B企 业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不 做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润; 若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利(1)画出A、B两企业的支付矩阵。(2)求纳什均衡。3.答:(1)由题目中所提供的信息,可画出 A、B两企业的支付矩阵(如下表)B企业做广告不做广告A企业做广告20, 825, 2不做广告10, 1230, 6(2)因为这是一个简单的完全信息静态博弈,对于纯策纳什均衡解可运用 划横线法求解。如果A厂商做广告,则B厂商的最优选择是做广告,因

20、为做广告所获得的利 润8大于不做广告获得的利润2,故在8下面划一横线。如果A厂商不做广告, 则B厂商的最优选择也是做广告,因为做广告获得的利润为 12,而不做广告的 利润为6,故在12下面划一横线。如果B厂商做广告,则A厂商的最优选择是做广告,因为做广告获得的利润 20大于不做广告所获得的利润10,故在20下面划一横线。如果B厂商不做广告, A厂商的最优选择是不做广告,因为不做广告获得的利润 30大于做广告所获得 的禾I润25,故在30下面划一横线。在本题中不存在混合策略的纳什均衡解,因此,最终的纯策略纳什均衡就是A、B两厂商都做广告。15、求出下面博弈的纳什均衡(含纯策略和混合策略)。乙5,

21、00,82,64,5Nash均衡。LR田 U甲D由划线法易知,该矩阵博弈没有纯策略 可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1可得混合策略Nash均衡(1,8),( 4:)9 97 716、某产品市场上有两个厂商,各自都可以选择高质量,还是低质量。相应的利 润由如下得益矩阵给出:(1)该博弈是否存在纳什均衡?如果存在的话,哪些结果是纳什均衡参考答案:50,50100,800900,600-20,-30乙企业高质量 低质量由划线法可知,该矩阵博弈有两个纯策略 Nash均衡,即(低质量,高质量),(高 质量,低质量)。高质 甲企量业低质1263,可行

22、x 一,y 一97138量 该矩阵博弈还有一个混合的纳什均衡Q=a+d-b-c=-970,q=d-b=-120,R=-1380,r=-630因此该问题的混合纳什均衡为(12空),(也 97 97 13817、甲、乙两企业分属两个国家,在开发某种新产品方面有如下收益矩阵表示的博弈关系。试求出该博弈的纳什均衡。 益,可以采取什么措施?如果乙企业所在国政府想保护本国企业利甲企 业-10,-10100,00,1000,0开发 不开 发乙企业开发 不开发解:用划线法找出问题的纯策略纳什均衡点。所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。该博弈还有一个混合的纳什均衡(1,-),

23、( -,-) o11 1111 11如果乙企业所在国政府对企业开发新产品补贴a个单位,则收益矩阵变为:10n10OB0,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需0,100 a 0,0a10。此时乙企业的收益为100+a。18、博弈的收益矩阵如下表:乙左右甲上a, bc, d下e, fg, h(1)如果(上,左)是占优策略均衡,则 a、b、c、d、e、f、g、h之间必然满 足哪些关系?(尽量把所有必要的关系式都写出来)(2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足?(3)如果(上,左)是占优策略均衡,那么它是否必定是纳什均衡?为什么?(4)在什么情况下,纯战略纳什均衡

24、不存在?答:(1)ae,cg,bd,f h。本题另外一个思考角度是从占优策略均衡的定义出发。对乙而言,占优策略为(b,f) (d,h);而对甲而言,占优策略为 (a,c) (e,g) o综合起来可得到所需结论。(2)纳什均衡只需满足:甲选上的策略时,b d,同时乙选左的策略时,a e。 故本题中纳什均衡的条件为:b d, a e。(3)占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什 均衡的条件。(4)当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳 什均衡就不存在。19、Smith和John玩数字匹配游戏,每个人选择1、2、3,如果数字相同,John 给Smith3美

25、元,如果不同,Smith给John1美元。(1)列出收益矩阵。(2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个 纳什均衡,它为多少?John选1的效用为:答:(1)此博弈的收益矩阵如下表。该博弈是零和博弈,无纳什均衡。John选2的效用为:John选3的效用为:U3类似地,John选(1/3 ,Smith选1的效用为:U131/3 ,1313131/3)1I 33)(3)1313的混合概率时,1)1)Smith选2的效用为:U2Smith选3的效用为:U313131)1)13131)1)1313因为 U1U2 U3, U1U2U3 ,所以:John123Smith13, -

26、3-1 , 1-1 , 12-1 , 13, -3-1 , 13-1 , 1-1 , 13, -3的混合概率时,(2) Smith 选(1/3 , 1/3 ,1/3)(3)11131313U11311(1,1,1),(1,1,1)是纳什均衡,策略值分别为 John: U 9; Smith: u。333 3333320、假设双头垄断企业的成本函数分别为:. 20Qi, C2 2QM市场需求曲线为 P 400 2Q ,其中,Q Qi Q2 0(1)求出古诺(Cournot)均衡情况下的产量、价格和利润,求出各自的反应和 等利润曲线,并图示均衡点。(2)求出斯塔克博格(Stackelberg )均衡

27、情况下的产量、价格和利润,并以图 形表示。(3)说明导致上述两种均衡结果差异的原因。答:(1)对于垄断企业1来说:这是垄断企业1的反应函数。其等利润曲线为:1 380Q1 2QQ 2Q12对垄断企业2来说:这是垄断企业2的反应函数。其等利润曲线为: 2 400Q2 2Q1Q2 4Q2在达到均衡时,有:均衡时的价格为: P 400 2 (80 30) 180两垄断企业的利润分别为:均衡点可图示为:(2)当垄断企业1为领导者时,企业2视企业1的产量为既定,其反应函数为: 则企业1的问题可简化为:土匀衡时价格为:P 400 2等%160利润为:1 39200/3,2 25600/9该均衡可用下图表示

28、:企业2领先时可依此类推。| (3)当企业1为领先者时,其获得的利润要比古诺竞争下多。而企业 2获 得的利润较少。这是因为,企业1先行动时,其能考虑企业2的反应,并以此来 制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的 产出,这是一种“先动优势”21、在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-qi-q2-q 3,这里qi是企业i的产量。每一企业生产的单位成本为常数 c。三企业决定各自产量的顺序 如下:(1)企业1首先选择q10; (2)企业2和企业3观察到qb然后同时分别 选if q2和q30试解出该博弈的子博弈完美纳什均衡。答:该博弈分为两个阶段,第一阶段企

29、业 1选择产量5,第二阶段企业2和3 观测到5后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈 进行求解。(1)假设企业1已选定产量qb先进行第二阶段的计算。设企业 2, 3的利润函 数分别为:由于两企业均要追求利润最大,故对以上两式分别求一阶条件:2q2a q1 2q2 q3 c 0 (1)q3a q1 q2 2q3 c 0 (2)求解(1)、(2)组成的方程组有:*q2*q3(3)(2)现进行第一阶段的博弈分析:对与企业1,其利润函数为;将(3)代入可得:q1(a q1 c)(4)式(4)对q1求导: 解得:*1 /q12(ac)(5)此时,*1(a c)212(3)将式(5)

30、代回(3)和(4)有该博弈的子博弈完美纳什均衡:* 1* * 1 ,、qi(a c) , q2 q3 (a c)2625、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍,市场需求函数为 Q=200-R求(1)若两个厂商同时决定产量,产量分别是多少?(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?答:(1)分别求反应函数,180-2Q1-Q2=0, 180-Q1-2Q2=0 Q1=Q2=60 (2) 200-2Q=20, Q=9Q Q1=Q2=4526、一个工人给一个老板干活,工资标准是 100元。工人可以选择是否偷懒,老 板则选择是否克扣工资。假设工人不偷懒有相当

31、于50元的负效用,老板想克扣工资则总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒时 老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况双方 都知道。请问:(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或 扩展形表小该博弈并作简单分析。(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展 形表示该博|弈并作简单分析。(1)完全信息动态博弈。博弈结果应该是工人偷懒,老板克扣。(2)完全信息静态博弈,结果仍然是工人偷懒,老板克扣。27、举一个你在现实生活中遇到的囚犯两难困境的例子。答:在校园的人行道交叉路口,无需红绿灯。现在两

32、人分别骑车从东西方向 和南北方向通过路口。若同时往前冲,必定相撞,各自支付为(-2, -2);若同时停下,都不能按时前进,支付为(0, 0);若一人前进一人停下,支付为(2, 0)或(0, 2)。相应的策略和支付矩阵如下表。乙前进停卜甲前进-2, -22, 0停卜0, 20, 028、给定两家酿酒企业A B的收益矩阵如下表:A企业白酒啤酒B企业白酒700, 600900, 1000啤酒800, 900600, 800表中每组数字前面一个表示 B企业的收益,后一个数字表示 B企业的收益。(1)求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡?(2)存在帕累托改进吗?如果存在,在什么条件下可以实

33、现?福利增量是多少?(3)如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均 衡?如何改变上述A、B企业的收益才能使该博弈不存在均衡?答:(1)有两个纳什均衡,即(啤酒,白酒)、(白酒,啤酒),都是纳 什均衡而不是占优策略均衡。(2)显然,(白酒,啤酒)是最佳均衡,此时双方均获得其最大收益。若 均衡解为(啤酒,白酒),则存在帕累托改善的可能。方法是双方沟通,共同做 出理性选择,也可由一方向另一方支付报酬。福利由800+900变为900+1000,增量为200。(3)如将(啤酒,白酒)支付改为(1000, 1100),则(啤酒,白酒)就 成为占优策略均衡。比如将(啤酒,白酒)支付改为

34、(800, 500),将(白酒, 啤酒)支付改为(900, 500),则该博弈就不存在任何占优策略均衡或纳什均衡。 30、在纳税检查的博弈中,假设 A为应纳税款,C为检查成本,F是偷税罚款, 且C 20% 2316, 16电视台1前面后面台2 后面,如果双方采用规避风险的策略,均衡的结果是什么此题应用的思想是最大最小收益法:也就是说,在对手采取策略时,所获得的最小收益中的最大值。电视台1:对方采取前面战略的最小收益为18对方米取后面战略的最小收益为16周电视台1会选择收益为18战略一一前面电视台2:前面的策略是一个优超策略一一前面策略均衡为(前面,前面) 如果电视台1先选择,结果有什么若电视台

35、2先选择呢电视台1(4)如果两家谈判合作,电视台1许诺将好节目放在前面,这许诺可信吗?结果能 是什么?电视台1许诺将好节目放在前面的许诺不可信。因为电视台2,前面为占优策略,而在电视台2,选择前面的时候,电视台1选择后面的收益要大于前面的收益。所以,最终结果为(前面,后面)36、如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因 子为6。试问6应满足什么条件,才存在子博弈完美纳什均衡?不坦白坦白 4,40,5不坦白 5,01,1由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白),均衡结果为 (1,1),采用触发策略,局中人i的策略组合s的最好反应支付i(s) maxPi(

36、s i,)=5,Pi(S*)=4 , P(sc)=1。若存在子博弈完美纳什均衡,必须满 Si Si.*、足: i* RG? 1 ,即只有当贴现因子 1/4时,才存在子博弈完美 i(s) Pi(s)5 14纳什均衡。37、在Bertrand价格博弈中,假定有n个生产企业,需求函数为P=a-Q,其中P1 市场价格,Qtn个生产企业的总供给量。假定博弈重复无穷多次,每次的价格都 立即被观测到,企业使用“触发策略”(一旦某个企业选择垄断价格,则执行“冷 酷策略”)。求使垄断价格可以作为完美均衡结果出现的最低贴现因子6是多少。 并请解释6与n的关系。分析:此题可分解为3个步骤(1) n个企业合作,产量总

37、和为垄断产量,价格为垄断价格,然后平分利润。(2)其中一个企业采取欺骗手段降价,那个这家企业就占有的全部市场,获得 垄断利润(3)其他企业触发战略,将价格降到等于边际成本,所有的企业利润为零。(1)设每个企业的边际成本为c,固定成本为0P=a-QTR=P*Q=(a-Q)*QMR=a-2Q因为:MR=MCa-2Q=c则:Q=(a-c)/2P=(a+c)/2兀=(P-c)*Q=(a-c)2/4每家企业的利润为(a-c)2/4n(2)假设A企业自主降价,虽然只是微小的价格调整,但足以占领整个市场,获 得所有的垄断利润一一(a-c)2/4( 3)其他企业在下一期采取冷酷策略,使得所有企业的利润为0考虑

38、:A业不P$价:(a-c)2/4n , (a-c)2/4n ,心业降价:(a-c)2/4 , 0,使垄断价格可以作为完美均衡结果,就要使得不降价的贴现值大于等于降价的贴现值。设贴现因子为6的降价的贴现值:(a-c)2/4n1/(1-6)A窜价的现值:(a-c)2/4于是:(a-c)2/4n1/(1-6) (a-c)2/4解得:5 1-1/n38、假设某劳动市场为完全竞争市场, 其供求函数如下:SL:W=120+2LDL:W=360-L已知某厂商( 在完全竞争市场下) 的生产函数为f(L,K)=10L 0.5K0.5(K=100)且其产品的需求与供给函数分别为D:P=60-2qS:P=20+2q

39、试求(a)该厂商的AQ,Mq及VMP&为多少(b)劳动工资为多少厂商会雇用多少劳动由:Sl=Q解得:W=280由于产品市场为完全竞争市场,且要素市场也为完全竞争市场所以,满足:产品市场均衡:P=MR=MC=W/MP要素市场均衡:W=ACM(L=VMP得到:ACL=M(L=VML=280由:D=S单得:P=40, q=10厂商追求利润最大化的情况下:0.5 W*=VMPL=P*MPL=P*50/LL*=100/2*PW* 2=51(取整数)论述题(每小题20分,共20分) 解释“囚犯困境”,并举商业案例说明。囚徒困境是博弈论里最着名的例子之一,几乎所有的博弈论着作中都要讨论 这个例子。这个例子是

40、这样的:两囚徒被指控是一宗罪案的同案犯。 他们被分别 关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白, 各将被判入狱5年;如果两人都不坦白,则很难对他们提起刑事诉讼,因而两囚 徒可以期望被从轻发落入狱2年;另一方面,如果一个囚徒坦白而另一个囚徒不 坦白,坦白的这个囚徒就只需入狱 1年,而不坦白的囚徒将被判入狱10年。表 6-2给出了囚徒困境的策略式表述。这里,每个囚徒都有两种策略:坦白或不坦 白。表中的数字分别代表囚徒甲和乙的得益。(注意,这里的得益是负值。)表6-2囚徒困境囚徒乙坦白不坦白囚徒甲坦白-5, -5-1 , -10不坦白-10, -1-2 , -2在囚徒困境

41、这个模型中,纳什均衡就是双方都坦白,给定甲坦白的情况下, 乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。而且这里 双方都坦白不仅是纳什均衡,而且是一个上策(dominantstrategy) 均衡,即不论 对方如何选择,个人的最优选择是坦白。因为如果乙不坦白,甲坦白的话就被轻 判1年,不坦白的话就判2年,坦白比不坦白要好;如果乙坦白,甲坦白的话判 5年,不坦白的话判10年,所以,坦白仍然比不坦白要好。这样,坦白就是甲 的上策,当然也是乙的上策。其结果是双方都坦白。这个组合是纳什均衡。寡头垄断厂商经常发现它们自己处于一种囚徒的困境。 当寡头厂商选择产量 时,如果寡头厂商们联合起来

42、形成卡特尔, 选择垄断利润最大化产量,每个厂商 都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定双方遵守协 议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的 禾I润,它远小于卡特尔产量下的利润。解释“智猪博弈(boxedpigs) ”,并举商业案例说明。智猪博弈的例子讲的是:猪圈里有一头大猪和一头小猪,猪圈的一头有一个猪食槽,另一头安装一个按扭,控制着猪食的供应。每按一下按扭会有10个单位的猪食进槽,但谁按按扭谁就要付2个单位的成本并且晚到猪食槽。若大猪先 到猪食槽,大猪吃到9个单位,小猪只能吃到1个单位;若小猪先到猪食槽,大 猪吃到6个单位,小猪吃4个单位;

43、若同时到,大猪吃到7个单位,小猪只能吃 3个单位。表6-3列出了对应于不同策略组合的得益水平。例如,表中第一格表 示大猪小猪同时按按扭,从而同时走到猪食槽,大猪吃 7个,小猪吃3个,除去 2个单位成本,得益分别为5和1。表6-3智猪博弈小猪按不按大猪按5, 14, 4不按9,-10, 0从表6-3可以看到,对于小猪来说,如果大猪按,它则不按更好;如果大猪 不按,它不按也更好,所以,不论大猪按还是不按,它的最优策略都是不按。给 定小猪不按,大猪的最优选择只能是按。所以,纳什均衡就是大猪按,小猪不按, 各得4个单位猪食。市场中的大企业与小企业之间的关系类似智猪博弈。大企业进行研究与开 发,为新产品

44、做广告,而对小企业来说这些工作可能得不偿失。所以,小企业可 能把精力花在模仿上,或等待大企业用广告打开市场后再出售廉价产品。解释“夫妻博弈” (battleofthesexes) ”,并举商业案例说明。“夫妻博弈”(battleofthesexes)的例子讲的是一对谈恋爱的男女安排业余活动,他们有二种选择,或去看足球比赛,或去看芭蕾舞演出。男方偏好足球, 女方偏好芭蕾,但他们宁愿在一起,不愿分开。表6-6给出了这个博弈的得益矩 阵。在这个博弈中,如果双方同时决定,则有两个纳什均衡,即都去看足球比赛 和都去看芭蕾演出。但是到底最后他们去看足球比赛还是去看芭蕾演出,并不能 从中获得结论。如果假设这

45、是个序列博弈,例如,当女方先作出选择看芭蕾演出 时,男方只能选择芭蕾;当女方先选择了看足球比赛时,男方也只能选择足球。 反之,当男方先选择了看足球比赛时,女方只能选择看足球比赛;当男方先选择 了看芭蕾演出时,女方只能选择芭蕾。表6-6夫妻博弈女足球笆雷男足球2, 10, 0笆雷0, 02在这个博弈例子中,先行动者具有明显的优势,女方通过选择芭蕾造成一种 既成事实,使得男方除了一起去看芭蕾之外别无选择。这就是我们在斯塔克尔伯格模型中提到的先动优势firstmoveradvantage)。在那个模型中,先行动的厂 商选择一个很高的产量水平,从而使它的竞争对手除了选择小的产量水平之外没 有多大的选择

46、余地。解释古诺模型。解释斯塔克尔伯格模型。斯塔克尔贝里(1934)提出一个双头垄断的动态模型,其中一个支配企业(领导者)首先行动,然后从属企业(追随者)行。比如在美国汽车产业发展 史中的某些阶段,通用汽车就扮演过这种领导者的角色 (这一例子把模型 直接扩展到允许不止一个追随企业,如福特、克莱斯勒等等 )0根据斯塔 克尔贝里的假定,模型中的企业选择其产量,这一点和古诺模型是一致的 (只不过古诺模型中企业是同时行动的,不同于这里的序贯行动 )。博弈的时间顺序如下:(1)企业1选择产量q10;(2)企业2观测到然后选择产量 q20(3)企业1的收益由下面的利润函数给出:这里P(Q尸a-Q,是市场上的

47、总产品Q=q1+q2时的市场出清价格,c是生 产的边际成本,为一常数(固定成本为0)。为解出这一博弈的逆向归纳解,我们首先计算企业2对企业1任意产量的最优反应,R2(q1)应满足:对上面的通过求极值可得:已知q1a-c,在前面我们分析同时行动的古诺博弈中,得出的 R2(q1)和 上式完全一致,两者的不同之处在于这里的 R2(q1)是企业2对企业1已 观测到的产量的真实反应,而在古诺的分析中, R2(q1)是企业2对假定 的企业1的产量的最优反应,且企业1的产量选择是和企业2同时作出 I由于企业1也能够像企业2一样解出企业2的最优反应,企业1就可以 预测到他如选择q1,企业2将根据R2(q1)选

48、择产量。那么在博弈的第一 阶段,企业1的问题就可表示为:解得:这就是斯塔克尔贝里双头垄断博弈的逆向归纳解。对斯塔科尔贝里双头垄断博弈的逆向归纳解的评价:回顾在古诺博弈的纳什均衡中,每一企业的产量为(ac)/3,也就是说,斯塔克尔贝里博弈中逆向归纳解的总产量 3(a-c)/4 ,比古诺博弈中纳什 均衡的总产量2(a-c)/3要高,从而斯塔克尔贝里博弈相应的市场出清价 格就比较低。不过在斯塔克尔贝里博弈中,企业1完全可以选择古诺均衡产量(a c)/3 ,这时企业2的最优反应同样是古诺均衡的产量,也就 是说在斯塔克尔贝里博弈中,企业 1完全可以使利润水平达到古诺均衡 的水平,而却选择了其他产量,那么

49、企业 1在斯塔克尔贝里博弈中的利 润一定高于其在古诺博弈中的利润。但斯塔克尔贝里博弈中的市场出清 价格降低了,从而总利润水平也会下降,那么和古诺博弈的结果相比, 在斯塔克尔贝里博弈中,企业1利润的增加必定意味着企业2福利的恶 化。和古诺博弈相比,斯塔克尔贝里博弈中企业2利润水平的降低,揭示了单人决策问题和多人决策问题的一个重要不同之处。在单人决策理论中, 占有更多的信息决不会对决策制定者带来不利,然而在博弈论中,了解 更多的信息(或更为精确地说,是让其他参加者知道一个人掌握更多的信 息)却可以让一个参与者受损。解释里昂惕夫的工会模型。在里昂惕夫(1946)模型中,讨论了一个企业和一个垄断的工会

50、组织 (即作 为企业劳动力惟一供给者的工会组织)的相互关系:工会对工资水平说一 不二,但企业却可以自主决定就业人数(在更符合现实情况的模型中,企 业和工会间就工资水平讨价还价, 但企业仍自主决定就业,得到的定性结 果与本模型相似)。工会的效用函数为U(W,L),其中W为工会向企业开出 的工资水平,L为就业人数。假定U(W,L)是 W口 L的增函数。企业的利润函数为苑(umL) = 一 其中R(L)为企业雇佣L名工人可以取得的收入(在最优的生产和产品市场决策下),假定R(L)是增函数,并且为凹 函数。假定博弈白时序为:(1)工会给出需要的工资水平 W;(2)企业观测到(并接受)皿 随后选择雇佣人

51、数L;(3)收益分别为U(W,L)和冗(3 L)。即使没有假定U(W,L)和R(L)的具体的表达式,从而无法明确解出该博弈的逆向 归纳解,但我们仍可以就解的主要特征进行讨论。首先,对工会在第一阶段任意一个工资水平 w,我们能够分析在第二阶段 企业最优反应L*(W)的特征。给定w,企业选择L*(W)满足下式: 一阶条件为:为了满足上述一阶条件,假设 R (0)=*R(8)=0.下面的图把L*(w)表示为w的函数(但坐标轴经过旋转以便于和以后的数 据相比较),并表示出它和企业每条等利润线交于其最高点。若令 L保持 不变,L保持不变,w降低时企业的利润就会提高,于是较低的等利润曲线代表 了较高的利润

52、水平。这张图描述了工会的无差异曲线,若令L不变,当w提高时工会的福利就 会增加。于是较高的无差异曲线代表了工会较高的效用水平。下面我们分析工会在第一阶段的问题,由于工会和企业同样可以解出企业 在第二阶段的问题,工会就可预测到如果它要求的工资水平为w1,企业最优反应的就业人数将会是L*(w1) 0那么,工会在第一阶段的问题可以 表小为:表现在图中的无差异曲线上就是,工会希望选择一个工资水平w,由此得到的结果(w, L*(w)处于可能达到的最高的无差异线上。 这一最优化问题 的解为w*,这样一个工资要求将使得工会通过(w*, L*(w*)的无差异曲 线与L*(w)相切于该点,如图所示。从而(w*, L*(w*

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!