完全信息动态博弈

上传人：s****a 文档编号：229196263 上传时间：2023-08-22 格式：DOCX 页数：10 大小：66.56KB

收藏版权申诉举报下载

第1页 / 共10页

第2页 / 共10页

第3页 / 共10页

下载文档到电脑，查找使用更方便

15 积分

下载资源

资源描述：

《完全信息动态博弈》由会员分享，可在线阅读，更多相关《完全信息动态博弈（10页珍藏版）》请在装配图网上搜索。

1、第七章完全信息动态博弈博弈中的得益，是各参与人追求的根本目标，关于得益的信息是博弈中最重要的信息之一。在一些博弈中参与人对自己的得益情况完全清楚，对其他参与人的得益也都很清楚如前面介绍过的囚徒困境，猜硬币等；还有一些博弈中，参与人对其他参与人的得益情况并不了解，例如投标、拍卖活动中，各参与人对其他参与人的标的的估价很难了解，即使最后的成交价是明确的，但各参与人仍然无法知道其他参与人中标、拍得标的的真正得益是多少。一般地，参与人完全了解所有参与人的得益情况的博弈称为“完全信息博弈”，不完全了解其他参与人的得益情况的博弈称为“不完全信息博弈”。博弈中的过程，是博弈结构的重要部分，根据

2、博弈过程的不同，可以将博弈分为：“静态博弈”、“动态博弈”和“重复博弈”。如果参与人选择战略时是同时或可以看作同时的博弈称为“静态博弈”；若各参与人战略的选择和行动不仅有先后顺序，后选择、后行动的参与人在自己选择行动之前，可以看到前面的过程，这种博弈称为“动态博弈”（也称为“多阶段博弈”）。动态博弈中在轮到行为时对博弈的进程完全了解的参与人，称为具有“完美信息”的参与人，如果动态博弈的所有参与人都有完美信息，称为“完美信息的动态博弈”。相应的轮到行为时对博弈的进程不完全了解的参与人，称为具有“不完美信息”，这样的动态博弈称为“不完美信息的动态博弈”。7.1 完全且完美信息动态博弈

3、动态博弈中一个参与人的一次行为称为一个“阶段”。由于每个参与人在动态博弈中可能不止一次行为，因此，每个参与人在一个动态博弈中就可能有数个甚至许多个博弈阶段。动态博弈一般用扩展形表示，括弧中前一个数字代表乙的得益，后一个数字代表甲的得益。动态博弈的一个中心问题是“可信性”问题。所谓可信性是指动态博弈中先行为的参与人是否该相信后行为的参与人会采取对自己有利的或不利的行为。因为后行为方将来会采取对先行为方有利的行为相当于一种“许诺”，而将来会采取对先行为方不利的行为相当于一种“威胁”，因此我们可将可信性分为“许诺的可信性”和“威胁的可信性”。7.1.1 开金矿博弈我们以“开金矿博弈”为例来

4、讨论可信性问题。甲要开采一价值 4 万元的金矿，缺 1 万元的资金，向乙借 1 万元，许诺采到金子后与乙平分。乙是否借钱给甲呢？图 8-1乙最需要关心的就是甲采到金子后是否会履行诺言跟自己平分，因为万一甲采到金子后不但不跟乙平分，而且还赖帐或卷款潜逃，则乙连自己的本钱都收不回来。关键的是要判断的许诺是否可信！以自身利益最大化原则，甲必然选择不分！乙清楚甲的行为准则，最好的选择是不借！对乙来说，甲的许诺是不可信的！要想使甲的许诺成为可信的，加上第三阶段，让乙在甲违约时采用法律手段-“打官司”，乙的利益受到法律保护，甲的许诺是可信的。乙在第一阶段选择借，甲在第二阶段选择分。(bO)7尸

5、p分(2,2)(l0)(0.4)图 8-2 可信的诺言和威胁图 8-3 法律保障不足的开金矿博弈在第三阶段乙打官司不能收回本钱，还要承受1 万元的损失，这时乙打官司的威胁是不可信的。本博弈的分析可以看出，在一个个体都有私心，都只注重自身的利益的社会里，完善公正的法律制度不淡能够保障社会的公平，还能提高社会经济活动的效率，是实现最有效率的社会分工的重要保障。可信性是动态博弈分析的一个中心问题。7.1.2 逆推归纳法分析动态博弈的方法是从最后一个阶段参与人的行为开始分析，逐步倒退回前一个阶段相应参与人的行为选择，一直到第一阶段的方法，称为“逆推归纳法”。逆推归纳法实际上是重复剔除劣战略方

6、法在扩展式博弈中的应用。我们从最后一个决策结开始往回倒推，每一步剔除在该决策结上参与人的劣选择，因此，在均衡路径，每一个参与人在每一个信息集上的选择都是占优选择。逆推归纳法可以用于许多动态博弈的分析求解，除了有些不完美信息动态博弈以外，是解析动态博弈的基本方法。在分析动态博弈问题时，我们必须发展新的均衡概念。7.2 子博弈完美纳什均衡动态博弈中存在不可信的行为选择，纳什均衡具有不稳定性。为了排除不可信的威胁或承诺因素，博弈理论又一次得到了发展，泽尔腾（1965）提出了“子博弈完美纳什均衡”，用来分析动态博弈。子博弈完美纳什均衡要求均衡战略的行为在每一个信息集上都是最优的。为此，我们

7、首先引进“子博弈”的概念。简单的说，子博弈是原博弈的一个局部构成的次级博弈，它本身可以作为一个独立的博弈进行分析。7.2.1 子博弈定义 8.1 由一个动态博弈第一阶段以外的某个阶段开始的后续博弈阶段构成，它必须有初始信息集，具备进行博弈所需要的各种信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个“子博弈”。以三阶段开金矿博弈为例，如果乙在第一阶段选择了“借”，动态博弈进行到第二阶段甲作选择。这时甲选择是否分成，然后轮到乙作选择是否打官司。这本身构成了一个两阶段的动态博弈，是原博弈的一个“子博弈”。当甲选择不分，博弈进行到乙选择打官司还是不打的第三阶段，是子博弈的子博弈

8、，称后面的子博弈是原博弈“的二级子博弈”。如图中两层虚线框出。图 8-4 开金矿博弈的两级子博弈例如，开金矿博弈，两个虚线框代表两个“子博弈”。应用逆推归纳法分析，在最后的子博弈中，乙在“打官司”和“不打”中选择“打官司”，因为10，成为图8-5；这时甲在分与不分中选择分，因为21，成为图 8-6；第一阶段乙的选择是借。图 8-5 开金矿（守信）-逆推第一步图 8-6 开金矿（守信）-逆推第二步上面用逆推归纳法导出的动态博弈的结果是由各阶段轮到行为的参与人的一种行为依次构成的，在开金矿博弈中结果为（借，分），是由乙在第一阶段的借和甲在第二阶段的分构成。当然该博弈本来应该有三个阶段，但

9、当甲在第二阶段选择分时第三阶段就没有必要进行下去了，因此结果中只有两个阶段的行为。需要注意的是乙的第三阶段虽然没有进行，但是它是保证第二阶段甲选择分的关键，所以乙的战略中必须包含这个选择。7.2.2 子博弈完美纳什均衡有了子博弈的概念，我们引进适合动态博弈的新的均衡概念，它必须满足(1)既是纳什均衡，从而具有战略稳定性，(2)又不能包含任何的不会信守的许诺或威胁。这样的动态博弈的战略组合称为“子博弈完美纳什均衡”。定义 8.2 如果动态博弈中各参与人的策略在动态博弈本身和所有子博弈中都构成一个纳什均衡，则称该策略组合为一个“子博弈完美纳什均衡”。“子博弈完美纳什均衡”是分析动态博弈，

10、或者说完全且完美信息动态博弈的关键概念。而逆推归纳法正是(至少在完美信息动态博弈范围之内)寻找动态博弈的子博弈完美纳什均衡的基本方法。子博弈完美纳什均衡能够排除均衡策略中不可信的威胁或许诺，就意味着每阶段各参与人的选择都是按最大利益原则决策的，因此在每个子博弈中都只能采用纳什均衡的策略或行为选择。7.3 应用举例731寡占的斯塔克博格(Stackelberg)模型斯塔克博格模型是一种动态的寡头市场博弈模型。该模型假设寡头市场上的两个厂商中，一方较强一方较弱。较强的一方领先行动，而较弱的一方则跟在较强的一方之后行动由于该模型中两厂商的选择是有先后的，且后一厂商(跟随者看着前一厂商的选择

11、的，因此这是一个动态博弈。但是，因为两参与人的决策内容是产量水平，而可能的产量水平有无限多个，因此这是一个双方都有无限多种可能的选择的无限策略博弈。斯塔克博格模型与古诺模型相比，唯一的不同是前者有一个选择的次序问题，其他如参与人、策略空间和得益函数等完全都是相同的。价格函数：P = P(Q) = 8-Q ；产品完全相同(没有固定成本，边际成本相等)c = c = 2 ；12总产量(连续产量)Q二q + q ；总成本分别为：2q和2q。1 2 1 2得益函数：u = q P(Q) - c q = q 8 - (q + q ) - 2q = 6q - q q - q21 1 1 1 1 1

12、2 1 11 21u = q P(Q) - c q = q 8 - (q+ q) - 2q= 6q- q q- q22 2 2 2 2 1 2 2 2 1 2 2根据逆推归纳法的思路，我们首先要分析第二阶段厂商2 的决策，为此，我们先假设厂商1 的选择为q是已经确定的。这实际上就是在q定的情况下求使u实现最大值的q，它必1 1 2 2 须满足：6-q -2q = 012q = (6-q ) = 3-红8.12 2 1 2实际上它就是厂商 2 对厂商 1 的策略的一个反应函数。厂商 1 知道厂商 2 的这种决策思路，因此他在选择q的时就知道q *是根据(1 )式确定的，因此可将(1)式代入他自

13、己的得益 12 函数，然后再求其最大值。qu (q ,q*) = 6q - q q* - q2 = 6q - q (3 一)-q21 2 8.2=3q 一一 q 2 = u (q )12i 11上式对q的导数为0可得3 - q* = 0, q* = 3,此时，q* = 3 -1.5 = 1.5，双方的得益1 11 2分别为 4.5 和 2.25。与两寡头同时选择的古诺模型的结果相比，斯塔克博格模型的结果有很大的不同。它的产量大于古诺模型，价格低于古诺模型，总利润(两厂商得益之和)小于古诺模型。但是，厂商1 的得益却大于古诺模型中厂商1 的得益，更大于厂商2 的得益。这是因为该模型中两厂商

14、所处地位不同，厂商1具有先行的主动，且他又把握住了理性的厂商2总归会根据自己的选择而合理抉择的心理，选择较大的产量得到了好处。结论：本博弈也揭示了这样一个事实，即在信息不对称的博弈中，信息较多的参与人(如本博弈中的厂商 2，他在决策之前可先知道厂商1 的实际选择，因此他拥有较多的信息)不一定能得到较多的得益。这一点也正是多人博弈与单人博弈的不同之处。7.3.2 工会和厂商的博弈里昂惕夫(Leontief)1946年提出了一个工会和厂商之间关于工资和雇佣的博弈模型。假设完全由工会决定工资，而厂商则根据工资的高低决定雇佣工人的数量。假设工会和厂商之间关于工资率和雇佣数的博弈过程是这样的

15、：首先由工会决定工资率，然后厂商根据工会决定的工资率决定雇佣多少劳动，工会和厂商选择的内容分别是工资率和雇佣数。工会的效用必然是工资W和雇佣数人L两者的函数，即u(W,L)；假设收益是劳动雇佣数L的函数R(L)，厂商的利润也是工资率和劳动雇佣数的函数兀=兀(W, L) = R (L) - WL得益：效用u(W, L)和利润兀(W, L)我们用逆推归纳法来解这个博弈，第一步我们先求第二阶段(最后一阶段)厂商对工会的工资率u的反应函数L(W)，应该是下面最大值问题的解。max兀(W,L) = maxR(L) - WL, 对L的导数为零，R(L) - W = 0L0L0经济意义是厂商增加雇佣的边际

16、收益(雇佣最后一个单位劳动所能增加的收益)要等于工资率(边际成本)。L(W)处R(L)与WL的距离最大，而这距离当然就是厂商的利润了。图 8-8 工会的无差异曲线第二步回到第一阶段工会面临的选择。由于工会了解厂商的决策规则和方法，因此它完全清楚对应自己的每种工资率W ,厂商将会选择的雇佣数一定是L*(W)。工会需要解决的决策问题就变成如下的最大值问题，即如何选择W *使它满足：maxW , L* (W )W0该博弈的均衡解就是W*, L*(W*)，因为该路径中不包含任何不会信守的威胁或诺言，因此它是一个子博弈完美纳什均衡。根据工会的效用函数作出它在W和L之间的无差异曲线，如图 8-8，则

17、越是位置高的无差异曲线越代表工会的效用较高。7.3.3 讨价还价博弈假设有两人就如何分割1 万元进行谈判，并且已经定下了这样的规则：首先由参与人1 提出一个分割比例，对此，参与人 2 可以接受也可以拒绝；如果参与人2 拒绝参与人1 的方案，则他自己应提出另一个方案，让参与人1选择接受与否。如此循环。在上述循环过程中，只要有任何一方接受对方的方案博弈就告结束，而如果方案被拒绝，则被拒绝的方案就与以后的讨价还价过程不再有关系。由于谈判费用和利息损失等，双方的得益都要打一次折扣，折扣率为5(05 1)，我们称它为消耗系数。如果限制讨价还价最多只能进行三个阶段，到第三阶段乙必须接受甲的方案，

18、这就是一个三阶段的讨价还价博弈。图 8-9 三阶段讨价还价本博弈有两个关键点:第一是第三阶段参与人1 的方案是有强制力的，即进行到这一阶段，参与人1提出的分割S : (S,1 - S)是双方必须接受的，并且对这一点两参与人都非常清楚。第二是多进行一个阶段总得益就会减少一个比例，因此对双方来说都是让谈判拖得太长是不利的，必须让对方得的数额，不如早点让他得到，免得自己的得益每况愈下。下面是对三阶段谈判博弈时序的更为详细的描述:在第一阶段开始时，参与人1建议他分走1万元的S,留给参与人2的份额为1- S；参与人2或者接受这一条件(这种情况下，博弈结束，参与人1的收益为S，参与人2的收1益为1

19、-si )，或者拒绝这一条件(这种情况下，博弈将继续进行，进入第二阶段)；在第二阶段的开始，参与人2提议参与人1分得1万元的S，留给参与人2的份额为21 -S (请注意在阶段t， S总是表示分给参与人1的，而不论是谁先提出的条件)；参与人 2t1或者接受条件(这种情况下，博弈结束，参与人1的收益S和参与人2的收益1-S )，或22 者拒绝这一条件(这种情况下，博弈继续进行，进入第三阶段)；在第三阶段的开始，参与人1得到1万元的S，参与人2得到1-S，这里0 S 1。用逆推向归纳法解出此三阶段博弈的解。首先分析博弈的第三阶段。参与人1 提出的条件，参与人2必须接受，通常他会独得1万元！假定

20、参与人1得到S，参与人2得到1 - S，这时的得益分别为5 2S, 52(1-S)。逆推到博弈的第二阶段，参与人 2 怎样提出最优条件，才能使自己的得益最大？如果参与人2提出条件使参与人1的得益小于第三阶段的得益，那么参与人l 一定会拒绝参与人 2在这一阶段的条件，博弈进行到第三阶段。参与人2提出的条件S既要满足参与人接受,2 又要使自己的得益比在第三阶段的得益大，才是最优的条件。 S 应满足参与人 1 的得益25S =52S，即S =5S。这时参与人2的得益为5(1 5S) = 5-52S。因为05 0 i i j i j i jii 由于利润可以分成企业在国内市场的利润和国外市场的利润

21、两部分之和，且国内市场的利润取决于h和e*,ij两个最大值问题：国外市场的利润取决于e 和h*，因此上述最大值问题就可分解为下列ija 一 (h + e *) 一 ci i ja 一 (e + h*) 一c一t ei j j imaxh 0imaxe 0 i8.38.4假设e* a - c, 从8.3解得jh*i=丄(。-e * - c)2j1e* =(a 一 h* 一 c 一 t )8.6i 2 j j8.5假设h* a - c -1 ,从8.4解得jj由于8.5和8.6对i = 1,2和j = 2,1成立，得到四个方程的联立方程组，解得: 11h * =(a 一 c +1 ) e * =

22、(a 一 c 一 2t )i 3i i 3j其中，i = 1,2和j = 2,1,这是两企业第二阶段静态博弈的纳什均衡。i如果没有关税，则本博弈就相当于是国内国外两个市场的古诺模型，两企业在两市场的均衡产量确实都为(a c)/3，与古诺模型的均衡产量完全一样。由于有关税存在，一国的关税具有保护本国企业，提高本国企业国内市场占有率，打击外国企业的作用，也是世界各国普遍设置关税，想要提高本国关税的主要原因。现在我们回到第一阶段两个国家之间的博弈，即两国家同时选择t 和 t。因为国家112相国家2都清楚两国企业的决策方法，即知道当它们选定t 和 t以后，两企业的均衡一定12是(h*,e*,h*

23、,e*)，因此，两国的得益为w二w (t ,t ,h*,e*,h*,e*)，为了方便起见，我们1122i i 121122简单地用w = w (t ,t ) i = 1, 2，来表示上述两国的得益。i i 12(+ ,x2(a 一 c) 一 t 2 丄(a 一 c + t)2w (t , t*) =i +ii i j189(a 一c一2t*)2 t (a 一c一2t*)+j +/93国家i要选择t*，满足上式达到最大，令导数为零时，解得:it * =对i = 1,2成立，两国的最佳关税都是t = t =_-,这就是两企业在第二i 312得最佳内销和出口产量选择：e*i4(a c) h * =i 9阶段的最佳内销和出口产量选择。这是一个子博弈纳什均衡解。

展开阅读全文

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

备案号:蜀ICP备2024067431号-1 川公网安备51140202000466号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知装配图网，我们立即给予删除！

完全信息动态博弈

最新文档

相关资源

相关搜索