信息经济学与非合作博弈理论

上传人:仙*** 文档编号:189772016 上传时间:2023-02-24 格式:PPTX 页数:75 大小:527KB
收藏 版权申诉 举报 下载
信息经济学与非合作博弈理论_第1页
第1页 / 共75页
信息经济学与非合作博弈理论_第2页
第2页 / 共75页
信息经济学与非合作博弈理论_第3页
第3页 / 共75页
资源描述:

《信息经济学与非合作博弈理论》由会员分享,可在线阅读,更多相关《信息经济学与非合作博弈理论(75页珍藏版)》请在装配图网上搜索。

1、普通高等教育“十一五”国家级规划教材第三章第三章 信息与非合作博弈理论信息与非合作博弈理论3 信息与非合作博弈理论教学目标教学目标v了解博弈论的基本概念v掌握非合作博弈的种类及其均衡解之间的关系v会求博弈的一些基本类型的均衡解3 信息与非合作博弈理论 博弈论(game theory)定义:研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的,是专门研究博弈如何出现均衡的规律的学科。博弈论的相关概念包括:参与人、行动、战略、信息、共同知识、支付函数、结果、均衡。3 信息与非合作博弈理论3.1 博弈论概述3.1.1 什么是博弈论 3.1.2 博弈的分类3 信息与非合作博弈理论3.1

2、 博弈论概述非合作博弈参与人行动的先后顺序参与人对对手信息的掌握静态博弈完全信息博弈不完全信息博弈动态博弈 表3.1 博弈的分类及对应的均衡概念静态静态动态动态完全信息完全信息完全信息静态博弈;纳什均衡;代表人物:纳什(1950,1951)完全信息动态博弈;子博弈精炼纳什均衡;代表人物:泽尔腾(1965)不完全信息不完全信息不完全信息静态博弈;贝叶斯纳什均衡;代表人物:海萨尼(1967-1968)不完全信息动态博弈;精炼贝叶斯纳什均衡;代表人物:泽尔腾(1975),克瑞普斯和威尔逊(1982),费登伯格和泰勒尔(1991)3 信息与非合作博弈理论3.1 博弈论概述3.1.2 博弈的分类 3.1

3、.3 博弈论的发展简述3 信息与非合作博弈理论3.1 博弈论概述博弈论的发展1944年,冯诺伊曼和摩根斯坦恩合作的博弈论和经济行为一书的出版50年代,合作博弈发展到鼎盛时期60年代,出现了泽尔腾,海萨尼等一些重要人物80年代,出现了几个比较有影响的人物,包括克瑞普斯和威尔逊80年代以后,博弈论逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础3.2 完全信息静态博弈 一般用G=S1,S2,Sn;u1,u2,un表示战略式博弈。3.2.1 博弈的战略式表述3 信息与非合作博弈理论1博弈的参与人集合:i,=(1,2,n)2每个参与人的策略空间Si,i=1,2,n3每个参与人的支付函数 ui

4、(s1,si,sn),i=1,2,n 表 3.2 房地产开发博弈(a)高需求情况 开发商B 开发 不开发 开发商A 开发 不开发4000,4000 8000,0 0,80000,0 3 信息与非合作博弈理论3.2 完全信息静态博弈3.2.1 博弈的战略式表述 表 3.2 房地产开发博弈(b)低需求情况 开发商B 开发 不开发 开发商A 开发 不开发-3000,-3000 1000,0 0,10000,0 3 信息与非合作博弈理论3.2 完全信息静态博弈3.2.1 博弈的战略式表述 表3.3 囚徒困境 囚犯B 坦白 抵赖 囚犯A 坦白 抵赖3.2.2 纳什均衡 -8,-8 0,-10-10,0-

5、1,-1 3 信息与非合作博弈理论3.2 完全信息静态博弈 一个参与人的最优战略并不依赖于其他参与人的战略选择,即不论其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”(dominant strategy)。1 1、占优战略均衡、占优战略均衡 1、占优战略均衡 3 信息与非合作博弈理论3.2 完全信息静态博弈3.2.2 纳什均衡在博弈的战略式表述中,如果对于所有的i,si*是i占优战略,那么,战略组合s*=(s1*,sn*)就称为占优战略均衡ui(si*,s-i)ui(si,s-i),si si*占优战略均衡占优战略si*2、重复剔除的占优均衡 战略组合s*=(s1

6、*,sn*)称为重复剔除的占优均衡,如果它是重复剔除劣战略后剩下的唯一唯一的战略组合。如果这种唯一的战略组合是存在的,我们说该博弈是重复剔除占优可解的。3 信息与非合作博弈理论3.2 完全信息静态博弈3.2.2 纳什均衡2、重复剔除的占优均衡 表3.4 抽象博弈 参与人2 左 中 右参与人1 上 下1,01,20,10,30,12,03 信息与非合作博弈理论3.2 完全信息静态博弈3.2.2 纳什均衡2、重复剔除的占优均衡 表3.5 抽象博弈 参与人2 左 中 参与人1 上 下1,01,20,30,13 信息与非合作博弈理论3.2 完全信息静态博弈3.2.2 纳什均衡2、重复剔除的占优均衡 表

7、3.6 抽象博弈 参与人2 左 中 参与人1 上 显然,(上,中)就是该博弈唯一的均衡解。这种方法在博弈论中被称为重复剔除严格劣战略。1,01,23 信息与非合作博弈理论3.2 完全信息静态博弈3.2.2 纳什均衡3、纳什均衡 3 信息与非合作博弈理论3.2 完全信息静态博弈3.2.2 纳什均衡G=S1,S2,Sn;u1,u2,,un中,战略组合s*=(s1*,s2*,sn*)是一个纳什均衡如果对于每一个i,si*是给定其他参与人的选择s-i*=(s1*,si-1*,si+1*,sn*)的情况下,第i个人的最优战略,即 ui(si*,s-i*)ui(si,s-i*),si*Si*,i或:si*

8、是下述最大化问题的解:si*argmax ui(s1*,,si-1*,si,si+1*,,sn*),si*Si*,i=1,2,,n3、纳什均衡 在两人有限博弈中,求解纳什均衡有一种简单的方法:划线法。表 3.7 抽象博弈 参与人B L C R U 参与人A M D 0,4 4,0 5,3 4,0 0,4 5,3 3,5 3,5 6,6 3 信息与非合作博弈理论3.2 完全信息静态博弈3.2.2 纳什均衡3、纳什均衡 纳什均衡有强弱之分。上述定义中给出的是弱纳什均衡,一个纳什均衡是强的,如果给定其他参与人的策略,每一个参与人的选择是唯一的。即,s*是一个强Nash均衡,当且仅当对每一个i,sis

9、i*,总有ui(si*,s-i*)ui(si,s-i*)。在有些博弈中,纳什均衡存在,但它不是强纳什均衡。如表3.8的博弈中,(U,L)和(U,R)都是纳什均衡,但没有一个是强纳什均衡。3 信息与非合作博弈理论3.2 完全信息静态博弈3.2.2 纳什均衡 3、纳什均衡 表 3.8 抽象博弈 参与人B L C R U 参与人A M D 2,12 1,10 1,12 0,12 0,10 0,11 0,12 0,12 0,1 3 信息与非合作博弈理论3.2 完全信息静态博弈3.2.2 纳什均衡 设有两个参与人,分别称为企业1和企业2,每个企业的策略是选择产量,得益是利润,它是两个企业产量的函数。我们

10、用qi0,)表示第i个企业的产量,Ci(qi)表示成本函数,P=P(q1+q2)表示逆需求函数。第i个企业的利润函数为:i(q1,q2)=qiP(q1+q2)Ci(qi),i=1,2(q1*,q2*)是纳什均衡产量意味着:q1*argmax1(q1,q2*)=q1P(q1+q2*)C1(q1)q2*argmax2(q1*,q2)=q2P(q1*+q2)C2(q2)3.2.3 理论应用:Gournot寡头竞争模型3 信息与非合作博弈理论3.2 完全信息静态博弈找出纳什均衡的一个办法是对每个企业的利润函数求一阶导数并令其为零:1/q1=P(q1+q2)+q1P(q1+q2)C1(q1)=02/q2

11、=P(q1+q2)+q2P(q1+q2)C2(q2)=0上述两个一阶条件分别定义了两个反应函数:q1*=R1(q2)q2*=R2(q1)反应函数意味着每个企业的最优策略(产量)是另一个企业产量的函数,两个函数的交点就是纳什均衡 q*=(q1*,q2*),如下图。3 信息与非合作博弈理论3.2 完全信息静态博弈3.2.3 理论应用:Gournot寡头竞争模型 图 3.1 Gournot模型的纳什均衡3 信息与非合作博弈理论3.2 完全信息静态博弈3.2.3 理论应用:Gournot寡头竞争模型 表 3.9 猜硬币游戏 儿童 B 正面 反面 儿童A 正面 反面 表 3.10 社会福利博弈 流浪汉

12、寻找工作 游荡 政府 救济 不救济 3.2.4 混合战略纳什均衡-1,1 1,-1 1,-1-1,1 3,2-1,3-1,1 0,0 3 信息与非合作博弈理论3.2 完全信息静态博弈 定义 在博弈GS1,S2,Sn;u1,u2,un中,参与人的战略空间为Si=si1,si2,sik,则参与人i以概率分布i=(i1,i k)随机地在其k个可选战略中选择的“战略”称为个混合战略。其中0ij1,且ij=1。这样,纯战略可以理解为混合战略的特例,如纯战略si可以看作是混合策略i=(1,0,0),即选择纯战略si的概率为1,选择任何其它纯战略的概率为0。3 信息与非合作博弈理论3.2 完全信息静态博弈3

13、.2.4 混合战略纳什均衡3.3 完全信息动态博弈3.3.1 博弈的扩展式表述3 信息与非合作博弈理论信息集信息集集合集合行动空间行动空间支付函数支付函数 扩展式表述扩展式表述行动行动顺序顺序外生事件概率 图3.2 房地产开发博弈 ANNBBBB开 发 不 开 发 需求大 需求小 需求大 需求小开发 不开发 开发 不开发 开发 不开发 开发 不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)单位:千万元hA(1)hN(1)hN(2)hB(1)hB(2)hB(3)hB(4)h 表 示 信息集3 信息与非合作博弈理论3.3 完全信息动态博弈3.3.1 博弈的

14、扩展式表述3 信息与非合作博弈理论3.3 完全信息动态博弈3.3.1 博弈的扩展式表述博弈树基博弈树基本元素本元素信息信息集集结结枝枝 不允许出现下面的情况:图3.3 博弈树不允许的情况 3 信息与非合作博弈理论3.3 完全信息动态博弈3.3.1 博弈的扩展式表述 图 3.4 抽象例子 3 信息与非合作博弈理论3.3 完全信息动态博弈3.3.2 扩展式表述博弈的纳什均衡 从上图抽象例子的博弈树我们可以得到,参与人2有两个战略集,相应地也有两个信息集,A(h2(1)=A(h2(2)=左,右,其中H2=h2(1),h2(2);参与人2的纯战略空间为:S2=(A(h2(1),Ah2(2)=(左,右)

15、(左,右)=(左,左),(左,右),(右,左),(右,右),其中纯战略(左,左)表明:当1取“上”时,2取“左”;当1取“下”时,2取“左”,如此等等。参与人1有三个信息集H1=hi(i),i=1,2,3,1的纯战略空间为:S1=A(h1(1)A(h1(2)A(h1(3)=(上,下)(A,B)(C,D),共8种纯战略。3 信息与非合作博弈理论3.3 完全信息动态博弈3.3.2 扩展式表述博弈的纳什均衡 定义 战略组合s*是扩展式博弈的一个纳什均衡,如果对于所有的i,si*最大化ui(si*,s-i*),即:si*arg max ui(si*,s-i*),对于任意 i 注意,因为一个参与人的纳什

16、均衡战略是假定其他参与人的战略为给定时的最优战略,所有参与人似乎是在同时选择战略。但这并不意味着在纳什均衡中,参与人一定是在同时选择行动。定理 一个有限完美信息博弈有一个纯战略纳什均衡。3 信息与非合作博弈理论3.3 完全信息动态博弈3.3.2 扩展式表述博弈的纳什均衡 1、子博弈精炼纳什均衡 纳什均衡在原则上适用所有的博弈,但对于预测参与人的行为来说,纳什均衡可能并不是一个合理的预测,如房地产博弈:图3.5 房地产开发博弈3.3.3 子博弈精炼纳什均衡3 信息与非合作博弈理论3.3 完全信息动态博弈 1、子博弈精炼纳什均衡 图3.6房地产开发博弈3 信息与非合作博弈理论3.3 完全信息动态博

17、弈3.3.3 子博弈精炼纳什均衡 1、子博弈精炼纳什均衡 正式地,我们有下述定义:定义 一个扩展式表述博弈的子博弈G由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成,它满足下列条件:x是一个单点信息集,即h(x)=x;对于所有的xT(x),如果xh(x),则xT(x)。3 信息与非合作博弈理论3.3 完全信息动态博弈3.3.3 子博弈精炼纳什均衡 1、子博弈精炼纳什均衡 图3.7 抽象博弈 图3.8 抽象博弈3 信息与非合作博弈理论3.3 完全信息动态博弈3.3.3 子博弈精炼纳什均衡 1、子博弈精炼纳什均衡 有了子博弈的概念,下面给出“子博弈精炼纳什均衡”的正式定义:定义 扩展

18、式表述博弈的战略组合s*=(s1*,,si*,sn*)是一个子博弈精炼纳什均衡,如果满足:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。3 信息与非合作博弈理论3.3 完全信息动态博弈3.3.3 子博弈精炼纳什均衡 2、子博弈精炼纳什均衡的求解-逆向归纳法 图3.9 三阶段完美信息 3 信息与非合作博弈理论3.3 完全信息动态博弈3.3.3 子博弈精炼纳什均衡 如同在库诺特模型中一样,在斯坦科尔伯格模型中,企业的行动也是选择产量。不同的是,在斯坦科尔伯格模型中,企业1(称为领头企业)先选择产量q1Q1=0,),企业2(称为尾随企业)观测到q1后选择自己的产量q2Q2=0,)

19、。因此,这是一个完美信息动态博弈。假定逆需求函数为P(Q)=aq1q2,两个企业有相同的不变单位成本c0,则支付(利润)函数为:ui(q1,q2)=qi(P(Q)c),i=1,2 3.3.4 理论应用:Stackelberg寡头竞争模型3 信息与非合作博弈理论3.3 完全信息动态博弈 我们用逆向归纳法求解这个博弈的子博弈精炼完美纳什均衡。假定q1已经选定,企业2的问题是:max u2(q1,q2)=q2(aq1q2c)最优化一阶条件为 s2(q1)=(aq1c)/2假定q1 ac。这是实际上是库诺特模型中企业2的反应函数,不同的是,这里,s2(q1)是当企业1选择q1时企业2的实际选择,而在库

20、诺特模型中,R2(q1)是企业2对于假设的q1的最优反应。3 信息与非合作博弈理论3.3 完全信息动态博弈3.3.4 理论应用:Stackelberg寡头竞争模型 因为企业1预测到企业2将根据s2(q1)选择q2,企业1在第一阶段的问题是:max u1(q1,s2(q1)=q1(aq1s2(q1)c)解一阶条件得:q1*=(ac)/2 将q1*代入s2(q1)得:q2*=s2(q1*)=(ac)/4这就是子博弈精炼纳什均衡结果(一般称为斯坦科尔伯格均衡结果)。子博弈精炼纳什均衡是(q1*,s2(q1))3 信息与非合作博弈理论3.3 完全信息动态博弈3.3.4 理论应用:Stackelberg

21、寡头竞争模型赢利表赢利表 表3.12 B 3 信息与非合作博弈理论信息与非合作博弈理论0,-1 2,0 ,-1 ,2,3,0 0 2 1 3 3 5进入 不进入 0进入 不进入 1 建厂 不建厂在位者高成本情况(p)在位者低成本情况(1-p)表 3.12 A 1、不完全信息博弈 3.4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 3 信息与非合作博弈理论信息与非合作博弈理论分析表3.12 A 和3.12 B 可发现,进入者是否应该进入,应取决于在位者的成本:在位者高成本则进入者应该进入,在位者低成本则进入者应不进入。现在,进入者不知道在位者成本高低,因此它分别计算进入和不进

22、入的预期收益:EU2(进入)=p*U2(不建厂,进入|t1=H)+(1-p)*U2(建厂,进入|t1=L)1、不完全信息博弈 3.4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 3 信息与非合作博弈理论信息与非合作博弈理论 给定对方进入,如果自己是高成本则应不建厂,自己是低成本则应建厂。由此,可计算出:EU2(进入)=1*p+(-1)*(1-p)=2p-1 EU2(不进入)=p*U2(不建厂,不进入|t1=H+(1-p)*U2(建厂,不进入|t1=L)=0 因此有:P1/2 进入者进入;P1/2 进入者不进入1、不完全信息博弈 3.4 不完全信息静态博弈 3.4.1 不完全

23、信息博弈和贝叶斯纳什均衡 3 信息与非合作博弈理论信息与非合作博弈理论博弈的均衡是:*如果在位者成本高,则不建厂;若 p1/2则进入者进入,p 1/2则进入者不进入;*如果在位者成本低,则建厂;进入者是否进入仍取决于对概率 p的判断。进入者是否进入仍取决于对概率进入者是否进入仍取决于对概率 p的判断。的判断。1、不完全信息博弈 3.4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 静态贝叶斯博弈的时间顺序为:1、自然选择类型向量,参与人i能观测到自己的类型,但参与人j只知道除i之外所有参与人类型,但不知道参与人i的类型。2、n个参与人同时行动;3、参与人i得到类型依存支付函数

24、。给定参与人i只知道自己的类型而不知道其他参与人的类型,参与人i将选择使自己的效应最大化的期望效用。2、静态贝叶斯博弈 3 信息与非合作博弈理论信息与非合作博弈理论3.4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 3、海萨尼转换 海萨尼在1967-1968年提出了一个处理不完全信息的方法引入一个虚拟的参与人“自然”,自然首先行动,选择决定参与人的特征(如成本函数),参与人知道自己的特征,其他参与人不知道。这样不完全信息博弈就转换为完全但不完美信息博弈,可以利用标准的分析技术进行分析,这就是“海萨尼转换”。3 信息与非合作博弈理论信息与非合作博弈理论3.4 不完全信息静态博

25、弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 3 信息与非合作博弈理论信息与非合作博弈理论 类型:一个参与人拥有的所有的个人信息(即所有不是共同知识的信息)称为他的类型。根据这个定义,甚至允许参与人不知道其他参与人是否知道自己的类型。例如:市场进入博弈:在位者不知道进入者是否知道自己是高成本还是低成本,只知道进入者有p的概率知道自己的成本函数,(1-p)的概率不知道自己的成本函数。这种情况下,进入者也有两种类型:知道(在位者的成本)或不知道(在位者的成本)。不完全信息意味着,至少有一个参与人有多个类型。3、海萨尼转换 3.4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 3

26、 信息与非合作博弈理论信息与非合作博弈理论4、贝叶斯纳什均衡 贝叶斯纳什均衡:n人不完全信息静态博弈的纯战略均衡是一个类型依存战略组合,其中每个参与人i在给定自己的类型i和其他参与人类型依存战略的情况下,最大化自己的期望效用。3.4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 3.4.2 应用举例 v参与人:企业1、企业2;v行动顺序:同时行动v不完全信息:企业1单位成本c1是共同知识,企业2的成本可能是c2l或c2h,企业1只知道c2=c2l的可能性是1/2,这是共同知识。1、不完全信息古诺模型3 信息与非合作博弈理论信息与非合作博弈理论3.4 不完全信息静态博弈 企业1

27、企业2qi:第i个企业的产量Ci:代表第i个企业的成本假定逆需求函数为:第i个企业的利润函数为:2,1),)(),(21icQPqqqiii)()(21qqaQP1、不完全信息古诺模型3 信息与非合作博弈理论信息与非合作博弈理论3.4 不完全信息静态博弈 3.4.2 应用举例 3 信息与非合作博弈理论信息与非合作博弈理论 假定a=2,c1=1,c2l=3/4,c2h=5/4。给定企业2知道企业1的成本,企业2将选择q2最大化利润函数:t=a-c=a-3/4=5/4或t=a-5/4=3/4 依赖于企业2的实际成本。从最优化一阶条件可得企业2的反应函数为:)(2*122qqtq)(21),(11*

28、1qttqq3.4 不完全信息静态博弈 3.4.2 应用举例 3 信息与非合作博弈理论信息与非合作博弈理论)(21),(11*2qttqq 也就是说,企业2的最优产量不仅依赖于企业的产量,而且依赖于自己的成本,令q2l为t=5/4时企业2的最优产量,q2h为t=3/4时企业2的最优产量。那么,q2l=1/2*(5/4-q1);q2h=1/2*(3/4-q1)企业1不知道企业2的真实成本从而不知道企业2的最优反应究竟是q2l还是q2h,因此企业1将选择q1最大化下列利润函数:)1(21)1(21h211l2111qqqqqqE3.4 不完全信息静态博弈 3.4.2 应用举例 3 信息与非合作博弈

29、理论信息与非合作博弈理论最优化一阶条件得企业1的反应函数为:)1(21)21211(212l2h2*1Eqqqqh2l222121qqEq是企业1关于企业2产量的期望值 均衡意味着两个反应函数同时成立,解两个反应函数得贝叶斯均衡为:24/5;24/11;31*h2*l2*1qqq3.4 不完全信息静态博弈 3.4.2 应用举例 3 信息与非合作博弈理论信息与非合作博弈理论2、密封拍卖 一次密封价格拍卖是许多拍卖方式中的一种,投标人同时将自己的出价写出来装入一个信封,密封后交给拍卖人,由拍卖人打开信封,出价最高者按其出价支付价格获得走被拍卖的物品。这里,每个投标人的战略是根据自己对该物品的评价相

30、对其他投标人评价的判断来选择自己的出价,赢者的支付是他对物品的评价减去他的出价,其他投标人的支付为零。3.4 不完全信息静态博弈 3.4.2 应用举例 3 信息与非合作博弈理论信息与非合作博弈理论行动空间参与人i的行动是递送一个(非负)标价bi,bi0,+)。类型空间参与人i的类型是他对货物的估价vi,类型空间为Ti=0,1。信念估价是独立的,参与人都相信vi均匀地分布在0,1上 2、密封拍卖 得益函数ui(b1,b2,v1,v2)=jbib 0,jbib )/2ib-i(vjbib ib-iv如果如果如果3.4 不完全信息静态博弈 3.4.2 应用举例 3.5 不完全信息动态博弈 3 信息与

31、非合作博弈理论信息与非合作博弈理论3.5.1 精炼贝叶斯均衡 1、贝叶斯法则 在日常生活中,当面临不确定时,我们对某事件发生的可能性有一个判断,然后,会根据新的信息来修正这个判断。统计学上,修正之前的判断称为“先验概率先验概率”修正后的判断称为“后验概率后验概率”贝叶斯法则贝叶斯法则就是人们根据新的信息从先验概率得到后验概率的基本方法。3 信息与非合作博弈理论信息与非合作博弈理论1、贝叶斯法则 假定参与人的类型是独立分布的,参与人i有K个类型,有H个可能的行动,k和ah分别代表一个特定的类型和一个特定的行动。如果我们观察到i选择了ah,i属于k的后验概率是多少?kjjjhkkhhkkhhkpa

32、ppapaobpapaob1)()()()(Pr)()(Pr3.5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 3 信息与非合作博弈理论信息与非合作博弈理论1、贝叶斯法则人:好人(GP),坏人(BP)事:好事(GT),坏事(BP)一个好人干好事的概率等于他是好人的概率p(GP)乘以好人干好事的概率p(GT|GP),加上他是坏人的概率p(BP)乘以坏人干好事的概率p(GT|BP):ProbGT=p(GT|GP)*p(GP)+p(GT|BP)*p(GT|BP)3.5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 3 信息与非合作博弈理论信息与非合作博弈理论1、贝叶斯法则 假定观测到一个人干了

33、一件好事,那么这个人的是好人的后验概率是:Pr)()(PrGTobGPpGPGTpGTGPob 假定我们认为这个人是好人的先验概率是1/2,观测到他干了好事之后如何修正他的先验概率依赖于他干的好事好到什么程度:3.5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 3 信息与非合作博弈理论信息与非合作博弈理论1、贝叶斯法则1)是一件非常好的好事,坏人绝对不可能干,则p(GT|GP)=1 p(GT|BP)=02)这是一个非常一般的好事,好人会干,坏人也会干:p(GT|GP)=1 p(GT|BP)=112/102/112/11PrGTGPob212/112/112/11PrGTGPob3.5 不完

34、全信息动态博弈 3.5.1 精炼贝叶斯均衡 3 信息与非合作博弈理论信息与非合作博弈理论1、贝叶斯法则3)介于上述两种情况之间:好人肯定会干,但坏人可能会干也可能不会干:p(GT|GP)=1/2 p(GT|BP)=1/2322/12/12/112/11PrGTGPob3.5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 3 信息与非合作博弈理论信息与非合作博弈理论1、贝叶斯法则假定我们观测到他干了一件坏事,我们相信,好人绝对不会干坏事,那么可以肯定他绝对不是一个好人。02/12/102/10PrpBTGPob假定我们原来认为他是个好人,大突然发现他干了一件好事,我们如何看待呢?1102/1P

35、rpqpGTBPob3.5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 3 信息与非合作博弈理论信息与非合作博弈理论1)在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);2)给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;3)每一个参与人根据贝叶斯法则和均衡战略修正后验概率。2、精炼贝叶斯均衡3.5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 3 信息与非合作博弈理论信息与非合作博弈理论 信号传递博弈是一种比较简单的但有广泛应用意义的不完全信息动态博弈。1)信息不对称可能导致潜在的交易不能进行;2)但在许多情况下,为了获得

36、交易带来的收益,拥有私人信息的一方会主动揭示自己的私人信息;3)信号传递:拥有私人信息的一方通过一定的行为选择来告诉没有私人信息的一方自己的真实类型。4)参与人:两个,信号发送者1和信号接收者2;1的类型是私人信息,2 的类型是公共信息(即只有一个类型)。3.5 不完全信息动态博弈 3.5.2 信号博弈 3 信息与非合作博弈理论信息与非合作博弈理论博弈顺序:1)“自然”首先选择参与人1的类型,参与人1知道,但参与人2不知道,只知道1属于该类型x的先验概率。2)参与人1观测到类型x后发出信号。3)参与人2观测到参与人1发出的信号,使用贝叶斯法则从先验概率得到后验概率,然后选择行动。3.5 不完全

37、信息动态博弈 3.5.2 信号博弈 3 信息与非合作博弈理论信息与非合作博弈理论应用举例应用举例:最早的信号博弈模型是斯彭思斯彭思1973年提出的求职模型。企业招聘工人的时候,总是希望能招聘到素质比较高的工人,因为高素质的工人的劳动生产率比较高,能够给企业带来更大的经济效益。但是,识别工人的素质也不是一件容易的事。但是,过分要求高素质也不现实,因为一方面高素质的工人可能会要求较高的报酬,另一方面当工人的普遍素质不是很高的时候,筛选标准定的过高,就难以找到足够的工人。3.5 不完全信息动态博弈 3.5.2 信号博弈 3 信息与非合作博弈理论信息与非合作博弈理论工人素质P00.5劳 动 生产 率

38、信号成本bp3.5 不完全信息动态博弈 3.5.2 信号博弈 工 人 素质pc劳 动 生 产率 信 号 成本00.5e(e+1)/21abpcd3 信息与非合作博弈理论信息与非合作博弈理论3.5 不完全信息动态博弈 3.5.2 信号博弈 3 信息与非合作博弈理论信息与非合作博弈理论1简述博弈论的含义。2简述博弈的几种类型。3找出下面战略式表述博弈中的重复剔除的占优均衡解。思考与练习思考与练习 参与人BL C R4,35,16,22,18,43,63,09,65,8 U参与人A M D4简述纳什均衡的含义。5何为博弈的扩展式表述?3 信息与非合作博弈理论信息与非合作博弈理论6用逆向归纳法求解下面博弈的子博弈精炼纳什均衡。UDLRVM 121(2,0)(1,1)(3,0)(0,2)3 信息与非合作博弈理论信息与非合作博弈理论 7静态贝叶斯博弈中博弈方的战略有什么特点?为什么?8不完全信息库诺特模型可以解决现实生活中哪些问题?举例说明。9海萨尼转换的贡献是什么?可以解决什么问题?10一次拍卖利与弊分别是什么?你能想出更公平的拍卖规则么?11对雇员的试用期是否越长越好?为什么?12信号机制起作用的基本条件是什么?13贝叶斯法则是什么?解决什么样的问题?主编:撰稿教师:(以姓氏为序)制作:责任编辑:电子编辑:

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!