博弈论的几个经典模型ppt课件

上传人:沈*** 文档编号:149862945 上传时间:2022-09-08 格式:PPT 页数:81 大小:2.07MB
收藏 版权申诉 举报 下载
博弈论的几个经典模型ppt课件_第1页
第1页 / 共81页
博弈论的几个经典模型ppt课件_第2页
第2页 / 共81页
博弈论的几个经典模型ppt课件_第3页
第3页 / 共81页
资源描述:

《博弈论的几个经典模型ppt课件》由会员分享,可在线阅读,更多相关《博弈论的几个经典模型ppt课件(81页珍藏版)》请在装配图网上搜索。

1、.1博弈论的几个经典模型博弈论的几个经典模型.2 博弈论的几个经典模型博弈论的几个经典模型.3引 言博弈论的几个经典模型博弈论的几个经典模型.4引 言博弈论的几个经典模型博弈论的几个经典模型.5失火了,你往哪个门跑失火了,你往哪个门跑这就是博弈论这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢

2、这两个间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如将逃生。这里我们不考虑道德因素,你将如何选择?何选择?博弈论的几个经典模型博弈论的几个经典模型.6 引 言博弈论的几个经典模型博弈论的几个经典模型.7 引 言博弈论的几个经典模型博弈论的几个经典模型.8引 言博弈论的几个经典模型博弈论的几个经典模型.9海萨尼(海萨尼(John C.Hars

3、anyiJohn C.Harsanyi)引 言博弈论的几个经典模型博弈论的几个经典模型.10博弈论的几个经典模型博弈论的几个经典模型.11基本术语基本术语博弈论的几个经典模型博弈论的几个经典模型.12 参与者在不同策略组合下会得到一定的支付(参与者在不同策略组合下会得到一定的支付(payoffpayoff)。)。对于博弈参与者来说,存在着一博弈结果。对于博弈参与者来说,存在着一博弈结果。博弈涉及均衡。博弈涉及均衡。重要的均衡重要的均衡纳什均衡。纳什均衡。基本术语基本术语博弈论的几个经典模型博弈论的几个经典模型.13 非合作性博弈非合作性博弈:是指参与者在行动选择时无:是指参与者在行动选择时无法

4、达成约束性的协议。人们分工与交换的经法达成约束性的协议。人们分工与交换的经济活动就是合作性的博弈,而囚徒困境则是济活动就是合作性的博弈,而囚徒困境则是非合作性的博弈。非合作性的博弈。博弈的类型博弈的类型博弈论的几个经典模型博弈论的几个经典模型.14 博弈的类型博弈的类型博弈论的几个经典模型博弈论的几个经典模型.15 博弈的类型博弈的类型博弈论的几个经典模型博弈论的几个经典模型.16 模型一、智猪博弈模型一、智猪博弈/完全信息静态博弈完全信息静态博弈 小猪小猪大猪大猪按按不按不按(等待等待)按按(5(5,1)1)(5(5,3)3)不按不按(等待等待)(9(9,-1)-1)(0(0,0)0)大猪和

5、小猪分别该如何选择。大猪和小猪分别该如何选择。博弈论的几个经典模型博弈论的几个经典模型.17选择等待是小猪的占优策略。选择等待是小猪的占优策略。大猪的最佳选择取决于小猪的行动,如果小猪大猪的最佳选择取决于小猪的行动,如果小猪去按,大猪最好选择等待;如果小猪不去按去按,大猪最好选择等待;如果小猪不去按,则最佳选择是大猪亲自去按。则最佳选择是大猪亲自去按。也就是说,在智猪博弈中,大猪没有占优策略也就是说,在智猪博弈中,大猪没有占优策略,而小猪有占优策略,它的最佳选择就是耐心而小猪有占优策略,它的最佳选择就是耐心等待大猪去按钮,才能获得最佳结果。等待大猪去按钮,才能获得最佳结果。“小猪躺着大猪跑小猪

6、躺着大猪跑”的现象是由于故事中的游的现象是由于故事中的游戏规则所导致的。规则的核心指标是戏规则所导致的。规则的核心指标是:每次落每次落下的事物数量和踏板与投食口之间的距离。下的事物数量和踏板与投食口之间的距离。模型一、智猪博弈模型一、智猪博弈/完全信息静态博弈完全信息静态博弈博弈论的几个经典模型博弈论的几个经典模型.18如果改变一下核心指标,猪圈里还会出现同样如果改变一下核心指标,猪圈里还会出现同样的的“小猪躺着大猪跑小猪躺着大猪跑”的景象吗?试试看。的景象吗?试试看。改变方案一:减量方案。改变方案一:减量方案。改变方案二:增量方案。改变方案二:增量方案。改变方案三:减量加移位方案。改变方案三

7、:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食抢着踩踏板。等待者不得食,而多劳者多得。而多劳者多得。每次的收获刚好消费完。每次的收获刚好消费完。对于游戏设计者,这是一个最好的方案。对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。成本不高,但收获最大。模型一、智猪博弈模型一、智猪博弈/完全信息静态博弈完全信息静态博弈博弈论的几个经典模型博弈论的几个经典模型.19 在博弈论中,含有占优战略均衡的一个在博弈论中,含有占优战略均衡的一个著名例

8、子是由塔克给出的著名例子是由塔克给出的“囚徒困境囚徒困境”(prisonersdilemmaprisonersdilemma)博弈模型。该模型用)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小一种特别的方式为我们讲述了一个警察与小偷的故事。偷的故事。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈博弈论的几个经典模型博弈论的几个经典模型.20假设:有两个小偷假设:有两个小偷A A和和B B联合犯事、私入民宅被联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警房间内进行审讯,对每一个犯罪嫌疑人,警

9、方给出的政策是:如果一个犯罪嫌疑人坦白方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑坦白,则两人各被判刑8 8年;如果另一个犯罪年;如果另一个犯罪嫌人没有坦白而是抵赖嫌人没有坦白而是抵赖,则以妨碍公务罪(因则以妨碍公务罪(因已有证据表明其有罪)再加刑已有证据表明其有罪)再加刑2 2年,而坦白者年,而坦白者有功被减刑有功被减刑8 8年,立即释放。如果两人都抵赖年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但则警方因

10、证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱可以私入民宅的罪名将两人各判入狱1 1年。年。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈博弈论的几个经典模型博弈论的几个经典模型.21 不难看出,不难看出,“坦白坦白”是任一犯罪嫌疑人的占是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略优战略,而(坦白,坦白)是一个占优战略均衡。均衡。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈 乙乙 甲甲坦白坦白抵赖抵赖坦白坦白(-8(-8,-8)-8)(0(0,-10)-10)抵赖抵赖(-10(-10,0)0)(-1(-1,-1)-1)博弈论的几个经典模型博弈论的

11、几个经典模型.22 对于两个犯罪嫌疑人总体而言,他们设想对于两个犯罪嫌疑人总体而言,他们设想的最好的策略可能是都不交代。但任何一个的最好的策略可能是都不交代。但任何一个犯罪嫌疑人在选择不交代的策略时,都要冒犯罪嫌疑人在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一犯罪嫌很大的风险,一旦自己不交代而另一犯罪嫌疑人交代了,自己就将可能处于非常不利的疑人交代了,自己就将可能处于非常不利的境地。对于境地。对于A A而言而言,不管不管B B采取何种策略,他的采取何种策略,他的最佳策略都是交代。对于最佳策略都是交代。对于B B而言也是如此。最而言也是如此。最后两人都会选择交代。后两人都会选择交

12、代。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈博弈论的几个经典模型博弈论的几个经典模型.23该博弈刻划了两大难题:该博弈刻划了两大难题:冲突情形下,参与人的目标是什么?是采用冲突情形下,参与人的目标是什么?是采用(作作为个人为个人)他自己的最好策略,还是采用他自己的最好策略,还是采用(作为集作为集体的一员体的一员)他们共同的最好策略?前者导致均衡他们共同的最好策略?前者导致均衡策略策略(坦白,坦白坦白,坦白),支付为,支付为(-8(-8,-8)-8);后者的最;后者的最好策略是好策略是(抵赖,抵赖抵赖,抵赖),支付为,支付为(-1(-1,-1)-1)。这里。这里反映了个体理性行为与

13、集体理性行为之间的矛反映了个体理性行为与集体理性行为之间的矛盾、冲突。盾、冲突。此博弈只进行一次还是重复进行?如果博弈只此博弈只进行一次还是重复进行?如果博弈只进行一次,参与人似乎只有坦白才是最好的策进行一次,参与人似乎只有坦白才是最好的策略,因为没有理由相信对手会对你有信心,他略,因为没有理由相信对手会对你有信心,他总认为你自己会坦白;因此,双方都采取坦白总认为你自己会坦白;因此,双方都采取坦白策略。然而,若博弈进行多次,则结论将会发策略。然而,若博弈进行多次,则结论将会发生变化。生变化。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈博弈论的几个经典模型博弈论的几个经典模型.24囚徒

14、困境可以用来说明许多现象。囚徒困境可以用来说明许多现象。寡头定价寡头定价拍卖出价拍卖出价推销员的努力推销员的努力政治上的讨价还价政治上的讨价还价军备竞赛等(冲突中出现两败俱伤的情况军备竞赛等(冲突中出现两败俱伤的情况,往往要考虑到囚徒困境)往往要考虑到囚徒困境)*(纯策略)纳什均衡(纯策略)纳什均衡模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈博弈论的几个经典模型博弈论的几个经典模型.25某年在荷兰召开了一次某年在荷兰召开了一次“合作及社会两难困境研讨合作及社会两难困境研讨会会”,与会者都是博弈论的专家。,与会者都是博弈论的专家。当大会结束之后,有两个学者,麦息克和路特提议当大会结束之

15、后,有两个学者,麦息克和路特提议大家玩一个游戏。大家玩一个游戏。他们将一个大信封拿出来,请在场的位专家拿他们将一个大信封拿出来,请在场的位专家拿出金钱装到这个信封里。如果到最后这信封里的钱出金钱装到这个信封里。如果到最后这信封里的钱超过元,麦息克和路特将自己掏腰包,退还超过元,麦息克和路特将自己掏腰包,退还每人元。不过,如果最后信封内的钱不足每人元。不过,如果最后信封内的钱不足元,就统统没收,大家拿不到半毛钱。元,就统统没收,大家拿不到半毛钱。仔细想一想,如果你也在场,你会奉献多少钱呢?仔细想一想,如果你也在场,你会奉献多少钱呢?问题与思考问题与思考博弈论的几个经典模型博弈论的几个经典模型.2

16、6 什么是海萨尼转换?什么是海萨尼转换?海萨尼提出了一种处理不完全信息博弈的方海萨尼提出了一种处理不完全信息博弈的方法法,即引入一个虚拟的局中人即引入一个虚拟的局中人“自然自然”。自然首先行动,它决定每个局中人的特征。自然首先行动,它决定每个局中人的特征。每个局中人知道自己的特征,但不知道别的每个局中人知道自己的特征,但不知道别的局中人特征。这种方法将不完全信息静态博局中人特征。这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是弈变成一个两阶段动态博弈,第一个阶段是自然自然N N的行动选择,第二阶段是除的行动选择,第二阶段是除N N外的局中外的局中人的静态博弈。这种转换被称为人的

17、静态博弈。这种转换被称为“海萨尼转海萨尼转换换”,这个转换把,这个转换把“不完全信息不完全信息”转变成为转变成为完全但不完美信息,从而可以用分析完全信完全但不完美信息,从而可以用分析完全信息博弈的方法进行分析。息博弈的方法进行分析。模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/不完全信息静态博弈不完全信息静态博弈博弈论的几个经典模型博弈论的几个经典模型.27 海萨尼转换的具体方法海萨尼转换的具体方法一个虚拟的参与人一个虚拟的参与人“自然自然”,自然首先决定参自然首先决定参与人的类型,赋予各参与人的类型向量与人的类型,赋予各参与人的类型向量 ,其,其中中 ;自然告知参

18、与者自己的类型,却不告诉其他参自然告知参与者自己的类型,却不告诉其他参与者的类型;与者的类型;参与者同时选择行动参与者同时选择行动,每一参与者每一参与者 从可行集从可行集 中中选择行动方案选择行动方案 ;各方得到收益各方得到收益 。借助于第一步和第二步中虚构的参与者借助于第一步和第二步中虚构的参与者“自自然然”的行动,我们可以把一个不完全信息的的行动,我们可以把一个不完全信息的博弈表述为一个不完美信息的博弈。博弈表述为一个不完美信息的博弈。模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/不完全信息静态博弈不完全信息静态博弈t12(,)ntt tt12(,)iiiA a

19、 aa tiiA博弈论的几个经典模型博弈论的几个经典模型.28 海萨尼转换分析海萨尼转换分析 海萨尼转换是处理不完全信息博弈的标准方海萨尼转换是处理不完全信息博弈的标准方法。一般地法。一般地,“,“自然自然”在博弈开始的时候选择在博弈开始的时候选择参与人的类型,参与人的某个类型包括表征参与人的类型,参与人的某个类型包括表征类型的各个特征如策略空间、信息集、得益类型的各个特征如策略空间、信息集、得益函数等,这些又称为该类型参与人所拥有的函数等,这些又称为该类型参与人所拥有的个人信息。个人信息。不完全信息意味着博弈各方中至少有一个参不完全信息意味着博弈各方中至少有一个参与人有多个类型。与人有多个类

20、型。模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/不完全信息静态博弈不完全信息静态博弈博弈论的几个经典模型博弈论的几个经典模型.29 通过海萨尼转换,博弈开始时,所有参通过海萨尼转换,博弈开始时,所有参与人有关与人有关“自然自然”的行动有一致的信念,即的行动有一致的信念,即都知道所有参与人类型的概率分布函数,此都知道所有参与人类型的概率分布函数,此即即“海萨尼公理海萨尼公理”。模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/不完全信息静态博弈不完全信息静态博弈博弈论的几个经典模型博弈论的几个经典模型.30 经典案例解析经典案例解析例:某一市

21、场原来被例:某一市场原来被A A企业所垄断。现在企业所垄断。现在B B企业考虑是企业考虑是否进入。否进入。B B企业知道,企业知道,A A企业是否允许它进入,取决企业是否允许它进入,取决于于A A企业阻挠企业阻挠B B企业进入所花费的成本。如果阻挠的企业进入所花费的成本。如果阻挠的成本低,那么,正如下表后两列所表示的,成本低,那么,正如下表后两列所表示的,A A企业的企业的占优战略是阻挠,博弈有重复剔除的占优战略均衡占优战略是阻挠,博弈有重复剔除的占优战略均衡AA阻挠,阻挠,B B不进入。如果阻挠的成本高,那么,正不进入。如果阻挠的成本高,那么,正如下表前两列所表示的,如下表前两列所表示的,A

22、 A企业的占优战略是默许企业的占优战略是默许B B进入,博弈有重复剔除的占优战略均衡进入,博弈有重复剔除的占优战略均衡AA默许,默许,B B进入。进入。B B企业所不知道的,是企业所不知道的,是A A企业的阻挠成本是高企业的阻挠成本是高是低。这里,某一参与人本人知道、其他参与人则不是低。这里,某一参与人本人知道、其他参与人则不知道的信息称为私人信息。某一参与人所拥有的全部知道的信息称为私人信息。某一参与人所拥有的全部私人信息称为他的类型。在本例中,阻挠成本就是私人信息称为他的类型。在本例中,阻挠成本就是 A A的私人信息。高阻挠成本和低阻挠成本则是两种不同的私人信息。高阻挠成本和低阻挠成本则是

23、两种不同的类型。的类型。模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/不完全信息静态博弈不完全信息静态博弈博弈论的几个经典模型博弈论的几个经典模型.31海萨尼转换后的市场进入博弈:海萨尼转换后的市场进入博弈:模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/不完全信息静态博弈不完全信息静态博弈 A A B B高成本高成本低成本低成本默许默许阻挠阻挠默许默许阻挠阻挠进入进入(40,50)(40,50)(-10,0)(-10,0)(30,100)(30,100)(-10,140)(-10,140)不进入不进入(0,300)(0,300)(0,30

24、0)(0,300)(0,400)(0,400)(0,400)(0,400)显然,在这里,显然,在这里,B B所遇到的,是不确定性条件所遇到的,是不确定性条件下的选择问题。因为下的选择问题。因为B B不仅不知道不仅不知道A A的类型的类型 (是高还是低),而且不知道不同类型的分(是高还是低),而且不知道不同类型的分布概率。布概率。博弈论的几个经典模型博弈论的几个经典模型.32 按照海萨尼的方法,所有参与人的真实按照海萨尼的方法,所有参与人的真实类型都是给定的。其他参与人虽然不清楚某类型都是给定的。其他参与人虽然不清楚某一参与人的真实类型,但知道这些可能出现一参与人的真实类型,但知道这些可能出现的

25、类型的分布概率,而且这种概率是公共知的类型的分布概率,而且这种概率是公共知识。用本例来说,公共知识不仅意味着识。用本例来说,公共知识不仅意味着B B企业企业知道知道A A企业高阻挠成本与低阻挠成本的分布概企业高阻挠成本与低阻挠成本的分布概率,而且意味着率,而且意味着A A也清楚也清楚B B知道这一概率。知道这一概率。模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/不完全信息静态博弈不完全信息静态博弈博弈论的几个经典模型博弈论的几个经典模型.33模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/不完全信息静态博弈不完全信息静态博弈N N低成本低成

26、本高成本高成本A AB BB B(50,40)(50,40)(300,0)(300,0)(0,-10)(0,-10)(300,0)(300,0)(100,30)(100,30)(400,0)(400,0)(140,-10)(140,-10)(400,0)(400,0)A AB BB B默许默许默许默许阻挠阻挠阻挠阻挠进入进入不进入不进入 进入进入进入进入进入进入不进入不进入不进入不进入不进入不进入*贝叶斯纳什均衡贝叶斯纳什均衡 博弈论的几个经典模型博弈论的几个经典模型.34 言语博弈中的言语博弈中的“威胁威胁”与与“承诺承诺”在现实中,我们经常看到声称的策略决定,在现实中,我们经常看到声称的策

27、略决定,但是这些声称的策略可信吗?但是这些声称的策略可信吗?声称的策略包括声称的策略包括“威胁威胁”与与“承诺承诺”。在国。在国际核武器问题上际核武器问题上,我国及其他一些国家承诺我国及其他一些国家承诺“不首不首先使用核武器先使用核武器”就是一种言语承诺。就是一种言语承诺。博弈论中博弈论中,经常用经常用“可置信可置信”和和“不可置信不可置信”的的“威胁威胁”或或“承诺承诺”来区分行动者说出来的策来区分行动者说出来的策略,我们在对动态博弈的分析中会分析什么样的略,我们在对动态博弈的分析中会分析什么样的策略是可置信的策略是可置信的,什么样的策略是不可置信的。而什么样的策略是不可置信的。而分析分析“

28、威胁威胁”或或“承诺承诺”是可置信的还是不可置是可置信的还是不可置信的方法是倒推法。信的方法是倒推法。模型四、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完全且完美信息动态博弈完全且完美信息动态博弈 博弈论的几个经典模型博弈论的几个经典模型.35 倒推法(倒推法(backward inductionbackward induction)也叫逆向归)也叫逆向归纳法。那么什么是倒推法?纳法。那么什么是倒推法?要理解什么是倒推法,先来看一下商界里要理解什么是倒推法,先来看一下商界里经常见到的博弈。经常见到的博弈。在某个城市假定只有一家房地产开发商在某个城市假定只

29、有一家房地产开发商A,A,我们知道任何没有竞争下的垄断利润是很高我们知道任何没有竞争下的垄断利润是很高的,假定的,假定A A此时每年的垄断利润是此时每年的垄断利润是1010亿元。亿元。模型四、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完全且完美信息动态博弈完全且完美信息动态博弈 博弈论的几个经典模型博弈论的几个经典模型.36 现在假定有另外一个企业现在假定有另外一个企业B B,准备从事房,准备从事房地产开发。面对着地产开发。面对着B B要进入其垄断的行业,要进入其垄断的行业,A A想:一旦想:一旦B B进入,进入,A A的利润将受损很多,的利润将受损很多

30、,B B最好最好不要进入。所以不要进入。所以A A向向B B表示,你进入的话,我表示,你进入的话,我将阻挠你进入。假定当将阻挠你进入。假定当B B进入时进入时A A阻挠的话阻挠的话,A,A的利润降低到的利润降低到2 2,B B的利润是的利润是-1-1。而如果。而如果A A不阻不阻挠的话,挠的话,A A的利润是的利润是4 4,B B的利润也是的利润也是4 4。模型四、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完全且完美信息动态博弈完全且完美信息动态博弈 博弈论的几个经典模型博弈论的几个经典模型.37这样一个博弈可用下图表示:这样一个博弈可用下图表示:模型四

31、、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完全且完美信息动态博弈完全且完美信息动态博弈 B B进入进入不进入不进入A AA A:1010;B B:0 0阻挠阻挠不阻挠不阻挠A A:2 2;B B:1 1A A:4 4;B B:4 4博弈论的几个经典模型博弈论的几个经典模型.38 上图称之为博弈树。由上图可见,这个上图称之为博弈树。由上图可见,这个博弈由两阶段构成。我们称之为动态博弈,博弈由两阶段构成。我们称之为动态博弈,或者两阶段的动态博弈。博弈树是表示动态或者两阶段的动态博弈。博弈树是表示动态博弈的一个好方法。博弈的一个好方法。现在让我们回到房地产开

32、发商之间的博现在让我们回到房地产开发商之间的博弈问题。弈问题。A A的最好结局是的最好结局是“B B不进入不进入”,而,而B B的的最好结局是最好结局是“进入进入”而而A“A“不阻挠不阻挠”。这两个。这两个最好的结局不能构成均衡。那么结果是什么最好的结局不能构成均衡。那么结果是什么呢?呢?模型四、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完全且完美信息动态博弈完全且完美信息动态博弈 博弈论的几个经典模型博弈论的几个经典模型.39A A向向B B发出威胁:如果你进入,我将阻挠。而对发出威胁:如果你进入,我将阻挠。而对B B来说,如果进入,来说,如果进入,A

33、 A真的阻挠的话,它将受损真的阻挠的话,它将受损失失-1-1(假定(假定-1-1是它的机会成本),当然此时是它的机会成本),当然此时A A也有损失。对于也有损失。对于B B来说,问题是:来说,问题是:A A的威胁可的威胁可置信吗?置信吗?B B通过分析得出:通过分析得出:A A的威胁是不可置信的。原因的威胁是不可置信的。原因是:当是:当B B进入的时候,进入的时候,A A阻挠的收益是阻挠的收益是2 2,而不,而不阻挠的收益是阻挠的收益是4 4。4242,理性人是不会选择做,理性人是不会选择做非理性的事情的。也就是说,一旦非理性的事情的。也就是说,一旦B B进入,进入,A A的最好策略是合作,而

34、不是阻挠。因此,通的最好策略是合作,而不是阻挠。因此,通过分析,过分析,B B选择了进入,而选择了进入,而A A选择了合作。双选择了合作。双方的收益各为方的收益各为4 4。模型四、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完全且完美信息动态博弈完全且完美信息动态博弈 博弈论的几个经典模型博弈论的几个经典模型.40 在这个博弈中,在这个博弈中,B B采用的方法为倒推法,或采用的方法为倒推法,或者说逆向归纳法,即:当参与者作出决策时,者说逆向归纳法,即:当参与者作出决策时,他要通过对最后阶段的分析,准确预测对方的他要通过对最后阶段的分析,准确预测对方的行为,

35、从而确定自己的行为。行为,从而确定自己的行为。在这里,双方必须都是理性的。如果不满足在这里,双方必须都是理性的。如果不满足这个条件,就无法进行分析了。这个条件,就无法进行分析了。这个例子只是简单的两阶段博弈,而三阶段这个例子只是简单的两阶段博弈,而三阶段或更多阶段的博弈,可用同样方法加以分析。或更多阶段的博弈,可用同样方法加以分析。在动态博弈中,涉及在动态博弈中,涉及“威胁威胁”与与“承诺承诺”是不是可信的问题。静态地看,一博弈存在许是不是可信的问题。静态地看,一博弈存在许多均衡。多均衡。模型四、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完全且完美信息动

36、态博弈完全且完美信息动态博弈 博弈论的几个经典模型博弈论的几个经典模型.41上述上述“进入进入阻挠阻挠”问题的博弈树可用支付问题的博弈树可用支付矩阵表示:矩阵表示:模型四、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完全且完美信息动态博弈完全且完美信息动态博弈 B B A A进入进入阻挠阻挠阻挠阻挠(2(2,-1)-1)(10(10,0)0)不阻挠不阻挠(4(4,4)4)(10(10,0)0)在这个矩阵中,纳什均衡点有两个:在这个矩阵中,纳什均衡点有两个:(合作,进入合作,进入)和和(阻挠,不进入阻挠,不进入)。我们可以验证,在这两点上。我们可以验证,在这

37、两点上谁都不愿意改变策略。然而谁都不愿意改变策略。然而(阻挠,不进入阻挠,不进入)这个这个均衡是达不到的。因为这是动态博弈,在这个动均衡是达不到的。因为这是动态博弈,在这个动态博弈中,存在着先后策略选择顺序。态博弈中,存在着先后策略选择顺序。博弈论的几个经典模型博弈论的几个经典模型.42 这里分析的是完全且完美信息下的动态这里分析的是完全且完美信息下的动态博弈。所谓完全信息是指:博弈的支付函数博弈。所谓完全信息是指:博弈的支付函数是是“公共知识公共知识”。本书中未涉及不完全信息。本书中未涉及不完全信息的博弈问题,如囚徒困境这样的静态博弈也的博弈问题,如囚徒困境这样的静态博弈也是完全信息博弈。完

38、美信息是针对动态博弈是完全信息博弈。完美信息是针对动态博弈而言的,指参与者知道博弈的所有历史。而言的,指参与者知道博弈的所有历史。倒推法是动态博弈中有用的工具,它可倒推法是动态博弈中有用的工具,它可以说是理性的人自然的推理方式。然而倒推以说是理性的人自然的推理方式。然而倒推法面临着一个困难法面临着一个困难,这就是这就是蜈蚣博弈蜈蚣博弈的悖论。的悖论。模型四、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完全且完美信息动态博弈完全且完美信息动态博弈 博弈论的几个经典模型博弈论的几个经典模型.43 前面我们分析了前面我们分析了“威胁威胁”是否可信,我是否可信,我

39、们也可用同样的思路分析一个们也可用同样的思路分析一个“承诺承诺”是否是否可信。可信。“不首先使用核武器不首先使用核武器”的承诺可的承诺可信吗?信吗?*子博弈完美纳什均衡子博弈完美纳什均衡模型四、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完全且完美信息动态博弈完全且完美信息动态博弈 博弈论的几个经典模型博弈论的几个经典模型.44 光天化日之下的违法行为为什么总能成功?光天化日之下的违法行为为什么总能成功?人类有许多关于猴子的故事,比如朝三暮人类有许多关于猴子的故事,比如朝三暮四,杀鸡给猴看。其实猴子是没有思维的四,杀鸡给猴看。其实猴子是没有思维的,它们它们

40、有一定的群体意识,但没有社会意识,人们关有一定的群体意识,但没有社会意识,人们关于它们的故事其实是说人自己的。我们这里也于它们的故事其实是说人自己的。我们这里也讲一个猴子的故事讲一个猴子的故事。在现实社会中,窃贼在公共场所比如公共汽在现实社会中,窃贼在公共场所比如公共汽车上偷东西时,车上的乘客看到了,但不敢吭车上偷东西时,车上的乘客看到了,但不敢吭声。没有被偷的人想,反正被偷的待宰猴群的声。没有被偷的人想,反正被偷的待宰猴群的结局人不是我,我反抗了,我得不到任何好处结局人不是我,我反抗了,我得不到任何好处,反而遭到伤害;而不反抗虽不得益,但也不受反而遭到伤害;而不反抗虽不得益,但也不受损,我何

41、必要反抗呢?这就是光天化日之下的损,我何必要反抗呢?这就是光天化日之下的偷窃行为为什么总能成功的原因。偷窃行为为什么总能成功的原因。模型五、信号博弈模型五、信号博弈/不完全信息动态博弈不完全信息动态博弈博弈论的几个经典模型博弈论的几个经典模型.45 窃贼在偷东西时发出这样的信号:如果谁窃贼在偷东西时发出这样的信号:如果谁反抗,将殴打谁。乘客想,窃贼的威胁是可反抗,将殴打谁。乘客想,窃贼的威胁是可信的:因为如果个别乘客反抗,而窃贼不殴信的:因为如果个别乘客反抗,而窃贼不殴打该乘客的话,就会有更多的乘客抓窃贼,打该乘客的话,就会有更多的乘客抓窃贼,窃贼将有可能被抓,因此窃贼必然欧打反抗窃贼将有可能

42、被抓,因此窃贼必然欧打反抗的乘客。的乘客。乘客的策略及可能的支付为:反抗乘客的策略及可能的支付为:反抗,有可能被殴打甚至受伤;不反抗,无所得也有可能被殴打甚至受伤;不反抗,无所得也无所失。无所失。模型五、信号博弈模型五、信号博弈/不完全信息动态博弈不完全信息动态博弈博弈论的几个经典模型博弈论的几个经典模型.46乘客乘客反抗反抗不反抗不反抗偷东西偷东西窃贼窃贼窃贼窃贼殴打殴打不殴打不殴打乘客:受伤乘客:受伤窃贼:可能被抓,窃贼:可能被抓,可能逃脱可能逃脱乘客:无所得,乘客:无所得,无所失无所失窃贼:被抓窃贼:被抓窃贼窃贼殴打殴打不殴打不殴打乘客:受伤乘客:受伤窃贼:得到赃物窃贼:得到赃物乘客:无

43、所得,乘客:无所得,无所失无所失窃贼:得到赃物窃贼:得到赃物博弈论的几个经典模型博弈论的几个经典模型.47 对于乘客来说,窃贼的威胁是可信的,因对于乘客来说,窃贼的威胁是可信的,因而乘客的最优策略是而乘客的最优策略是“不反抗不反抗”;而对于窃贼;而对于窃贼来说,乘客来说,乘客“不反抗不反抗”下的下的“不殴打不殴打”策略为策略为最忧。最忧。这一博弈的结果是,窃贼偷东西时这一博弈的结果是,窃贼偷东西时“乘客不乘客不反抗,窃贼不敢打反抗,窃贼不敢打”,这是一,这是一“子精炼纳什均子精炼纳什均衡衡”。这样一种群体不反抗的结果将使社会风气这样一种群体不反抗的结果将使社会风气恶化,偷窃之风盛行。对个体来说

44、,虽然这一恶化,偷窃之风盛行。对个体来说,虽然这一次被偷的不是你次被偷的不是你,但下次你被偷的几率增加了。但下次你被偷的几率增加了。这使得我们都如同待宰的猴子,我们不知道什这使得我们都如同待宰的猴子,我们不知道什么时候轮到我们自己。这样,我们每个人的处么时候轮到我们自己。这样,我们每个人的处境比以前更差。境比以前更差。模型五、信号博弈模型五、信号博弈/不完全信息动态博弈不完全信息动态博弈博弈论的几个经典模型博弈论的几个经典模型.48如何从这种困境中摆脱出来?如何从这种困境中摆脱出来?我们看到,使乘客采取我们看到,使乘客采取“反抗反抗”策略,而非策略,而非“不反抗不反抗”策略在于加大采取策略在于

45、加大采取“反抗反抗”策略策略的获益,而减少不反抗的获益。当的获益,而减少不反抗的获益。当“反抗反抗”策略下的获益大于策略下的获益大于“不反抗不反抗”策略下的获益策略下的获益时,乘客就会采取时,乘客就会采取“反抗反抗”的策略。的策略。加大道德宣传,培养人的道德感可以解加大道德宣传,培养人的道德感可以解决这个囚徒困境。决这个囚徒困境。模型五、信号博弈模型五、信号博弈/不完全信息动态博弈不完全信息动态博弈博弈论的几个经典模型博弈论的几个经典模型.49乘客乘客反抗反抗不反抗不反抗偷东西偷东西窃贼窃贼窃贼窃贼殴打殴打不殴打不殴打乘客:受伤乘客:受伤,但没有但没有 道德满足感道德满足感窃贼:可能被抓,窃贼

46、:可能被抓,可能逃脱可能逃脱乘客:没有受伤乘客:没有受伤 并有道德并有道德 满足感满足感窃贼:被抓窃贼:被抓窃贼窃贼殴打殴打不殴打不殴打乘客:受伤乘客:受伤,并有并有 道德耻辱感道德耻辱感窃贼:得到赃物窃贼:得到赃物乘客:道德耻乘客:道德耻 辱感辱感窃贼:得到赃物窃贼:得到赃物上述博弈过程为:上述博弈过程为:博弈论的几个经典模型博弈论的几个经典模型.50 这样,当小偷偷东西时,尽管乘客认为窃这样,当小偷偷东西时,尽管乘客认为窃贼的威胁是可信的,但是如果乘客是道德感强贼的威胁是可信的,但是如果乘客是道德感强的人的人,那么博弈结果是那么博弈结果是“乘客反抗,小偷殴打乘客反抗,小偷殴打”,从而小偷有

47、可能被抓住,这也是一从而小偷有可能被抓住,这也是一“子精炼纳子精炼纳什均衡什均衡”。博弈论对不合作的博弈结果的预测是令人博弈论对不合作的博弈结果的预测是令人悲哀的。但是,从这个例子我们看到,道德就悲哀的。但是,从这个例子我们看到,道德就是由群体实施的对所谓是由群体实施的对所谓“非道德非道德”的行为进行的行为进行非强制性的惩罚机制,而法律及实施法律的国非强制性的惩罚机制,而法律及实施法律的国家的形成与改进就是建立一个对所谓家的形成与改进就是建立一个对所谓“违法行违法行为为”实施的中心惩罚机制。实施的中心惩罚机制。*精炼贝叶斯纳什均衡;混同均衡;分离均衡精炼贝叶斯纳什均衡;混同均衡;分离均衡模型五

48、、信号博弈模型五、信号博弈/不完全信息动态博弈不完全信息动态博弈博弈论的几个经典模型博弈论的几个经典模型.51 哪种策略更能赢哪种策略更能赢?假定我们的社会已经形成约束行动者的道德假定我们的社会已经形成约束行动者的道德规范。如果对不道德的行为不能产生即时的规范。如果对不道德的行为不能产生即时的惩罚,不道德的行为在社会中往往能给行为惩罚,不道德的行为在社会中往往能给行为者带来好处。这表现在一次性的非合作的博者带来好处。这表现在一次性的非合作的博弈中弈中,行为者理性地选取对自己有利的行动。行为者理性地选取对自己有利的行动。但是,如果存在重复博弈,参与者之间对不但是,如果存在重复博弈,参与者之间对不

49、合作行为就会形成惩罚机制。合作行为就会形成惩罚机制。对囚徒困境进行无限次的重复博弈,什对囚徒困境进行无限次的重复博弈,什么样的策略会赢么样的策略会赢?模型六、有效工资率模型六、有效工资率/重复博弈重复博弈 博弈论的几个经典模型博弈论的几个经典模型.52 这里涉及参与者以什么样的态度对待对这里涉及参与者以什么样的态度对待对方的不合作策略。在博弈论里,有两个著名方的不合作策略。在博弈论里,有两个著名的策略。的策略。如果一方采取不合作的策略另一方随即也如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略,采取不合作策略并且永远采取不合作策略,在博弈论里面称之为触发策略,或称冷酷策

50、在博弈论里面称之为触发策略,或称冷酷策略,英文叫略,英文叫trigger strategytrigger strategy。模型六、有效工资率模型六、有效工资率/重复博弈重复博弈 乙乙 甲甲不合作不合作合作合作不合作不合作(1(1,1)1)(4(4,0)0)合作合作(0(0,4)4)(2(2,2)2)博弈论的几个经典模型博弈论的几个经典模型.53 如果对方知道你的策略是触发策略,那如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取触发

51、策略,那的困境。因此,只要有人采取触发策略,那么双方均愿意采取合作策略。但是这个策略么双方均愿意采取合作策略。但是这个策略面临着这样一个问题:如果双方存在误解,面临着这样一个问题:如果双方存在误解,或者由于一方发生选择性的错误,这个错误或者由于一方发生选择性的错误,这个错误是无意的,那么结果将是双方均采取不合作是无意的,那么结果将是双方均采取不合作的策略。也就是说,这种策略不给对方一个的策略。也就是说,这种策略不给对方一个改正错误或解释错误的机会。改正错误或解释错误的机会。模型六、有效工资率模型六、有效工资率/重复博弈重复博弈 博弈论的几个经典模型博弈论的几个经典模型.54 第二种策略是,若你

52、采取不合作策略,第二种策略是,若你采取不合作策略,我也采取不合作策略,但是如果你采取了合我也采取不合作策略,但是如果你采取了合作策略,我也采取合作策略。这叫作策略,我也采取合作策略。这叫“一报还一报还一报一报”策略,或者称之为策略,或者称之为“针锋相对针锋相对”,英,英文叫文叫tit-for-tattit-for-tat。美国密执安大学的罗伯特。美国密执安大学的罗伯特埃埃克斯罗德克斯罗德(Robert Axerold)(Robert Axerold)主持了一次计算机比主持了一次计算机比赛,看谁写出来的程序能够赢。参加者有政赛,看谁写出来的程序能够赢。参加者有政治学家、数学家、经济学家、社会学家

53、,他治学家、数学家、经济学家、社会学家,他们都详细研究过囚徒困境。获胜者是加拿大们都详细研究过囚徒困境。获胜者是加拿大多伦多大学的拉波波特写出的多伦多大学的拉波波特写出的tit-for-tattit-for-tat策略。策略。这个程序非常简单:第一步采取合作,接着这个程序非常简单:第一步采取合作,接着对方采取什么策略,他便跟着做什么。对方采取什么策略,他便跟着做什么。模型六、有效工资率模型六、有效工资率/重复博弈重复博弈 博弈论的几个经典模型博弈论的几个经典模型.55 当然有多种策略,如对方采取了不合作当然有多种策略,如对方采取了不合作,但自己永远采取合作策略,这个策略可以叫但自己永远采取合作

54、策略,这个策略可以叫做做“以德报怨以德报怨”策略。这个策略对行动者最策略。这个策略对行动者最为不利,因为对方知道你采取这种策略,他为不利,因为对方知道你采取这种策略,他会永远采取不合作的策略,因而理性的人是会永远采取不合作的策略,因而理性的人是不会采取这种不会采取这种“以德报怨以德报怨”策略的。然而,策略的。然而,极端道德的人是超越理性的限制的极端道德的人是超越理性的限制的,此时他会此时他会采取采取“以德报怨以德报怨”策略。佛说:策略。佛说:“我不入地我不入地狱狱,谁入地狱?谁入地狱?”基督说:基督说:“爱你的敌人。爱你的敌人。”他们爱一切人而不会计算他爱的行动会给他他们爱一切人而不会计算他爱

55、的行动会给他带来利益或灾难,而是希望他的行动感化众带来利益或灾难,而是希望他的行动感化众生。生。模型六、有效工资率模型六、有效工资率/重复博弈重复博弈 博弈论的几个经典模型博弈论的几个经典模型.56 如果是有限次的囚徒困境,那么情况就如果是有限次的囚徒困境,那么情况就不同于上述无限次的囚徒困境的重复博弈。不同于上述无限次的囚徒困境的重复博弈。当临近博弈的终点时,采取不合作策略的可当临近博弈的终点时,采取不合作策略的可能性加大,如果参与人以前的所有策略均为能性加大,如果参与人以前的所有策略均为合作策略,并且被告知下一次博弈是最后一合作策略,并且被告知下一次博弈是最后一次,那么双方肯定采取不合作的

56、策略。次,那么双方肯定采取不合作的策略。这可以解释许多商业行为。一次性的买卖这可以解释许多商业行为。一次性的买卖往往发生在双方以后不再有买卖机会的时候往往发生在双方以后不再有买卖机会的时候,尽量谋取高利并且带欺骗性是其特点。而靠尽量谋取高利并且带欺骗性是其特点。而靠“熟客熟客”、“回头客回头客”便是通过薄利行为使便是通过薄利行为使得双方能继续合作下去。得双方能继续合作下去。模型六、有效工资率模型六、有效工资率/重复博弈重复博弈 博弈论的几个经典模型博弈论的几个经典模型.57 非合作博弈理论把存在于如银行业经营、非合作博弈理论把存在于如银行业经营、国际融资选择、商业周期出现、社会习俗形成国际融资

57、选择、商业周期出现、社会习俗形成和和中介机构出现及制度设计等各经济领域的协中介机构出现及制度设计等各经济领域的协调问题模型化为协调博弈,存在多个严格纳什调问题模型化为协调博弈,存在多个严格纳什均衡是这类博弈根本特点均衡是这类博弈根本特点,协调博弈成为了继囚协调博弈成为了继囚徒困境博弈之后又一被广泛研究的博弈类型。徒困境博弈之后又一被广泛研究的博弈类型。多重均衡是对传统经济理论的一个挑战,也是多重均衡是对传统经济理论的一个挑战,也是非合作博弈理论致命之所在,为寻找解决协调非合作博弈理论致命之所在,为寻找解决协调问题的方法,学者们从理论上对协调博弈进行问题的方法,学者们从理论上对协调博弈进行了广泛

58、而深入的探讨。了广泛而深入的探讨。协调博弈理论研究有助于解决非合作博弈协调博弈理论研究有助于解决非合作博弈的多重均衡问题,在近十几年成了为学术界关的多重均衡问题,在近十几年成了为学术界关注的焦点。注的焦点。模型七、价格竞争博弈模型七、价格竞争博弈/协调博弈协调博弈博弈论的几个经典模型博弈论的几个经典模型.58 对称协调博弈是指无角色区分的参与之间对称协调博弈是指无角色区分的参与之间进行的协调博弈,它表现在支付函数的对称进行的协调博弈,它表现在支付函数的对称上,策略集是一样的。从形式上看:对称协上,策略集是一样的。从形式上看:对称协调博弈就是博弈支付矩阵主对角线上的元素调博弈就是博弈支付矩阵主对

59、角线上的元素都是纳什均衡的博弈。协调博弈的均衡选择都是纳什均衡的博弈。协调博弈的均衡选择并不涉及到激励问题而依赖于参与人之间对并不涉及到激励问题而依赖于参与人之间对博弈如何进行有充分相似的信念。正是由于博弈如何进行有充分相似的信念。正是由于信念形成是一个相对复杂的过程,所以对协信念形成是一个相对复杂的过程,所以对协调博弈均衡问题的研究也就显得非常复杂调博弈均衡问题的研究也就显得非常复杂,不不同的信念形成过程动态就会产生不同的均衡同的信念形成过程动态就会产生不同的均衡。模型七、价格竞争博弈模型七、价格竞争博弈/协调博弈协调博弈博弈论的几个经典模型博弈论的几个经典模型.59 对称协调博弈是一类特殊

60、的博弈,均衡对称协调博弈是一类特殊的博弈,均衡选择不仅要满足预期的一致性,而且要满足选择不仅要满足预期的一致性,而且要满足行动的一致性,因此,博弈结果必定收敛到行动的一致性,因此,博弈结果必定收敛到纯策略而非混合策略纳什均衡。更为重要的纯策略而非混合策略纳什均衡。更为重要的是,协调博弈还有策略互补性及支付外溢性是,协调博弈还有策略互补性及支付外溢性这两个重要特征,它是分析协调博弈多重均这两个重要特征,它是分析协调博弈多重均衡问题的出发点。衡问题的出发点。对称协调博弈分成三类:对称协调博弈分成三类:支付占优与风险占优不一致;支付占优与风险占优不一致;支付占优与风险占优一致(严格纳什均衡可进支付占

61、优与风险占优一致(严格纳什均衡可进行帕累托排序均衡)行帕累托排序均衡);无占优性可比的协调博弈。无占优性可比的协调博弈。模型七、价格竞争博弈模型七、价格竞争博弈/协调博弈协调博弈博弈论的几个经典模型博弈论的几个经典模型.60 支付占优与风险占优不一致的协调博弈支付占优与风险占优不一致的协调博弈 这类博弈最典型的例子就是猎鹿博弈。有两这类博弈最典型的例子就是猎鹿博弈。有两个打猎人,他们可以合作去猎鹿也可以单独个打猎人,他们可以合作去猎鹿也可以单独去猎兔,如果合作猎鹿,那么两个都可以分去猎兔,如果合作猎鹿,那么两个都可以分得得4 4个单位的支付;如果一个人去猎鹿而另一个单位的支付;如果一个人去猎鹿

62、而另一个人去猎兔,那么前者支付为个人去猎兔,那么前者支付为0 0(因为猎鹿需(因为猎鹿需要两个人合作可以成功)后者的支付为要两个人合作可以成功)后者的支付为2 2;如;如果两个人不合作都去猎兔,那么他们都可以果两个人不合作都去猎兔,那么他们都可以得到得到3 3单位的支付。单位的支付。模型七、价格竞争博弈模型七、价格竞争博弈/协调博弈协调博弈猎鹿猎鹿猎兔猎兔 猎鹿猎鹿4 4,4 40 0,2 2 猎兔猎兔2 2,0 03 3,3 3 博弈论的几个经典模型博弈论的几个经典模型.61 显然该博弈有两个纯策略严格纳什均衡显然该博弈有两个纯策略严格纳什均衡,即要么两个合作猎鹿,要么两人去猎兔与一即要么两

63、个合作猎鹿,要么两人去猎兔与一个 混 合 策 略 纳 什 均 衡。按个 混 合 策 略 纳 什 均 衡。按 H a r s a y i a n d H a r s a y i a n d Selten(1988)Selten(1988)的定义,纯策略猎鹿是支付占优纳的定义,纯策略猎鹿是支付占优纳什均衡、纯策略猎兔是风险占优纳什均衡。什均衡、纯策略猎兔是风险占优纳什均衡。猎兔策略是一个保险策略,而猎鹿博弈则是猎兔策略是一个保险策略,而猎鹿博弈则是一个帕累托效率策略,但行动的不确定性使一个帕累托效率策略,但行动的不确定性使猎鹿策略具有较大的风险。因此,均衡选择猎鹿策略具有较大的风险。因此,均衡选择

64、取决于参与人对风险的态度。取决于参与人对风险的态度。模型七、价格竞争博弈模型七、价格竞争博弈/协调博弈协调博弈博弈论的几个经典模型博弈论的几个经典模型.62 由于存在两个纯策略纳什均衡,现实中由于存在两个纯策略纳什均衡,现实中究竟哪个均衡会出现就是一个问题,这是多究竟哪个均衡会出现就是一个问题,这是多重纳什均衡下的困境。重纳什均衡下的困境。通过比较通过比较“猎鹿博弈猎鹿博弈”,明显的事实是明显的事实是:两两人一起去猎鹿的好处比各自打兔的好处要大人一起去猎鹿的好处比各自打兔的好处要大得多。用一个经济学术语来说得多。用一个经济学术语来说,两人起去人头两人起去人头猎鹿比各自去打兔更符合帕累托最优原则

65、。猎鹿比各自去打兔更符合帕累托最优原则。模型七、价格竞争博弈模型七、价格竞争博弈/协调博弈协调博弈博弈论的几个经典模型博弈论的几个经典模型.63这一案例中有一个隐含的假设:这一案例中有一个隐含的假设:两个猎人的能力和贡献差不多,所以双方均两个猎人的能力和贡献差不多,所以双方均分猎物。但是实际情况显然不会这么简单。分猎物。但是实际情况显然不会这么简单。如果一个猎人的能力强、贡献大,他就会要如果一个猎人的能力强、贡献大,他就会要求得到较大的一份求得到较大的一份,这样分配的结果就可能是这样分配的结果就可能是(14,614,6)或()或(15,515,5)。但有一点是肯定的,能)。但有一点是肯定的,能

66、力较差的猎人的所得,至少要多于他独自打力较差的猎人的所得,至少要多于他独自打猎的所获,否则他就没有合作的动机。假设猎的所获,否则他就没有合作的动机。假设猎人甲在猎鹿过程中几乎承担了全部的工作猎人甲在猎鹿过程中几乎承担了全部的工作,他据此要求最后的分配结果是(他据此要求最后的分配结果是(17,317,3)。这时)。这时模型七、价格竞争博弈模型七、价格竞争博弈/协调博弈协调博弈博弈论的几个经典模型博弈论的几个经典模型.64相对于分别猎兔的收益(相对于分别猎兔的收益(4,44,4),合作猎鹿就不),合作猎鹿就不具有帕累托优势。虽然这样具有帕累托优势。虽然这样1717比比4 4多,改善了多,改善了很多,很多,17+317+3也比也比4+44+4大得多,猎人总体收益也大得多,猎人总体收益也改善了很多,但是由于改善了很多,但是由于3 3比比4 4小,猎人乙的境遇小,猎人乙的境遇不仅没有改善,反而恶化。也就是说他的收不仅没有改善,反而恶化。也就是说他的收益受到了损害。所以站在乙的立场,(益受到了损害。所以站在乙的立场,(17,317,3)没有(没有(4,44,4)好。如果合作结果是这样,那么)好。如

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!