综合I类与II类理性人的博弈策略(doc 16)

上传人:时间****91 文档编号:130403632 上传时间:2022-08-04 格式:DOC 页数:15 大小:30KB
收藏 版权申诉 举报 下载
综合I类与II类理性人的博弈策略(doc 16)_第1页
第1页 / 共15页
综合I类与II类理性人的博弈策略(doc 16)_第2页
第2页 / 共15页
综合I类与II类理性人的博弈策略(doc 16)_第3页
第3页 / 共15页
资源描述:

《综合I类与II类理性人的博弈策略(doc 16)》由会员分享,可在线阅读,更多相关《综合I类与II类理性人的博弈策略(doc 16)(15页珍藏版)》请在装配图网上搜索。

1、综合I类与II类理性人的博弈方略 两人零和博弈作为较归整的形式,在博弈论的初期研究中已经得到的进一步讨论。本文引入了类理性与类理性的概念,觉得现实博弈中的参与人往往既也许从类理性的角度采用战略,也也许是从类理性人的角度出发,因此,构造了一种综合了类和类理性特性的支付矩阵,通过对某些常用的非零和博弈实例进行讨论,觉得这一模型可以解决战略选择的不拟定性问题。但本文没有对此进行严格的数学证明。在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特性,即总是谋求自身的最大化利益,选择能使个人利益最大化的方略。在计算收益的时候,使用的是个人所得。这是一种“绝对量”,而现实中,也存在着此外一

2、种状况,也就是参与者之间除了考虑自己的所得之外,也很关怀对方的所得,并比较互相间的差别,采用使“相对”所得最大化的方略。我们不妨把以追求相对所得最大化的行为人称为II类理性人,并从博弈论的角度对她们的行为模式进行研究。具有II类理性特性的现象在诸多方面均有存在。例如,我们在人际交往中的确会遇到某些“损人利己”的人,也会见到“损人不利己”的人,从我们观点看来,她们是非理性的,但是进行换位思考就会发现,其实她们的行事原则是相对来说,总要让自己占便宜或者自己吃得亏比对方少,至于别人与否会吃亏,不是她们考虑的因素,这也是一种“理性”行为,也有出于心理层面的考虑,觉得自己所得相对较少或者自己损失较大是一

3、种不公平,并从自己的角度出发进行方略选择。在剧烈的市场角逐中,竞争双方在短期内有时会不计代价地采用大出血的方略而欲先致对手于死地,但愿对手先被裁减而自己会坚持到最后。如果做不到这点,也要最大限度地削弱对手力量,使其一蹶不振而不会对自己再构成威胁。这种商场竞争,并盼望自己能笑到最后的思维,也是“理性”的。有研究表白,国际关系中这样的II类理性的例子更不少见。这些虽然是比较极端的例子,现实生活中,更多的也许是,每个人或组织都会考虑自己的所得,并盼望自己的所得比别人的大。核心是对两种所得在考虑时的权数是随状况不同而变化的。如果否认在方略选择中的II类理性因素,也许会对某些现象无法解释。尽管从道德角度

4、讲不值得倡导,并且从价值评判上总是受到谴责,但作为一种存在的现象,仍然有必要加以研究。但本文从II类理性个体的博弈战略开始,并过渡到一种综合了I类和II类理性行为的博弈模型,对例中设计的参与人的战略选择,只进行经济学分析而不做道义上的衡量。当博弈参与者是II类理性人时,此时收益矩阵的取值有一定的规律。假设两个参与人甲和乙都是II类理性人时,对比在I类理性的得益矩阵(图)乙S1 S2甲 S1 (m1,n1) (m2,n2)S2 (m3,n3) (m4,n4)图类理性参与人收益矩阵类理性参与人的得益矩阵如下图所示:乙S1 S2甲 S1 (m1-n1,n1-m1) (m2-n2,n2-m2)S2 (

5、m3-n3,n3-m3) (m4-n4,n4-m4)图类理性参与人收益矩阵很明显,在类理性参与人进行的博弈里,在每一种战略组合下,双方的得益之和必为零,此时的博弈具有零和的性质。这就是初期博弈论中重点研究的二人零和博弈的情形,在191930年间,作为绝对竞争的形式,零和博弈被觉得是博弈理论中的重要形态得到了进一步的研究。并且对零和博弈的研究成果成为了现代博弈理论中诸多新理论的基本概念。作为一种练习,我们把常用博弈模型改为零和博弈情形,来看相应的成果会是如何的。一般觉得,零和博弈是一种常和博弈,而最普遍意义下的博弈情形是非常和的。例1囚犯困境甲,乙涉嫌同谋犯罪,分别在两个房间被提审。提审官预先向

6、两人交代政策:如果她们都承认犯罪事实,各判刑;如果两人都否认,双方都无罪释放;如果一方认罪一方抵赖,认罪方获500元奖励,抵赖方被判。在非零和博弈情形下的支付矩阵如下:乙承认 抵赖甲 承认 (-10,-10) (5,-15)抵赖 (-15,5) (0,0)图3纳什均衡方略是(承认,承认),如果甲乙两人是II类理性人,她们的相应支付矩阵就变成了:乙承认抵赖甲 承认 (0,0) (20,-20)抵赖 (-20,20) (0,0)图4可以看出,纳什均衡方略还是(承认,承认)。例2春节前夕,某小镇上两个商铺甲和乙同步看到一种赚钱机会:去城里贩一批鞭炮回来卖,购货款加上运送费共5000元,如果没有竞争对

7、手,这批货在小镇上能卖6000元;但如果另一家商铺也同步在小镇上卖鞭炮,价格下跌使得这批鞭炮只能卖4000元。对于甲乙都是I类理性人而言,有支付矩阵:乙进货 不进货甲 进货 (-1000,-1000) (1000,0)不进货 (0,1000) (0,0)图5(不进货,进货)和(进货,不进货)为纳什均衡方略。但是问题在于,甲乙双方同步行动,而互相不懂得对方采用的行动。如果甲乙都是II类理性人,那么状况会变成:乙进货 不进货甲 进货 (0,0) (1000,-1000)不进货 (-1000,1000) (0,0)图6此时的纳什均衡方略就是(进货,进货)。例3利己与利她甲乙作为I类理性人,其支付矩阵

8、为乙利己 利她甲 利己 (1,1) (4,0)利她 (0,4) (3,3)图7纳什均衡是(利己,利己);甲乙作为II类理性人,其支付矩阵转化为:乙利己 利她甲 利己 (0,0) (4,-4)利她 (-4,4) (0,0)图8纳什均衡仍然是(利己,利己)。例4智猪博弈一头大猪和一头小猪被关在同一种猪圈里。猪圈的一头安装着一种特制的按键,另一头安装着一种食槽。但一头猪按下按键时,会有10单位的食物进入槽中,但按键的猪会付出2单位的成本;如果大猪先到食槽,则小猪只能吃到1单位的残羹剩饭;但若小猪先到的话,则它能吃到4单位的食物。若两猪同步到,则小猪可吃到3单位的食物。如果按照I类理性,有支付矩阵:小

9、猪按键 等待大猪 按键 (5,1) (4,4)等待 (9,-1) (0,0)图9纳什均衡方略是(按键,等待)。在II类理性下,重写支付矩阵为:小猪按键 等待大猪 按键 (4,-4) (0,0)等待 (10,-10) (0,0)图10纳什均衡是(按键,等待)和(等待,等待)。有趣的是,此时小猪一定会选择等待(占优战略),而大猪无论怎么做,都是一无所获!最后成果是两头猪都会饿死。在这种状况下,两头猪的结局似乎和“布里丹的饥饿的驴”有共同点,后者由于面对同样两堆干草不能做出选择而饿死。在智猪博弈里,小猪觉得自己的成果只能是损失或者既无损失又无所得,这时它会选择后者,而将责任推给大猪。现实中,不大也许

10、浮现两猪都饿死的成果,由于大猪最后会明白,与其被饿死还不如去按键,此时自己会得到4单位的食物;而小猪也会由于大猪作出这样的选择,而同样得到4单位的食物。例5性别战两个恋人,男方想看拳击,女方想看芭蕾。如果需要的话,她们会牺牲自己的爱好而迁就对方。有下面的支付矩阵:女拳击 芭蕾男 拳击 (2,1) (0,0)芭蕾 (0,0) (1,2)图11纳什均衡是(拳击,拳击)和(芭蕾,芭蕾)。将支付矩阵做个变换:女拳击 芭蕾男 拳击 (1,-1) (0,0)芭蕾 (0,0) (-1,1)图12那么,(拳击,芭蕾)就是纳什均衡方略。例6斗鸡博弈两个人举着火棍从独木桥两端向中间迈进,每个人均有两种战略:迈进或

11、退下阵来。若两人都继续迈进,则两败俱伤;如果一方迈进,另一方退下来,迈进者获得胜利,退后者丢了面子;若两人都退了下来,则都丢了面子。支付矩阵如下:A进 退B 进 (-3,-3) (2,0)退 (0,2) (0,0)图13纳什均衡方略是(进,退)和(退,进);按II类理性对支付矩阵进行变换后得:A进 退B 进 (0,0) (2,-2)退 (-2,2) (0,0)图14纳什均衡方略是(进,进)。在上面的讨论中,可以看到,在例2中,对于I类理性参与人,(不进货,进货)和(进货,不进货)都是纳什均衡方略,采用哪个战略要取决于对方的行动,在一次静态博弈中是很难在行动之初就理解到对方的战略的,因此存在选择

12、上的不拟定性。在智猪博弈中,对于II类理性参与人而言,不能根据支付矩阵决定出大猪的战略,如何才干避免在选择时浮现这样的不拟定状态呢?有必要考虑某种混合战略。一般来讲,博弈的每个参与者在某些时间会按I类理性人行为模式行事,而有时又会采用II类理性人模式行事。不妨将这种组合当作是决定于概率p和q。这时候,假设甲遵循I类理性的概率是p,那么她是II类理性人的概率就是1-p,乙遵循I类理性的概率是q,相应她是II类理性人的概率是1-q。这时我们也可以构造出一种混合战略,得到支付矩阵:乙S1 S2甲 S1 m1-(1-p)n1,n1-(1-q)m1 m2-(1-p)n2,n2-(1-q)m2S2 m3-

13、(1-p)n3,n3-(1-q)m3 m4-(1-p)n4,n4-(1-q)m4图15对于类理性可以看作p=1,q=1时的上述混合战略的一种特例;而类理性相应p=0,q=0的状况。在现实中,还也许浮现另一种状况,也就是甲乙两个参与者中,一方是I类理性的,而另一方是II类理性的,为以便起见,我们假设甲是I类理性人,乙为II类理性人,那么支付矩阵具有下面一般形式:乙S1 S2甲 S1 (m1,n1-m1) (m2,n2-m2)S2 (m3,n3-m3) (m4,n4-m4)图16这其实是在p=1,q=0时,混合战略的一种特殊状况。对于上述常用博弈案例,在这种状况下进行演绎,相应也会得到某些有趣的成

14、果。例1囚犯困境乙承认 抵赖甲 承认 (-10,0) (5,-20)抵赖 (-15,20) (0,0)图17纳什均衡方略仍是(承认,承认);例2进货与不进货乙进货 不进货甲 进货 (-1000,0) (1000,-1000)不进货 (0,1000) (0,0)图18纳什均衡方略是(不进货,进货)。例3利己与利她乙利己 利她甲 利己 (1,0) (4,-4)利她 (0,4) (3,0)图19纳什均衡方略仍是(利己,利己)。例4智猪博弈小猪按键 等待大猪 按键 (5,-4) (4,0)等待 (9,-10) (0,0)图20纳什均衡方略是(按键,等待)。例5性别战女拳击 芭蕾男 拳击 (2,-1)

15、(0,0)芭蕾 (0,0) (1,1)图21纳什均衡方略是(芭蕾,芭蕾)。例6斗鸡博弈A进 退B 进 (-3,0) (2,-2)退 (0,2) (0,0)图22纳什均衡方略是(退,进)可以发现,在多数状况下,II类理性人的成果都好于I类理性人。目前使用如图15的混合战略,看看在例2,性别战,斗鸡博弈和智猪博弈中,战略的选择状况:在例2中,为以便起见,将原支付矩阵先转换成:乙进货 不进货甲 进货 (-1,-1) (1,0)不进货 (0,1) (0,0)图再设甲乙为类理性的概率为p,q:乙进货 不进货甲 进货 (-p,-q) (1,q-1)不进货 (p-1,1) (0,0)图可以看到(进货,不进货

16、)是一种也许的均衡方略,但若要使其成为唯一的纳什均衡,还应当规定q-1-q,即q1/2。同理,(不进货,进货)要在p1/2才干成为唯一的纳什均衡。可以理解为,当甲更象是类理性人是,此时乙如果结识到这一点,就应当采用进货的战略来应对;而当乙更象类理性人时,此时如果甲结识到这一点,应当采用进货战略。这样,就给出了一种选择的指南,避免选择不拟定性问题的核心在于与否可以把握好参与方的理性倾向。例4的情形与此类似。而斗鸡博弈中,相应地规定p0.4,q0.4即可拟定出应当采用的唯一的纳什均衡方略。再看智猪博弈,得到支付矩阵为小猪按键 等待大猪 按键 (4+p,5q-4) (4p,4q)等待 (10-p,-

17、10+9q) (0,0)图可以看出,大猪按键是占优战略,那么很容易得出(按键,等待)就是唯一的纳什均衡了。同样可以很圆满地解决选择的不拟定性问题。以上通过实例,可以看出这里的两人一次静态博弈的混合战略,可以解决纳什均衡方略选择的不拟定性问题,但讨论是从归纳的意义上,没有从理论上严格地证明这一点。以上就是我们平常生活中,能遇到的三种基本的组合。p和q还可以取间的任何数,在理解上,我们觉得任何人对收益的大小的判断都取决于她个人的效用函数,而效用函数自身,是与其看待或看待事物的观点以及客观条件密切有关的。在复杂的现实环境下,对每一次静态博弈,参与人更有也许采用的是一种综合的效用观点,如果在持续多次博弈中,参与人每次均有机会调节p和q的大小,有必要对这样的综合的理性行为进行更进一步的探讨。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!