概述研究背景及问题的提出

上传人:积*** 文档编号:151811813 上传时间:2022-09-14 格式:DOC 页数:11 大小:287.50KB
收藏 版权申诉 举报 下载
概述研究背景及问题的提出_第1页
第1页 / 共11页
概述研究背景及问题的提出_第2页
第2页 / 共11页
概述研究背景及问题的提出_第3页
第3页 / 共11页
资源描述:

《概述研究背景及问题的提出》由会员分享,可在线阅读,更多相关《概述研究背景及问题的提出(11页珍藏版)》请在装配图网上搜索。

1、离散条件下对称协调博弈随机稳定性研究本项目得到广东省自然科学基金支持,项目号:05300601。张良桥 作者简介:张良桥,男,1968年11月生,湖南祁阳人,经济学副教授,中山大学岭南学院04级博士研究生,研究方向:经济模型博弈论与信息经济学,。中山大学岭南学院04博,广东 广州 Lingnan college zhongshan University, Guangzhou Guangdong 摘要:许多学者研究过离散条件下对称协调博弈的随机稳定性,但他们的研究要么缺乏实用性、要么脱离现实,大大降低了模型的可用性。结合社会学、心理学等研究成果及已有研究的基础,提出了新模型来系统地研究离散条件下

2、对称协调博弈的随机稳定性,新模型增加了可操作性与实用性,便于分析演化中间状态与逆转成本的具体数量关系,能够更加容易地解释现实中许多现象。关键词:对称协调博弈;随机稳定状态;逆转成本;演化时间On the stochastic stability of symmetry coordination game under discrete stateAbstract:Many researchers have done researches on stochastic stability of the symmetric coordination game under the discrete co

3、ndition. However, given to the lack of the practicability and reality, the usability of the model suggested in these former researches have been greatly reduced. Integrating the research findings in the field of sociology and psychology and the former research foundation, the paper presents a new wi

4、th aims to systematically analyze stochastic stability of symmetric coordination game (2x2) under the divergence condition. With increased maneuverability and practicability, the model is convenient for analyzing and formulating the specific quantitative relation between state and adverse cost. It c

5、an also assist to explain many phenomena in reality in an easier way.Key words: symmetry coordination game; stochastic stable state; adverse cost; evolutionary time 引言均衡选择问题是令博弈论理论家苦恼但又必须面对的问题,非合作博弈理论在处理多重纳什均衡(Nash 1951)1特别是协调博弈中严格纳什均衡之间的选择问题时,碰到了难以克服的困难,正如Ken Binmore在Weibull(1995)2进化博弈理论一书的序言中指出:“H

6、owever different game theorists proposed so many different rationality definitions the available set of refinements of Nash equilibrium became embarrassingly large, Eventually almost any Nash equilibrium could be justified in terms of someone or others refinement”;也如Larry Samuelson(1993)3所说的“Differe

7、nt refinements yield different predictions, transforming the problem of multiple equilibrium into a problem of multiple refinements”。显然,在理性框架下难以进一步研究均衡选择问题。十九世纪七十年代生态学、实验经济学等学科的快速发展,为进化博弈理论的产生奠定了理论基础,特别是Maynard Smith and Price (1973)4提出了进化稳定策略这一基本概念以后,进化博弈理论慢慢地进入到经济学家的工具箱之中,成了一种主要的研究方法。进化博弈理论并不对参与人强

8、加满足一致性的理性要求,而认为参与人行为是适应性的,即参与人在面对奈特 古典经济学及非合作博弈理论在处理不确定性问题时,总是假定不确定性的因素有固定的概率分布,在此基础上,再根据数学期望进行相应的决策。与此不同,进化博弈理论在处理不确定性问题时,假定参与人的面对的是奈特不确定性,也就是不确定因素没有固定的概率分布,概率分布是随着时间的演化而变化的,参与人通过对奈特不确定性.不确定性条件下作出最优决策。同时,进化博弈理论在解释生态现象时获得的巨大成功引起了非合作博弈理论家的关注,特别在研究均衡选择时,进化博弈理论由于认为均衡是达到均衡过程的函数并把博弈过程纳入到模型当中,使之具有传统非合作博弈所

9、无法比拟的优越性。非合作博弈的均衡选择问题集中体现在协调博弈中,于是协调博弈是继囚徒困境博弈之后又一被广泛研究的博弈 研究囚徒困境的目的是为了研究有利益冲突的参与之间的合作问题;而研究协调博弈的目的是为了研究多重严格纳什均衡之间的选择问题。在研究协调博弈均衡选择问题时,进化博弈理论主要运用描述系统长期行为的随机稳定状态概念及Harsanyi, J. and Selten, R. (1988)5在考察博弈时提出的风险占优与支付占优两个标准。在已有研究的基础上,本文结合社会学、心理学等的研究成果对原有模型进行适当的改进,增加了模型的实用性及可驾驭性。一、随机稳定状态及风险占优与支付占优概念的提出如

10、果参与人知道博弈的行进方式,但不能确定其他参与人的策略选择,此时,不管其他参与人选择何种策略,每个参与人都会选择那些保障他能够得到最高的最小支付,这时最大最小策略均衡是合适的概念;如果博弈是参与人的共同知识并且最大最小策略均衡不是最好选择,这时纳什均衡策略比较合适的;然而,最大最小均衡与纳什均衡都是静态的概念,都是适应于描述理性人行为的工具,与现实相差较远。进化博弈理论基本均衡概念进化稳定策略(Evolutionary stable strategy, ESS)则纳入单次不重叠因素影响,在均衡思想中引入了局部动态性质,其缺陷就是没有把更为现实的随机因素影响纳入到模型之中,无法描述系统的全局性质

11、。Young(1990)6从统计意义上提出了一个更为现实的概念-随机稳定状态(Stochastic stable state, SSS),该概念纳入了随机影响因素,能够很好地描述系统长期均衡的稳定性。1.1 随机稳定状态概念的提出为了更好地理解随机稳定状态概念,我们先给出进化稳定策略的定义,为了把突变因素纳入到模型之中来解释生态演化系统,Maynard Smith and Price (1973)提出进化博弈理论中最基本的均衡概念进化稳定策略,说策略是进化稳定策略,如果对所有,(相当于突变策略)有:该条件等价于1: ;2:进化稳定策略概念要求突变因素是不连续且不重叠的,它只能描述在单个随机因素

12、影响下任何偏离均衡状态的行为都会随着时间的演化自动回复到原来的进化稳定状态,但却无法描述系统在吸引域之外的情形以,也不知道系统是如何进入到吸引域的。现实中,经济系统常常会受到来自突变和其他偶然事件的冲击,这些因素可能会对系统产生不可忽略的影响。Foster and Young(1990)认为,首先,原初ESS概念把影响系统的因素都看成是一个个孤立的事件,假定一个因素的影响消失以后,再考虑另一个因素对系统的影响,而在现实中系统常常会受到连续的随机冲击,尽管单个随机因素对动态系统的影响较少,但它们却可能对系统产生累积作用而定量地改变系统的稳定性,使得系统离开进化稳定状态,系统什么时候回复到当初的进

13、化稳定状态,依赖于动态过程的全局结构。其次,原初ESS定义是一个局部概念,在考虑随机冲击时就不能作为判断系统稳定性的标准;最后,由于系统的极限行为依赖于初始条件,同时在吸引子集合中只有一部分状态是随机稳定的,且随机稳定状态的选择还依赖于随机过程特定的结构,所以吸引子也不是描述随机系统的一个好的概念。于是Young(1990)提出了一个既不同于进化稳定概念也不同于吸引子的概念-随机稳定状态。一个状态P是随机稳定的,如果在长期中,随着随机因素影响的不断变少,系统几乎一定(nearly certain)不会离开P的任意少邻域,显然,随机稳定状态是通过概率来度量的。用数学语言来说:一个群体向量是随机稳

14、定的,如果随着随机影响极限密度对每一个小邻域赋予正概率即:,其中其中是当时的极限分布,表示随机因素对系统所产生的影响。该定义把各种随机影响因素都纳入到模型中,以系统到不同均衡状态的概率来度量最终的随机稳定性。求解随机稳定性时,一是保证系统存在常返状态 也就是回复状态,即系统离开它后会再次返回,在对称协调博弈中只要满足适当的条件就会严格纳什均衡都是常返状态,见Young(1993)定理1。;另一是保证系统会在不同的常返状态之间来回跳动。1.2 风险占优与支付占优标准的提出在研究对称协调博弈的随机稳定性时,一个重要标准就是Harsanyi and Selten(1988)在研究博弈时提出支付的风险

15、占优均衡与支付占优均衡 Monderer, D. and Shapley, L. S. (1996)7推广到更一般博弈的情况。选择标准。假设在对称协调博弈中,有纯策略纳什均衡A,B,说(A,A)是风险占优均衡,如果对所有其他纳什均衡(B,B),A都是的最优反应。即选择该策略A可以获得比以相等概率选择其他两个策略更高的支付。风险占优是贝叶斯分析在不确定性条件下从单人决策向非合作博弈理论中多人决策问题的扩展。在不确定性情况下,单人决策没有理由相信任何特定的先念信念会优于其他选择;然而,在非合作博弈中,每一个参与人都可以运用支付矩阵的共同知识来决定其他参与人可能选择一些行为而不选择其他行为,因此,每

16、一个人都可以推断出一些行为比另一些行为有更大风险。容易证明,风险占优均衡就是具有最大纳什积(Nash Product)的均衡。支付占优是基于集体理性的,一旦支付占优被定义于博弈论理性,那么在有唯一支付占优的协调博弈中,就可以立即得到理性参与人会选择帕累托效率均衡的结论。与此不同,如果没有明显的选择机制(如不存在合作),那么Harsanyi and Selten的依赖于参与人集体理性的方法就很困难了,非均衡的支付是至关重要的。基于个人理性标准的风险占优是解决一时期、同时行动且有多重均衡的非合作博弈中均衡选择问题的一个合适的机制。风险占优与支付占优概念的提出包涵非均衡路径上的支付对博弈长期均衡的影

17、响,事实上,通过分析我们可以看出,非均衡路径上的支付是通过影响博弈中常返状态 事实上,在对称协调博弈,严格纳什均衡是常返状态的条件是非常容易满足的(见Peyton Young 1993)。吸引域的宽度来影响长期均衡状态的。在现实中,所谓的迂回战役、曲线救国、旁敲侧击、游击战等都属于这种情况,因为正面方法无法使得博弈均衡发生改变,只有通过其他的非正面方法来使得系统常返状态的吸引域发生变化,进而改变博弈随机稳定状态。二、对称协调博弈随机稳定性研究的相关文献综述协调博弈主要解决参与人之间的行为预期问题,它之所以得到经济学的青睐,主要原因在于它应用的广泛性及均衡选择的理论意义。协调问题广泛地存在于经济

18、领域如银行业的经营、国际融资的选择、商业周期的出现、社会习俗的形成、制度设置的方式、中介机构的出现等等。解决协调问题实际就是解决协调博弈的多重均衡问题。多重均衡是对传统经济理论的一个挑战,当出现多重均衡时特别是多重严格纳什均衡时,基于理性的非合作博弈理论则无法给出令人满意的解释。生态理论的发展引起了经济学家的关注,博弈论理论家纷纷引入进化方法来解决协调博弈的均衡选择问题。目前,已有协调博弈均衡选择问题的研究主要沿着两条路线进行:一是实验经济学方向,实验研究一方面可以检验理论研究的成果,另一方面可以寻找影响博弈均衡的因素,为理论研究提供方向指导,减少研究的盲目性,有许多实验经济学家研究过协调博弈

19、的长期均衡问题并得到了许多有用的结论;二是理论研究方向,理论方面主要探讨协调博弈的长期均衡问题也就是随机稳定性研究并得出了许多有用的模型,这样模型都能够把系统向均衡演化的随机过程纳入到模型之中,从过程来描述均衡的演化。2.1 实验经济学相关研究成果运用实验方法来研究协调博弈均衡选择问题至少可以追溯到2005年诺贝尔经济学奖得主之一Schelling(1960)8。Schelling通过一系列的实验报告了对称协调博弈的均衡选择结果,他发现参与人常常通过焦点或者显著性来协调他们的行为。参与人的选择结果并不完全依赖于博弈支付,参与人可能通过与自己经验、文化、心理等联想而使一些均衡较之其他均衡更突出,

20、产生自动实施的预期并倾向于选择那些“唯一”的均衡;其次,博弈前的无成本、非约束、不可验证的交流有利于解决纯协调博弈的均衡选择问题,并且系统会收敛于帕累托效率均衡。现实中纯协调博弈的情况是很少见的,多数情况下,参与人的偏好不会完全一致,因而参与人之间会存在利益冲突(如性别战博弈),在这种情况下,需要通过如法律、指示牌等第三方提示而使得博弈收敛到特定的均衡。Schelling还研究了法律与焦点的关系,并认为法律除了通过其制裁功能改变博弈支付而影响参与人的行为以外,更重要的是由于其信息的公开性使得它具有焦点的功能而使个人行为更快地收敛到某一种习惯。另外,法律具有快速转变已经形成秩序的功能,但其有效性

21、取决于法律措施与内生偏好的互补程度。Schelling是较早研究行为协调问题的学者之一,他所得到的结论对以后的研究产生了较大的影响,成为后继研究的出发点。Van Huyck, Battailio and Beil (HBB,1990)9系统地研究了协调博弈的均衡选择问题,其目的是为了探讨以下两个问题:(1)在策略互动的博弈环境下,纳什均衡是否是一个好的预测;(2)当存在多个纳什均衡时,哪一个均衡最后会出现以及均衡的出现是否与博弈的某些特定的显著性有关。他们进行了两种试验:一是参与人进行随机匿名配对博弈,二是参与人可以自己选择博弈对手。结果发现,后者可以很快地达到支付占优均衡,而前者却很难达到此

22、结果;纳什均衡能够很好地预测被观察到的行为,这是不争的事实;另外他们在实验中发现参与人并不总是选择帕累托占优的均衡,多数情况下会选择风险占优均衡,该结果与一般认为帕累托均衡是一个自然的焦点的观点不一致,即协调失败可能会在实践中出现;最后,在实验中他们还证实了劣策略可能影响纳什均衡选择,因此在非合作博弈理论中的重复剔除严格劣策略的方法是值得商榷的。Sugden, et. al. 10通过实验发现参与人协调失败成本越大,犯错误的概率就越小这一与Myerson(1978)11一致的结论; Berninghaus and Van Huyck, Raymond Battalio and Richard

23、Bell(1991)12通过实验研究了平均意见协调博弈中参与人人数、支付占优、保障水平及历史事件的显著性等对均衡选择的影响;Russell Cooper et. al (1992)13研究了博弈前的廉价磋商对协调博弈中均衡选择的影响,得出博弈前的廉价磋商是影响协调博弈均衡选择的一个重要因素,同时也验证了博弈前的交流有利于参与人协调于支付占优状态;Siegfried K. Berninghaus, Karl-Martin Ehrhart(1998)14通过实验考察了参与人重复次数对协调博弈中均衡选择的影响,并且得到重复次数能够提高博弈协调于支付占优均衡可能性的结论。以上学者根据实验分别从不同的角

24、度研究了影响协调博弈中的均衡选择问题因素。从他们的研究中可以看出现实中影响参与人行为的因素是多方面的,博弈支付仅仅是其中之一,因此,考察协调博弈的均衡选择问题并不能一概而论,要较准确地描述参与人的行为就必须综合考虑影响参与人决策过程的各种因素。2.2 理论探讨方面的研究成果实验研究为了指导理论研究工作,实验的结果可以为理论探索提供一个明确的方向。实验经济学研究表明,影响系统达到均衡因素不仅包括博弈支付更重要的是包括确定性动态过程及其随机影响因素。博弈支付一般相对固定,因而较难改变;系统的确定性动态过程也是相对稳定的,这是由系统本身性质所决定的;随机因素影响具有易变性,这不仅表现在它本身的难以描

25、述,而且随机因素包含的内容太多,正因为如此,不同学者基于不同角度的研究也就得到不同的结论。目前已有的理论研究文献主要有以下两个方面:一是假定突变率不变如Michihiro Kandori, Greorge J,. Mailath, Rafael Rob (KMR)199315、Peyton Young(PY)199316; Glenn Ellison200017;二是假定突变率可变如James Bergin and Barton L. Lipman(1996)18; Jack Robles(1998)19。2.2.1 基于不变突变率的相关研究KMR(1993)首次研究了离散条件下对称协调博弈的

26、随机稳定性,他们在引入确定性达尔文选择动态的基础上进一步引入不随时间与状态变化而变化的突变率,使得确定性动态系统变为随机动态系统,然后讨论系统的随机稳定性;PY(1993)则通过引入确定的适应性动态来描述参与人行为调整过程,在此基础上引入了不随时间与状态变化而变化的随机因素,也深入讨论了系统的随机稳定性;Ellison(2000)模型绕过了求不变分布,直接利用常返状态的吸引域半径与共轭半径之间的关系来求解协调博弈中的均衡选择问题。此三篇研究不变突变率的文章在学术界得到了广泛的引用,尽管他们从不同的角度来研究,但其结论却具有一定的共性:一是确定性动态过程与常返状态的存在性。KMR引入了确定性达尔

27、文动态过程即支付越高则选择人数就越多,在协调博弈中,该动态很容易保证常返状态就是严格纳什均衡; PY引入确定性适应动态(实际上就是一种相对群体分布的最优反应动态),满足弱非周期条件、样本充分不完全及参与人永远不犯错误的条件,适应性动态就以概率1收敛到严格纳什均衡,在协调博弈中它也容易保证常返状态就是严格纳什均衡集;考虑到协调博弈容易满足严格纳什均衡集就是常返状态,Ellison2000 的模型直接给定博弈动态过程,并假定常返状态是存在的。二是随机因素的引入与遍历性。KMR、PY与Ellison都是假定不变突变率,但他们没有说明突变率不变的原因,只说明了突变率存在性。随机因素引入保证动态过程满足

28、遍历性要求,从而系统不会被粘在某一处,即不会出现锁定(lock in)的情况,保证系统在不同均衡状态之间跳动;具体地说:为了保证不变分布的存在性,PY(1990)通过假定随机因素的累积作用而保证遍历性的存在;KMR则是假定状态转移矩阵各转移概率不为零来保证系统不会被粘住;PY1993与Ellison2000则是假定博弈满足非周期条件而使系统收敛到严格纳什均衡,同时假定样本不完全或者有限记忆(也就是参与人很快会忘记过去而不会被锁定)而保证系统不会被粘住。有了常返状态存在性与遍历性条件就可以保证系统存在一个平稳分布,于是求随机稳定状态问题就转化为求平稳分布。三是他们得到了个共同结论就是吸引域的宽度

29、决定了系统的随机稳定性。KMR与PY通过运用Freidlin, M. I and Wentzell, A . D. (1984)20的方法 该方法的实质就是在满足遍历性的马尔可夫链中通过阻抗描述吸引域宽度,最后得到有最宽吸引域的吸引子就是随机稳定状态。来研究随机动态系统的稳定性,并得到有最宽吸引域的严格纳什均衡就是随机稳定状态(这种把随机稳定状态问题转化为吸引域宽度的方法完全是由随机稳定状态的定义所决定的),Gllison则直接定义常返状态吸引域的半径与共轭半径(半径代表宽度)而得到吸引域半径大于共轭半径的吸引子就是随机稳定状态,也就是说离开吸引子的阻抗大于进入吸引子的阻抗时,该吸引子就是随机

30、稳定状态。在对称协调博弈中,风险占优均衡(有最宽的吸引域半径)就是随机稳定状态。实验经济学的研究发现,现实中风险占优均衡并不一定就是随机稳定状态,系统的长期均衡并不是由博弈支付完确定,而是受到许多其他条件的影响。以上模型为了处理上的方便而假定不变突变率,把求随机稳定状态问题转化为求吸引域宽度问题,这种结论很难完全解释实验经济学的结论。事实上,现实中许多随机因素会影响系统的均衡,不同的突变过程会有不同的随机稳定状态,为了更现实在考察系统的随机稳定状态深入到系统的突变过程中去是十分必要的。2.2.2 基于可变突变率的相关研究首次对不变突变率假定提出挑战的是James Bergin and Lipm

31、an(BL 1996),他们从纯粹的数学角度研究了状态依赖的突变率对协调博弈均衡选择的影响。KMR,PY等考察有两个严格纳什均衡的配对博弈,在确定性动态下,系统最终会趋于两个均衡中的一个。但是当引入突变因素时,那么系统长期均衡就会由从一个状态到另一个状态的突变数量而决定。随着突变率趋于零,一个严格纳什均衡就会很容易被打破,并且吸引域个数的增加使得推理很快变得复杂起来。他们证明了:引入随状态变化而变化的突变率后,吸引域的半径就会发生变化,因而,系统的长期随机稳定均衡也会发生相应变化。也就是说系统的长期均衡并不完全由博弈支付所确定,而是与动态过程中随机因素的引入有关,即要准确地考察系统的长期均衡就

32、必须深入到系统的动态过程中去。最后他们得出:引入突变率并不会获得精炼均衡的作用。Jack Robles(JR 1998)研究了随时间变化而变化的突变率情况,考察了突变率趋于零的不同速度对均衡选择的影响。他认为增加不变突变率而没有把突变产生的原因加入到模型中去是KMR等模型的最大缺陷。实验证据表明随着博弈重复次数的增加,策略选择中的随机因素的影响会不断减少,随着博弈的重复,参与人更为熟悉他们所处的环境,更为熟悉对手行为选择,更为准确地预期对手行为,因而减少试验与错误的次数。因此,只有把把突变产生的原因即突变过程纳入到博弈模型中去才可以更为准确地描述参与人的行为,即假定突变率随时间而减少是合理的,

33、突变率应该是内生变量。他证明:突变率趋于零时,满足遍历性要求的随机动态会达到长期均衡,其结果与常突变率的极限行为是一样。如果把突变率趋于零的速度纳入到模型中,遍历性这一要求就很难满足,系统就可能不存在平稳分布。在文中,他并没有得出均衡与突变率收敛零的具体关系,只得出lock in 、 lock out与突变率收敛于零速度之间的定性关系,突变率并不能决定系统的最终状态,随机稳定状态是依赖于系统的初始条件的,即突变率收敛于零与严格纳什均衡吸引域之间并没有对应关系。尽管可变突变率模型更现实地考察了参与人的行为,但也存在固有的缺陷:一是这些模型都没有区分突变率与错误率,把突变率与错误率混为一谈,突变是

34、无目的性的,假定在任何状态下任何时间都不变有一定道理,但错误率就能这样假定;二是与可变突变率模型都没有结合到现实中参与人行为,没有结合社会学心理学等的研究成果,仅仅从数学理论上给予描述,难以应用于描述现实人的行为,难以很好地应用于研究协调博弈的随机稳定性。三、对称协调博弈的随机稳定性研究在已有理论研究中,不变突变率的理论模型虽然引入随机影响因素,但还是没有离开博弈支付决定随机稳定状态这一结论,仅仅提供了一种计算方法,无法体现所引入的随机因素的现实意义;可变突变率的理论模型虽然引入了可变突变率,但没有区分突变率与错误率,没有结合到具体的社会实践中,同时,也没有给出具体的计算方法,缺乏现实性与应用

35、性。下面将在已有研究基础上,以对称协调博弈为例,给出一个既有现实性又有应用性的模型。3.1 基本模型心理学研究表明人们是“损失厌恶”的同样的损失与收益给人们带来的痛苦与快乐是不对等的,因此,在较高支付时人们犯错误的可能性就会越小;另外,当人们重复选择某一行动时就会对这种行动产生一种依赖性(Crawford 1995)21,因此,人们犯错误的可能性就会大大降低;社会学研究表明人的行为是习惯成自然的,也就是说当某种行为被越来越多的人选择时,那么参与人犯错误的可能性就会越来越少(如羊群行为);经济学研究表明参与人行为选择的失败成本越大,犯错误的概率就越小;另外,“效率工资理论”说明高工资时参与人发生

36、犯错误的可能性就越少;非合作博弈理论的“颤抖手均衡”说明颤抖率随状态变化而变化的;Myersion (1978)22正是基于“越昂贵的策略犯错误的可能就越少”这一现实而提出相对均衡策略的稳键策略概念;最后,我们生活中见到的许多广告、宣传、舆论及引导等,其目的就是为了影响参与人的偏好而影响博弈的长期均衡。当然,影响参与人突变的因素有许多,如何把这些因素纳入到博弈模型中,是理论研究的一个难点。以下模型是BL模型的具体化,为了使问题简化,我们特作一些假定:(1)下文仅考察离散对称协调博弈,且博弈是两两配对的;(2)与Foster and Young一样,假定存在背景突变,且突变率不变,为这样就保证马

37、尔可夫转移矩阵满足遍历性要求;(3) 与Ellison的假定一样,常返状态是由协调博弈所有严格纳什均衡组成(文中将不涉及具体动态);(4)与进化稳定策略所考虑的情况一样,为了简化,本文仅考虑系统离开状态的阻抗 参与人为什么转而选择某一策略可能是突变、也可以新旧更替、还可能是群体中个体的迁移等原因,本文为了讨论的方便就不予考虑。,而不管系统是如何进入状态的;(5)把非最优反应分为两类,一类是无目的的选择,即突变,其突变率是不变的;另一类是错误率,它是随着系统状态的变化而变化,通过影响吸引域的宽度而影响博弈均衡,它是可控的。以上条件可以保证BJ(1996)结论成立的三个条件 BJ(1996)的定理

38、在以下三个条件满足的情况就成立:一是随机扰动过程是不可约的;二是随着突变率趋于零,突变过程收敛到无突变过程;三是状态依赖的突变率是系统在状态间转移的最重要因素。,以下模型是BJ其模型结论 其主要结论就是随机状态变化而变化的突变因素的引入并不会起到精炼纳什均衡的作用。的具体化。下面将根据社会现象把错误率纳入到模型当中。考虑到社会惯习的存在,也就是当某种行为被一再使用,那么经过一定时间该行为就可能内化参与人自己行为的指南(习惯成自然就是这个意思)。在这种情况下,个人要改变这种内化为行动指南的行为的难度就会相应增加,错误的可能性就会越来越少;另外,当一种行动被社会中越来越多的人使用,那么这种流行的行

39、动可能使得参与人盲目模仿而导致突变的可能性减少在模型中表现为变化率与略选择的人数反相关。心理研究的成果表明,人们对同样的损失与收益有不同的看法,即同样的损失给参与人带来的痛苦会大于收益所带来的快乐,这样人们在已经取得高支付的情况下(即在帕累托效率状态时),发生突变的可能就非常少,在模型中表现为变化率与对应的常返状态的支付反相关。现实生活中许多广告、宣传、舆论及引导等都会影响参与人的行为选择,在模型中我们用偏好参数来描述这种影响,参数值越大,变化率就越少。考虑到以上原因并应用Peyton Young(1993)、Ellison(2000)方法,在模型中引入突变率与错误率,在此基础求出系统的随机稳

40、定状态,以猎鹿博弈为例,猎鹿猎兔猎鹿4,40,2猎兔2,03,3表一具体步骤如下:第一步,引入不随系统状态变化而变化的突变率 现实中群体模型不是固定的,有进有出,有生有死,但我们仅仅是一种近似。,并由此计算突变边界,显然,包涵了非均衡路径上的支付;第二步,引入犯错误的可能性,首先引入参与人对均衡状态的偏好参数(对应猎兔状态;对应猎鹿状态,当然这种偏好是可以通过外界影响而改变的。偏好参数随广告、宣传、舆论等外界条件的变化而变化,参与人对均衡的偏好程度越高,值越大,则犯错误的可能性越小;其次,对应均衡状态的支付越大犯错误的可能就越少;再次,引入达到均衡的人数,选择某策略的人数越多则犯错误的可能性就

41、越少。初始时,当某个参与人突变或错误地选择了猎兔,那么转而选择猎鹿的可能性为(显然,就可以表示群体中第一个人选择猎兔状态的离开阻抗);如果再第二个人偶然地选择了猎兔,于是他犯错误而选择猎鹿的可能性为;如果第三个人偶然地选择了猎兔,于是他犯错误而选择猎鹿的可能性为,依此类推,根据定义,的指数越大,则犯错误的可能性就越少,这里的指数相当于Freidlin, M. I and Wentzell, A . D. (1984)方向树法中的离开阻抗。在这里只要有六个参与人同时选择了猎兔策略,那么整个群体将会选择猎兔策略。因此,要使系统进入到猎兔状态,就要使六个参与人同时选择猎兔策略,(为了说明的方便,假定

42、经济系统中只有15个人,其实经济系统中有许多人,但不会改变模型的基本结论)。如下图:猎兔猎鹿996图1此时的概率为(以下数据是假定系统进入到吸引域后就离开的阻抗就变为无限大,此假定来源于不变突变率的各文中的假定): 同样,随着猎鹿状态人数的增加,犯错误概率也将变得越来越小。于是,要使系统进入到猎鹿状态,就要使九个参与人同时选择猎鹿策略,此时的概率为:该模型既考虑到了不同状态的对突变率的影响,也考虑到其他因素的影响,并且考虑到了社会惯习等的作用,两个不同的原因在于参与人对两个均衡有不同的偏好程度。如果所有的离开阻抗都为1得到不变突变率的情形,根据计算可得随机稳定状态就是猎兔,即从长期来看,整个社

43、会多数处于猎兔状态,这正是不变突变率的结论;若把的指数设定为2;把的指数设定为1,则就得到BL可变突变率文章中例子的情形。显然,已有研究是本模型的特例。有了以上的准备,根据方向树法就可以直接计算两种可能状态对应的离开阻抗,由KMR(1993)引理1、定理1 及Ellison(2000)吸引域的定义可以得到:突变及错误可能性越大,则对应状态的吸引域就越窄;突变或错误可能性越少,则对应状态的吸引域就越宽。按照方向树法中阻抗的定义,由阻抗与吸引域宽度的正向关系可得:猎兔制度的吸引域宽度可以用表示;猎鹿制度吸引域宽度可以用表示。这两个离开阻抗已经包含了上文中所说的心理学、社会学等相应的研究成果。直接运

44、用Ellison(2000)定理1就可以得到:当猎鹿状态的吸引域大于猎兔状态的吸引域时,即,猎鹿状态就是随机稳定状态;当猎鹿状态的吸引域少于猎兔状态的吸引域时,即,猎兔状态就是随机稳定状态。显然,系统的随机稳定状态并不是由博弈支付完全确定,而是与其他因素有关,这与实验经济学的研究结论是一致的。实验经济学的研究表明,博弈支付只是影响协调系统长期行为的一个因素,还有许多其他因素都对系统的均衡产生较大的影响。本文模型的结论不仅考虑了多种明显的社会、心理因素对系统均衡的影响,而且也把广告、舆论、宣传等影响偏好的因素纳入到了模型当中,所以对任何博弈都不能得到确定的随机稳定均衡,而是受到许多因素影响。就上

45、述例子而言,两个系数180,63概括了心理学中羊群行为、社会学中惯习对参与人行为的影响,也考虑到了博弈支付对均衡的影响;两个偏好参数反应了广告、舆论、宣传等的影响。对某一特定博弈而言,前者相对固定,而后者的可变性较大,也正因为这一点增加了驾驭系统的可能性。系统的驾驭性主要表现在以下几个方面:通过采取强制性的措施如法律、法规等来改变博弈支付;通过增加某种策略的选择人数来影响上述系数;通过广告、宣传、舆论等方式来改变参与人个人的偏好参数等等。采取这些措施直接影响博弈均衡的吸引域的宽度,进而改变系统的随机稳定状态,使得系统演化到意向的均衡状态。3.2 演化时间我们进一步考察系统的演化时间。我们知道尽

46、管采取措施可以使得系统向意向状态演化,但所需要的时间可能很长而不利于效率的提高。因而,如何使得系统以最快的速度达到意向的均衡状态,常常是决策者非常关心的问题。下面应用Ellison(2000)的定义:期望等待时间表示从状态到状态所花费的时间,其中表示从状态进入到状态的阻抗。在本文模型中由于只有猎鹿与猎兔两个状态,相对于猎鹿状态而言,其进入阻抗就是另一个猎兔状态的离开阻抗,也就是;猎兔状态的进入阻抗就是。由此可以看出:进入阻抗越大则所花费的时间就越长,反之就越短。也就是说,另一个状态的吸引域越宽,则进入该状态花费的时间就越长。要使系统以尽可能快的速度演化到意向的均衡状态,一方面可以通过采取相应的

47、法律、法规来改变博弈的支付,即减少其他状态对应的博弈支付;另一方面也可以减少另一状态中参与人的数量;还可以降低参与人对另一状态的偏好程度。在上述的模型中,要使系统向猎鹿状态演化,那么就可以采取上述方法尽量减少指数,使系统更加容易进入到状态猎鹿。因此,在制度设计时,需要考虑到演化的时间,可以选择上述影响吸引域半径的各种因素如参与人数、博弈支付、偏好参数等来改变阻抗进而改变系统的长期均衡。3.3 中间过程的逆转成本本文的模型可以很方便地考察从中间过程向意向均衡演化的时间、速度及逆转成本等等。仍然以本文的模型为例,下面表示系统达到不同状态时的离开阻抗。下面数据对应于一个、二个、三个、四个、五个、六个

48、参与人选择猎兔等所对应的离开阻抗:。下面数据对应于一个、二个、三个等参与人选择猎鹿所对应的离开阻抗:。假定系统已经有四个人选择猎兔,那么此时要使系统选择猎鹿则所需要的逆转成本就是,如果系统有5个人选择了猎兔,那么要使系统选择猎鹿则所需要的逆转成本就是;如果系统有7个人选择了猎鹿,那么使系统选择猎兔所需要的逆转成本为。显然,随时间的推进,系统从一个状态到另一个状态所需要的逆转成本就会越来越大。另外,逆转成本越大意味着所费的转移时间就越长。因此,在制度设计时,不仅要考虑到博弈的支付,更重要的是考虑系统已经演化到什么状态,因为不同状态的逆转成本不同。在KMR(1993)文章中,考虑到进化压力的存在而

49、得出休克疗法不如渐进式改革,而在Ellison(2000)考虑了多步演化可以提高生存机会的可能性而得到渐进式改革不如休克疗法。尽管都假定不变突变率,但由于考虑问题的角度不同因而得出完全不同的结论,很重要的一点就是会他们的模型没有结合到具体的社会现实中去,所以结论缺乏解释力。事实上,我们不能绝对地认为某种改革的好坏而应该结合到具体的环境中考虑。假定系统已经向某一低效率的状态演化了很久,这说明要使系统逆转的成本就很大,如果选择渐进式改革就需要很长时间而不利于效率的提高,此时就需要采取如直接改变博弈支付等强制性性措施(前苏联的休克疗法 根据此模型,前苏联向计划经济制度已经起了七十年,如果采取渐进式改

50、革,那么转到市场经济体制可能需要很长时间,而选择休克疗法所需要的时间很短,但却需要经历一个非常痛苦的过程,这种阵痛一过就会恢复正常而走上快速发展的轨道。俄罗斯12经济已经进入到健康的发展轨道上来了,2005年其人均GDP已达3000美元,经济增长率达6%,事实证明它的改革不是失败的。),强制性措施需要经过阵痛的,因为不但要在短期内改变博弈的支付,而且要从人们思想上得到 一个快速的转变,这种转变是痛苦的。渐进式改革虽然速度慢,但却不必要经历短期的阵痛,因此究竟是选择那种方法取决于速度与效率之间进行权衡,这就要看博弈的均衡支付及已经演化的时间。3.4 模型的扩展:三状态系统的随机稳定状态求法以上给

51、出了两状态时系统的随机稳定状态模型,运用以上模型思想来分析三状态 相对对称协调博弈而言,只要满足非循环条件,它的严格纳什均衡就是常返状态,因而,该博弈有三个常返状态。情形,在这里需要注意的是我们考虑的是两两随机配对互动博弈。图2左边是对称协调博弈的支付矩阵,右边是突变是两两配对博弈所确定的突变边界:3/41/44/51/52/53/5100032004图2图3图4为了计算方便,设该群体中共有20人 事实上,现实中所考察的参与人群体足够大,这种设定只是为了说明的方便,但不会改变模型的主要结论。令在状态的偏好参数分别是。那么可以得到不同状态之间跳跃离开阻抗(见图3),其中箭头上表示的数字来源于上面

52、方法及本例中的突变边界(事实上,这里已经把上述的影响因素纳入到模型当中);图4给出了以状态为根所对应的路径,由此可求出每个根对应的随机潜力。由此可得,同样可以求出其他状态的随机潜力;所以整个系统的随机稳定状态就是中有最小随机潜力的状态。假定意向的均衡是状态,并且希望通过路径来达到,于是决策者可以通过以下方式来施加影响:一是增加选择策略的参与人人数或者减少选择策略的参与人人数;二是通过采取强制性的措施来减少状态的博弈支付;三是采取广告、宣传等方式来影响参与人的偏好,从而扩大参数或者减少参数。当然,我们同样可以计算到意向均衡状态的时间及相应中间过程的演化成本。四、结论及进一步研究显然,与已有的研究

53、结论不同,本文模型的随机稳定状态取决于偏好参数的相对大小、博弈的支付、选择不同策略的人数等等。随机稳定状态并不完全由博弈的支付决定,也就是说它不仅与博弈支付有关,还与其他影响吸引域宽度的因素有关,特别地有许多因素是可以通过人为方式施加影响的,即系统的随机稳定状态是可以通过人为方式驾驭或控制的,需要指出的是,多状态模型中计算就显得相对复杂,但由本文模型可以知道,参与人可以控制系统的演化方向,使得系统往意向状态演化,达到认识并驾驭规律之目的。本文模型在以下两方面还需作进一步的改进:一是模型只考虑到选择某均衡策略以后的离开阻抗,没有考虑系统是如何进入该均衡的;二是模型在设定离开阻抗时,没有考虑到系统

54、进入均衡状态吸引域后的逆转成本。把以上两方面的因素纳入到模型将会使模型更加完善。参考文献1 Nash, J. F. (1951): Non-cooperative gamesJ, Ann. Of Math. 54, 286-295.2 Jrgen W. Weibull(1995): Evolutionary game theoryM, The MIT Press.3 Samuelson, L. (1993): Recent advances in evolutionary economics: commentsJ, Economics Letters. 42, 313-319.4 Maynar

55、d Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts” J, Nature, , (246): 15-18.5 Harsanyi, J. and Selten, R. (1988): A general theory of equilibrium selection in gamesM. The MIT Press, Cambridge, MA. 6 Young, P. and Foster, D. (1990): Stochstic evolutionary game dynamicsJ. Journal of

56、theoretical biology. 38, 219-232.7 Monderer, D. and Shapley, L. S. (1996): Potential gamesJ, Games and economic behavior, 14, 124-143.8 Schelling, T. (1960): The strategy of conflictM, Harvard University Press, Cambridge, MA.9 Van Huyck, J. b. Battalio, R. c.,Beil, R. O. (1990): Tacit coordination g

57、ames, strategic uncertaintyJ. American economic review. 80, 234-248.10 Sugden, R. Mehta, J. and Starmer, C. (1994): An Experimental Investigation of Pure Coordination GamesJ, American economic review,84, 658-673.11 Myerson, R. (1978): Refinements of the Nash equilibrium conceptJ, International journ

58、al game theory. 7, 73-80.12 Van Huyck, J. b. Battalio, R. c. Beil, R. O. (1991): Strategic uncertainty, equilibrium selection, and coordination failure. average opinion gamesJ. Quarterly journal of economics. 106, 885-910.13 Cooper, R. D. V. Dejong, R. Forsythe and J. W. Ross(1992): Communication in

59、 coordination gamesJ, American economic review, 107, 739-771.14 Keser C., and Ehrhart K., and Berninghaus K. (1998): Coordination and local interaction: experimental evidenceJ. Economics Letters. 58, 269-275.15 Kandori, M., Mailath, G. J., and rob, R. (1993): Learning, mutation, and long-run equilib

60、ria in gamesJ, Econometrica, 61, 29-56.16 Young, H. P. (1993): The evolution of conventionsJ, Econometrica, 61, 57-84.17 Ellison, G. (2000): Basins of attraction, long-run stochastic stability, and the speed of step-by-step evolutionJ. Review of economic studies. 67, 17-45.18 Bergin, J. and Lipman,

61、B. (1996): Evolution with state-dependent mutationsJ, Econometrica. 64, 943-956.19 Robles, J. (1998). Evolution with changing mutation ratesJ, Journal of economics theory. 79. 207-223.20 Freidlin, M. I and Wentzell, A . D. (1984): Random perturbations of dynamical systemsM, Springer-verlag, Berlin/New York. 21 Crawford, V. P., (1995): Adaptive dynamics in coordination gamesJ. Econometrica. 63, 103-143.22 Myerson, P., (1978): Refinement of the Nash Equilibrium conceptJ, International Journal of game theory, 7, 73-80 .

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!