博弈论与信息经济学

上传人:仙*** 文档编号:33791802 上传时间:2021-10-19 格式:PPT 页数:116 大小:1.03MB
收藏 版权申诉 举报 下载
博弈论与信息经济学_第1页
第1页 / 共116页
博弈论与信息经济学_第2页
第2页 / 共116页
博弈论与信息经济学_第3页
第3页 / 共116页
资源描述:

《博弈论与信息经济学》由会员分享,可在线阅读,更多相关《博弈论与信息经济学(116页珍藏版)》请在装配图网上搜索。

1、博弈论与信息经济学 主讲:何一鸣(博士)联系:教材: 经济博弈论(第三版)经济博弈论(第三版) 复旦大学出版社,2007年版出勤:30(点名概率随上课人数的变化相机决策博弈)考试:开卷有益(论文或出题形式取决于学生与学院的博弈结果,70)参考书目:阅读书目阅读书目http:/ 导论1.1 什么是博弈论1.1.1 从游戏到博弈博弈就是策略对抗,或策略有关键作用的游戏博弈就是策略对抗,或策略有关键作用的游戏n博弈Game,博弈论Game Theory,Game即游戏、竞技n游戏和经济等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用 游戏下棋、猜大小 经济寡头产量决

2、策、市场阻入、投标拍卖 政治、军事美国和伊拉克、以色列和巴勒斯坦1.1.2 一个非技术性定义四个核心方面四个核心方面 博弈的参加者(Player)博弈方 各博弈方的策略(Strategies)或行为(Actions) 博弈的次序(Order) 博弈方的得益(Payoffs) 1.2 几个经典博弈模型1.2.1 囚徒的困境n囚徒的困境是图克(Tucker)1950年提出的n该博弈是博弈论最经典、著名的博弈n该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷一、基本模型-5, -50, -8-8, 0-1, -1坦 白不坦白坦 白

3、不坦白两个罪犯的得益矩阵囚徒囚徒 2囚囚徒徒1囚徒1:坦白囚徒2:坦白二、双寡头削价竞争100,10020,105150,2070,70高 价低 价高 价低 价寡头寡头2寡寡头头1双寡头的得益矩阵政府组织协调的必要性和重要性寡头1:低价(70)寡头2:低价(70)1.3 博弈论历史和发展简述n2000年前我国古代的“齐威王田忌赛马”n1500年前巴比伦犹太教法典“婚姻合同问题”等。n1838年古诺寡头模型。n1883年伯特兰德寡头竞争模型。 n1913年齐默罗象棋博弈定理 、“逆推归纳法”n1921-1927年波雷尔混合策略的第一个现代表述,有数种策略两人博弈的极小化极大解 n1928年诺伊曼

4、和摩根斯坦扩展形博弈定义,证明有限策略两人零和博弈有确定结果 1.3.1博弈论的形成冯冯.诺伊曼和摩根斯坦诺伊曼和摩根斯坦博弈论和经济行为博弈论和经济行为Theory of Games and Economic Behavior 1944n引进扩展形(extensive form)表示和正规形(normal form)或称策略形(strategy form)、矩阵形(matrix form)表示n提出稳定集(stable sets)解概念n正式提出创造博弈论一般理论的主意n给出博弈论研究的一般框架、概念术语和表述方法1.3.2 博弈论的成长和发展一、第一个研究高潮,本世纪40年代末和50年代初

5、n1950年纳什提出“纳什均衡”(Nash equilibrium)概念和证明纳什定理,发展非合作博弈的基础理论。 n1950年Melvin Dresher和Merrill Flood在兰德公司(美国空军)“囚徒的困境”(Prisons dilemma)博弈实验,(Howard Raiffa)独立进行这个博弈实验;n1952-1953年期间(L. S. Shapley)和(D. B. Gillies)提出“核”(Core)作为合作博弈的一般解概念nShapley提出了合作博弈的“Shapley值”(Shapley value)概念等。n奥曼(R. J. Aumann)“40年代末50年代初是博

6、弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。” 二、50年代中后期一直到70年代博弈论发展的青年期n1954-1955年提出了“微分博弈”(Differential games)的概念。n奥曼则在1959年提出了“强均衡”(Strong equilibrium)的概念。n“重复博弈”(Repeated games)也是在50年代末开始研究的,这自然引出了关于重复博弈的“民间定理”(Folk theorem)。n1960年(Thomas C. Schelling)引进了“焦点”(Focal point)的概念。n博弈论在进化生物学(Evolutionary B

7、iology)中的公开应用也是在60年代初出现的。 n塞尔腾(Selten)1965提出“子博弈完美纳什均衡”(subgame perfect Nash equilibrium)n1975年提出的“颤抖手均衡”(Trembling hand perfect equilibrium)n海萨尼(Harsanyi)1967-1968三篇构造不完全信息博弈理论的系列论文,“贝叶斯纳什均衡”(Bayesian Nash equilibrium)。n海萨尼1973年提出关于“混合策略”的不完全信息解释,以及“严格纳什均衡”(Strict Nash equilibrium)。n70年代“进化博弈论”(Evo

8、lutionary game theory)的重要发展,(John Maynard Smith)1972年引进“进化稳定策略”( Evolutionarily stable strategy,ESS)等。n“共同知识”(Common knowledge)的重要性,因为奥曼1976年的文章引起广泛的重视。 三、40年代末到70年代末是博弈论发展的重要阶段n这个时期博弈理论仍然没有成熟,理论体系还比较乱,概念和分析方法很不统一,在经济学中的作用和影响还比较有限,但这个时期博弈论研究的繁荣和进展却是非常显著的。n对这一阶段博弈论研究的迅速发展,除了理论发展自身规律的作用以外,全球政治、军事、经济特定

9、环境条件的影响(战争和冷战时期的军事对抗和威慑策略研究的需要,经济竞争、国际经济竞争的加剧),以及经济学理论发展本身的需要等,都起了重要的作用。正是因为有了这一阶段博弈论研究的繁荣发展,才有80、90年代博弈论的成熟和对经济学的博弈论革命。 1.3.3博弈论的成熟及与主流经济学的融合一、80、90年代是博弈论走向成熟的时期 n1981(Elon Kohlberg) “顺推归纳法”(Forward induction)n克瑞泼斯(David M. kreps)和威尔孙(Robert Wilson)1982年提出“序列均衡”(Sequential equilibria)n1982年斯密(John

10、Maynard Smith)出版了进化和博弈论()n1984年由伯恩海姆(B. D. Bernheim)和皮尔斯(D. G. Pearce)提出“可理性化性”(Rationalizability)n海萨尼和塞尔腾1988年提出了在非合作和合作博弈中均衡选择的一般理论和标准,n1991年弗得伯格(D. Fudenberg)和泰勒尔(J. Tirole)首先提出了“完美贝叶斯均衡”(Perfext Bayesian equilibrium)的概念二、博弈论和经济学诺贝尔奖n1994:非合作博弈:纳什(Nash)、海萨尼(Harsanyi)、泽尔腾(Selten)n1996:不对称信息激励理论:莫里

11、斯(Mirrlees)和维克瑞(Vickrey)n2001:不完全信息市场博弈:阿克罗夫(Akerlof)、斯宾斯(Spence)、斯蒂格里兹(Stiglitze)n2005:合作博弈论:Aumann,Shcellingn2007:机制设计:Hurwicz , Maskin , Myerson 生于1928年6月13日。任普林斯顿大学数学系教授。1950,约翰纳什获得美国普林斯顿高等研究院的应用博士学位,他那篇仅仅27页的博士论文中有一个重要发现,这就是后来被称为“纳什均衡”的博弈理论。n1920年5月29日出生于匈牙利布达佩斯 ,2000年在美国柏克莱逝世。海萨尼的父母曾希望他将来成为一个药

12、商,但海萨尼自己爱好研究哲学和数学。但选择了布达佩斯大学的药学专业。1944年初,他获得了药学硕士学位。但是,1944年3月,德国军队占领了匈牙利。海萨尼从5月到11月被强迫到一个苦力营中劳动。同年11月,纳粹当局决定将海萨尼所在的苦力营从布达佩斯放逐到奥地利的一个集中营去。但是,海萨尼很幸运地就在列车开往奥地利之前,从布达佩斯火车站逃脱。一位他认识的耶钱教神父让他躲在修道院的地窖里避难。海萨尼确实是够幸运的,因为后来他那些苦力营的同伴绝大多数都死于集中营里。 n战后的1946年,海萨尼重新到布达佩斯大学注册入学,攻读博士学位,专业是哲学,兼修社会学和心理学。海萨尼于1947年6月获得布达佩斯

13、大学哲学博士学位。1948年6月,由于海萨尼与当局政见不同,他被迫从研究所辞职。1950年4月,海萨尼逃到了奥地利。1950年12月30日,他到达澳大利亚的悉尼,在悉尼的工厂当劳工的同时,在悉尼大学修读经济学夜间课程,并于1953年取得文学硕士。在悉尼读书时,他开始在经济期刊(包括JournalofPoliticalEconomy和theReviewofEconomicStudies)发表研究论文。由于拥有学位,他得以于1956年在布里斯班昆士兰大学取得教席。n在1958年,他获得了洛克菲勒奖学金,在美国斯坦福大学肯尼斯约瑟夫阿罗的指导下写了一篇关于博弈论的论文,并于1959年取得了第二个经济

14、学博士学位。 1958年,在堪培拉澳大利亚国立大学以研究员身份工作一段很短的时间后,因为博弈论在澳大利亚仍是默默无闻而感到被孤立。在肯尼斯阿罗和詹姆斯托宾的帮助下,他得以能够迁移到美国,同时于1961年至1963年之间在底特律韦恩州立大学担任经济学教授。1964年,他转到美国柏克莱加州大学,并一直留在那里直至他于1990年退休。n1930年10月10日出生于德国的不莱斯劳(Breslau)。泽尔腾考入了法兰克福大学数学系,1957年毕业,获数学硕士学位。而后从事着博弈论及其应用、实验经济学等博弈论的学术研究。1961年,泽尔腾获得法兰克福大学数学博士学位;60年代早期,泽尔腾做了寡头博弈的实验

15、,19671968年度,泽尔腾到加州伯克利分校作访问教授,1972年转到比勒菲尔德大学(University of Bielefeld)工作,1984年至今一直在波恩大学工作。 n1936.07.05亚当斯密的同乡。莫里斯从小就显露出了对数学的浓厚兴趣和超乎寻常的天分。1957年,莫里斯以第一名的骄人成绩从爱丁堡大学数学系毕业,顺利进入剑桥大学,拿下了博士学位。后来近30年的时间里,莫里斯一直执教于牛津,现在是剑桥大学和香港中文大学的经济学教授。除了担任过国际计量经济学会会长、英国皇家经济学会会长、中国政府经济顾问等职,1997年,莫里斯教授还被英国女王授予了“爵士”爵位。 n1914年,维克

16、瑞生于加拿大 n1935年获耶鲁大学理学学士学位 n1937年获哥伦比亚大学硕士学位 n1945年起,维克瑞任职于哥伦比亚大学。 n1947年又获哥伦比亚大学哲学博士学位 n19641967年,他担任哥伦比亚大学经济系主任,在此期间曾任纽约市城市经济协会会长 n1967年成为加利福尼亚斯坦福行为科学高级研究中心研究员与经济计量学会会员 n1971年出任澳大利亚纳施大学客座讲师 n1973年出任美国经济研究局局长 n1974年,他出任联合国发展规划预测和政策中心财政顾问,并成为美国文理研究院研究员。 n1979年获芝加哥大学人文学博士 n在得奖三天之后,在前去开会的途中去世。他在诺贝尔的光环照耀

17、中倒下了,其一生为学术研究鞠躬尽瘁,最后为其人生画上了一个美丽的句号。 1940.6.17n1966年获美国麻省理工学院博士头衔,现为美国加利福尼亚州大学伯克利(UCBerkeley)经济学教授。 1943.11.7生于美国新泽西州,1962-1966年就读于普林斯顿大学并获哲学学士学位;1968年在牛津大学获数学硕士学位,并获得该校罗氏奖学金;1972年在哈佛大学获经济学博士学位。约瑟夫约瑟夫斯蒂格利茨(斯蒂格利茨(Joseph E. Stiglitz),2001年诺贝尔经济学奖获得者 nJoseph Eugene Stiglitz, ForMemRS, FBA, (born Februar

18、y 9, 1943) is an American economist and a professor at Columbia University. He is a recipient of the Nobel Memorial Prize in Economic Sciences (2001) and the John Bates Clark Medal (1979). He is also the former Senior Vice President and Chief Economist of the World Bank. nAumann(born June 8, 1930) i

19、s an Israeli-American mathematician and a member of the United States National Academy of Sciences. He is a professor at the Center for the Study of Rationality in the Hebrew University of Jerusalem in Israel. He also holds a visiting position at Stony Brook University and is one of the founding mem

20、bers of the Center for Game Theory in Economics at Stony Brook nThomas Crombie Schelling (born 14 April 1921) is an American economist and professor of foreign affairs, national security, nuclear strategy, and arms control at the School of Public Policy at University of Maryland, College Park. He is

21、 also co-faculty at the New England Complex Systems Institute. He was awarded the 2005 Nobel Memorial Prize in Economic Sciences (shared with Robert Aumann) for having enhanced our understanding of conflict and cooperation through game-theory analysis.nHurwicz (August 21, 1917 June 24, 2008) was a R

22、ussian-born American economist and mathematician. His nationality of origin was Polish. He was Jewish. He originated incentive compatibility and mechanism design, which show how desired outcomes are achieved in economics, social science and political science. Interactions of individuals and institut

23、ions, markets and trade are analyzed and understood today using the models Hurwicz developed nMaskin (born December 12, 1950) is an American economist and Nobel laureate recognized with Leonid Hurwicz and Roger Myerson for having laid the foundations of mechanism design theory. He is the Albert O. H

24、irschman Professor of Social Science at the Institute for Advanced Study, and a visiting lecturer with the rank of Professor at Princeton University. nMyerson (born March 29, 1951) is an American economist and Nobel laureate recognized with Leonid Hurwicz and Eric Maskin for having laid the foundati

25、ons of mechanism design theory. A professor at the University of Chicago, he has made contributions as an economist, as an applied mathematician, and as a political scientist.第二章 完全信息静态博弈2.1 上策均衡上策上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低价”。上策均衡上策均衡:一个博弈的某个策略组合中的所有

26、策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果n上策均衡不是普遍存在的 2.1.1 严格下策反复消去法严格下策严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略严格下策反复消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中2.1.2 划线法1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚囚徒徒困困境境-1, 11, -11, -1-1, 1猜猜硬硬币币2, 10, 00, 01, 3夫夫妻妻之之争争2.1.3 箭头法1, 01, 30, 10,

27、 40, 22, 0-5, -50, -8-8, 0-1, -1囚囚徒徒困困境境-1, 11, -11, -1-1, 1猜猜硬硬币币2, 10, 00, 01, 3夫夫妻妻之之争争 2.2 纳什均衡 2.2.1 纳什均衡的定义n策略空间:n博弈方 的第 个策略:n博弈方 的得益:n博弈:纳什均衡纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡nSS ,1ijiSsiu,;,11nnuuSSG,;,11nnuuSSG),(*niss i),.,(*1*1*niiis

28、sss),.,(),.,(*1*1*1*1*niijiiiniiiiisssssusssssuijiSs),(*nissGiij2.2.2 纳什均衡与严格下策反复消去法n上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡命题命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡命题命题2.2:在n个博弈方的博弈中 中,如果 是 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的), (*niss,;,11nnuuSSG),(*niss ),(*

29、niss ,;,11nnuuSSGG2.3 无限策略分析和反应函数2.3.1 古诺的寡头模型寡头产量竞争以两厂商产量竞争为例QQPPqqQ8)(21121111112)(8 )(qqqqqcQPqu212116qqqq221 cc221222222)(8 )(qqqqqcQPqu222126qqqq4.5,4.55,3.753.75,54,4不突破突破厂商厂商2不突破 突破厂厂商商1以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5两寡头间的囚徒困境博弈2.3.2 反应函数古诺模型的反应函数)6()()6()()6max(max12

30、11222212112121111qqRqqqRqqqqquq1q(3,0)(6,0)(0,3)(0,6)2q)(21qR)(12qR古诺模型的反应函数图示理性局限和古诺调整2.3.3 伯特兰德寡头模型n价格竞争寡头的博弈模型价格竞争寡头的博弈模型n产品无差别,消费者对价格不十分敏感产品无差别,消费者对价格不十分敏感122222122211112111),(),(PdPbaPPqqPdPbaPPqq11111112111)(),(qcPqcqPPPuu22222222122)(),(qcPqcqPPPuu)(2111111PdPbacP)(1222222PdPbacP)(21)(21*1222

31、22*2*211111*1PdcbabPPdcbabP2.3.4 公共资源问题公共草地养羊问题)(1QVVqqQn以三农户为例 n=3,c=4cqQVquiii)(323211212148),(qqqqRq313122212148),(qqqqRq212133212148),(qqqqRq17287257624*3*2*1*3*2*1uQuuuqqqQQQQu964)100(1728576323047224348uQ合作:总体利益最大化合作:总体利益最大化竞争:个体利益最大化竞争:个体利益最大化2.4 混合策略和混合策略纳什均衡2.4.1 严格竞争博弈和混合策略的引进一、猜硬币博弈-1, 11

32、, -11, -1-1, 1正 面反 面猜硬币方猜硬币方盖盖硬硬币币方方正 面反 面(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念这类博弈很多,引出混合策略纳什均衡概念二、混合策略、混合策略博弈 和混合策略纳什均衡 混合策略混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。 混合策略纳什均衡混合策略纳什均

33、衡:包含混合策略的策略组合,构成纳什均衡。,;,11nnuuSSGi,1ikiissSki),(1ikiippp10ijpkj, 111ikipp三、一个例子该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析5213BABApppp1352DCDCpppp博弈方1的混合策略博弈方2的混合策略2, 35, 23, 11, 5CDAB博弈方博弈方2博博弈弈方方1 策略 得益博弈方1 (0.8,0.2) 2.6博弈方2 (0.8,0.2) 2.62.4.2 多重均衡博弈和混合策略一、夫妻之争的混合策略纳什均衡2, 10, 00, 01, 3时 装足 球时装足球丈丈 夫夫妻妻子子夫妻之争夫妻之争3)(0

34、)(0)(1)(FpCpFpCpwwww1)(0)(0)(2)(FpCpFpCphhhh妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡 策略 得益博弈方1 (0.75,0.25) 0.67博弈方2 (1/3,2/3) 0.752.4.3 混合策略和严格下策反复消去法3, 10, 20, 23, 31, 31, 1LRUMD博弈方博弈方2博博弈弈方方123212111003eu23212111030eu博弈方2采用纯策略L时,博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用纯策略R时,博弈方1采用混合策略(1/2,1/2,0)的得益2.4.4 混合策略反应函数猜硬币博弈-

35、1, 11, -11, -1-1, 1正 面反 面猜硬币方猜硬币方正面反面猜硬币博弈猜硬币博弈盖盖硬硬币币方方rq111/21/2(r,1-r):盖硬币方选择正反面的混合策略概率分布(q,1-q):猜硬币方选择正反面的混合策略概率分布)(2rRq )(1qRr 第三章 完全且完美信息动态博弈3.1 动态博弈的表示法和特点3.1.1 阶段和扩展性表示n阶段:动态博弈中一个博弈方的一次选择行为n例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒3.1.2 动态博弈的基本特点n策略是在整个博弈中所有选择、行为的计划n结果是上

36、述“计划型”策略的策略组合,构成一条路径n得益对应每条路径,而不是对应每步选择、行为n动态博弈的非对称性先后次序决定动态博弈必然是非对称的。n先选择、行为的博弈方常常更有利,有“先行优势”。3.2 可信性和纳什均衡的问题3.2.1 相机选择和策略中的可信性问题不同版本的开金矿博弈分钱和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈分钱打官司都可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈分钱打官司都不可信3.2.2 纳什均衡的问题 第三种

37、开金矿博弈中, (不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。n结论结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能可能是不稳定的,不能作为预测的基础。n根源根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题3.3 子博弈和子博弈完美纳什均衡3.3.1 子博弈n定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。乙甲不借借不分分(1,

38、0)(0,4)(2,2)乙(-1,0)3.3.2 子博弈完美纳什均衡定义定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。n子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。n逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。3.4 两个经典动态博弈模型3.4.1 寡占的斯塔克博格模型n先后选择产量的产量竞争博弈n把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。QQPPqqQ8)(,21221 cc121111112)

39、(8 )(qqqqqcQPqu212116qqqq221222222)(8 )(qqqqqcQPqu222126qqqq 产量 得益厂商1 3单位 4.5厂商2 1.5单位 2.25先行优势3.4.3 讨价还价博弈三回合讨价还价112不接受,出S接受不接受,出S2接受出S1)10000(,22SS)10000,(11SS)10000(,22SSSS2SSS211000010000三回合讨价还价博弈结果的讨论益越大甲的得益越小,乙的得越大,时,当益越小甲的得益越大,乙的得越大,时,当5 . 0015 . 0无限回合讨价还价SS211000010000SSS211000010000110000*S

40、11000010000*S3.4.4 委托人代理人理论一、委托人代理人关系n经济活动和社会活动中有很多委托人代理人关系,有明显的,也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。n委托人代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性n委托人代理人涉及问题:激励机制设计、机制设计理论,委托合同设计问题等二、无不确定性的委托人代理人模型R(S)-w(S), w(S)-SR(E)-w(E), w(E)-ER(0),0R(0),0122偷懒努力拒绝接受不委托委托代理人的选择激励相容约束: w(E)-E w(S)-S w(E) w(S)

41、+E-S参与约束:22R(E)-w(E), w(E)-E拒绝接受拒绝接受R(0),0R(S)-w(S), w(S)-SR(0),0接受:w(E)-E0接受:w(S)-S0参与约束n委托人的选择11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托: R(E)-w(E) R(0)不委托: R(E)-w(E) R(0)不委托: R(S)-w(S) 0不委托: 0.1*20-w(S) +0.9*10-w(S)0不委托:0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0.9*w(10-S)接受:0.9*w(20)-

42、E+0.1*w(10)-E0委托:0.9*20-w(20)+0.1*10-w(10)0激励相容约束促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条件参与约束对于委托人来说,就是要根据上述两个条件,以及 E、S的值,选择最佳的工资水平w(20)和w(10),或者它们的差额w(20) -w(10)五、选择报酬和连续努力水平的 委托人代理人博弈R, CC(e) +R(e)委托人希望的代理人努力水平(满足参与约束)UU*ee)()()()()()(*eCeRweCeRwUeCeRw激励相容约束:参与约束:店主和店员的问题商店的利润 , 是均值为0的随机变量店员的负效用 , 是店员的努力机

43、会成本为1店主采用的报酬计算公式店员的得益店员期望得益为店主的得益为 eR42eC )4(eBABRASABeBeBAe)1 ()1 ( 4)4(424eBeAe2)4(eeBA3.5 有同时选择的动态博弈模型3.5.1 国际竞争和最优关税ijiiijiijietehceheaheha)()()(厂商的得益函数为:第二阶段厂商选择:32,3),(max*jiiijijijiitcaetcaheehhtt),(jijijiiieehhtt第一阶段政府选择:先把第二阶段根据厂商选择得到结果代入政府得益,再求最优化:2 , 1,9,9)(4,33)(9)2(9)(18)(2),(),(max*2*2

44、2*icaecahcattcattcatcatcattwttwiiiiijiijiijii政府的得益函数;),(jijijiiieehhttww jiijieteh2)(21第四章 重复博弈4.1 重复博弈引论4.1.1 为何研究重复博弈n经济中的长期关系n人们的预见性n未来利益对当前行为的制约n长期合同、回头客、长客和一次性买卖的区别n有无确定的结束时间4.1.2 基本概念n有限次重复博弈有限次重复博弈:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为

45、G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。n无限次重复博弈无限次重复博弈:一个基本博弈G一直重复博弈下去的博弈,记为G( )n策略策略:博弈方在每个阶段针对每种情况如何行为的计划n子博弈子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分n均衡路径均衡路径:由每个阶段博弈方的行为组合串联而成重复博弈的得益的平均得益为相同的现在值,则称得益序列阶段的得益,能产生与无限次重复博弈)各个重复博弈或作为重复博弈(有限次:如果一常数,,2121平均得益11)1 (ttt虑贴现问题无限次重复博弈必须考考虑贴现因素有限次重复博弈不一定4.2 有限次重复博弈4.2.

46、1 两人零和博弈的有限次重复博弈n零和博弈是严格竞争的,重复博弈并不改变这一点。n以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样,博弈方的正确策略是重复一次性博弈中的纳什均衡策略。4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈n定理定理:设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益的与原博弈G中的得益。-5,-50,-8-8,0-1,-1坦 白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1(-5,-5)-10,-10-13,-5-

47、5,-13-6,-6坦 白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1(-10,-10)有限次重复削价竞争博弈100,10020,150150,2070,70高 价低 价高价低价寡头寡头2寡寡头头1削价竞争博弈有唯一纯策略纳什均衡(70,70)有限次重复的结果仍然是(低价,低价)4.2.3 有限次重复博弈的民间定理n个体理性得益个体理性得益:不管其它博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益n可实现得益可实现得益:博弈中所有纯策略组合得益的加权平均数组n定理定理:设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中所有不小于个体理性得益的可

48、实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们厂商2得益厂商1得益(1,4)(3,3)(1,1)(4,1)w=(1.1)4.3 无限次重复博弈4.3.1 两人零和博弈的无限次重复博弈n两人零和博弈无限次重复的所有阶段都不可能发生合作,博弈方会一直重复原博弈的混合策略纳什均衡4.3.2唯一纯策略纳什均衡博弈 的无限次重复博弈两寡头削价竞争博弈 该博弈一次性博弈均衡是都采用低价,是囚徒困境型博弈4,40,55,01,1HLHL无限次重复两寡头削价博弈 触发策略触发策略:第一阶段采用H,如果前t-1阶段的结果都是(H,H),则继续采用H,否则采用L。 如果博弈方2采用L,总得益现

49、值为 如果博弈方2采用H,总得益现值为 因此当 时,此触发策略纳什均衡策略151152VV 44/1两寡头削价竞争无限次重复博弈的民间定理厂商2得益厂商1得益(1,4)(3,3)(1,1)(4,1)(5,0)(5,0),(),(1),(),(11niininxxGiexGxxGeeG均得益为什均衡,各博弈方的平完美纳中一定存在一个子博弈次重复博弈,那么无限足够接近都成立,而对任意博弈方果的任意可实现得益。如表示用的纳什均衡的得益,记的静态博弈。用是一个完全信息理:设无限次重复博弈民间定4.3.3 无限次重复古诺模型 假定假定: ,边际成本都为2。 在无限次重复古诺模型中,当贴现率 满足一定条件

50、时,两厂商采用下列触发策略构成一个子博弈完美纳什均衡: 在第一阶段生产垄断产量的一半1.5;在第 t 阶段,如果前 t-1 阶段结果都是(1.5,1.5),则继续生产1.5,否则生产古诺产量2。 21,8qqQQP其中 设厂商1已采用该触发策略,若厂商2也采用该触发策略,则每期得益4.5,无限次重复博弈总得益的现值为: 如果厂商2偏离上述触发策略,则他在第一阶段所选产量应为给定厂商1产量为1.5时,自己的最大利润产量,即满足: 解得 ,此时利润为5.0625,高于触发策略第一阶段得益4.5。15 . 415 . 4222225 . 4max25 . 18max222qqqqqqq25. 22q

51、 但从第二阶段开始,厂商1将报复性地永远采用古诺产量2,这样厂商2也被迫永远采用古诺产量,从此得利润4。因此,无限次重复博弈第一阶段偏离的情况下总得益的现值为: 当 上述策略是厂商2对厂商1的同样触发策略的最佳反应,否则偏离是最佳反应。 140625. 540625. 52179140625. 515 . 4即第六章 完全但不完美信息动态博弈 6.1 不完美信息动态博弈6.1.2 不完美信息动态博弈的表示多节点信息集扩展形表示01(-7000) (-10000)(-16000) (-10000)运输路线扩展形1112好差卖不卖不卖买不买买不买卖(0,0) (0,0)(2,1)(0,0)(1,-

52、1)(-1,0)二手车交易扩展形6.1.3 不完美信息动态博弈的子博弈n因为原博弈本身不会成为原博弈的后续阶段,因此子博弈不能从原博弈的第一个节点开始,即原博弈不是自己的子博弈n包含所有在初始节点和终点,但不包含不跟在此初始节点之后的节点n不分割任何的信息集。1223LlRLRRLRLRL6.2 完美贝叶斯均衡6.2.1 完美贝叶斯均衡定义n在不完美信息动态博弈中纳什均衡和子博弈完美纳什均衡都不能解决问题,需要引进新的均衡概念n纳什均衡和子博弈完美纳什均衡分析方法,反应函数和逆推归纳法等同样也要改进、变化一个策略组合和相应的判断满足下列一个策略组合和相应的判断满足下列4个要求,个要求,称为一个

53、称为一个“完美贝叶斯均衡完美贝叶斯均衡”: 要求要求1 1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”。对非单节点信息集,一个“判断”就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信息集,则可理解为“判断达到该节点的概率为1” 要求要求2 2:给定各博弈方的“判断”, 他们的策略必须是“序列理性”的。即在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续策略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的得益或期望得益最大。此处所谓“后续策略”即相应的博弈方在所讨论信息集以后的阶段中,针对所有可能情况如何行为的完整计划 要求

54、要求3 3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策略决定 要求要求4 4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定6.2.2 均衡要求的初步解释1、判断的必要性2、序列理性要求实质是利益最大化要求3、判断与策略的一致性:符合策略和BAYES法则 (包括均衡路径和非均衡路径上)什么是“均衡路径上的信息集”? 在均衡路径上的信息集在均衡路径上的信息集:如果博弈按照均衡策略进行,则该信息集会以正的概率达到。 不在均衡路径上的信息集不在均衡路径上的信息集:博弈按均衡策略进行时绝对不可能达到,或者达到的概率为0。1、均衡策略组合:“博

55、弈方1第一阶段L,博弈方2第二阶段U” 均衡路径上判断均衡路径上判断:p=12、均衡策略组合:“博弈方1第一阶段R,博弈方2第二阶段D” 不存在与该策略组合一致的不存在与该策略组合一致的不在均衡路径上判断,因此该不在均衡路径上判断,因此该策略组合不可能构成完美贝叶策略组合不可能构成完美贝叶斯均衡。斯均衡。12L(p)M(1-p)UDUD(2,1)(0,0,)(0,0)(0,1)R(1,3)6.2.3 关于判断形成的进一步解释)|()()|()()|()()()|()()|(bspbpgspgpgspgpspgspgpsgp二手车交易为例1112好差卖不卖不卖买不买买不买卖二手车交易扩展形车况好

56、差:好车差车各占一半双方策略:好车一定卖,差车有一半概率卖出时选择卖325 . 05 . 015 . 015 . 0)|()()|()()|()()()|()()|(bspbpgspgpgspgpspgspgpsgp5 .0)()(5 .0)(1)|(bpgpbspgsp具体例子具体例子:三方三阶段不完全信息动态博弈23L(p)R(1-p)UDUD(1,2,1)(3,3,3,)(0,1,2) (0,1,1)1FB(2,0,0)6.3 单一价格二手车模型6.3.1 单一价格二手车交易博弈模型基本假设:1112好差卖不卖不卖买不买买不买卖(0,0) (0,0)(P, V-P) (0, 0)(P-C

57、, W-P)(-C, 0)单一价格二手车交易WPVcP6.3.2 均衡类型n市场完全失败:市场上所有的卖方,无论商品好坏,都选择不卖n市场完全成功:质量好的商品的卖方将商品投放市场,质量差的商品的卖方不敢将商品投放市场n市场部分成功:所有的卖方,无论商品好坏,都将商品投放市场,而买方也不管好坏商品都买进n市场接近失败:所有好商品的卖方都将商品投放市场,而只有部分“差”商品的卖方将商品投放市场,同时买方以一定的概率随机决定是否买进合并均衡分开均衡混成均衡6.3.3 模型的纯策略完美贝叶斯均衡1、市场部分成功的合并均衡n卖方选择卖,不管车子好差n买方选择买,只要卖方卖n买方的判断是条件:差车概率很

58、小 买到差车损失不大 伪装费用较小bgpsbppsgp)|(,)|(CP 2、市场完成成功的分开均衡n卖方在车好时卖,车差时不卖n买方选买,只要卖方卖n买方的判断为条件:0)|(, 1)|(sbpsgpCP 3、市场完全失败的合并均衡n卖方选择不卖n买方选择不买n买方的判断为:条件:1)|(, 0)|(sbpsgpPW 6.3.4 模型的混合策略混合策略完美贝叶斯均衡一、条件:PW CP 假设: 31)|(,32)|(sbpsgp5 . 01000,2000, 0,3000bgppCPWV二、市场接近失败的数字例子:n卖方在车好时选卖,车差时以0.5概率随机选择卖或不卖n买方以0.5概率随机选

59、择买或不买n买方的判断为均衡:市场类型归纳CP0市场部分成功市场接近失败或完全失败市场完全成功市场完全成功单一价格二手车交易的解)()(PWPPVPbg柠檬原理和逆向选择n允许价格变化n消费者支付价格低于期望价值n平均(期望)价值以上商品退出,市场上商品质量越来越差n消费者愿意支付的价格越来越低 柠檬原理和逆向选择是信息不完全导致的,对市场效率都是不利的。第七章 不完全信息静态博弈 7.1 静态贝叶斯博弈和贝叶斯的纳什均衡7.1.1 静态贝叶斯博弈的例子一、暗标拍卖n密封递交标书n统一时间公正开标n标价最高者以所报标价中标n中标博弈方的得益不仅取决于标价,还取决于他对拍卖标的物的带有很大主观性

60、的估计n每个博弈方的估价通常是自己的私人信息二、不完全信息的古诺模型不完全信息表现在不完全信息表现在: 厂商2的成本有两种可能,是厂商2的私人信息,厂商1只知道可能性(概率分布),因此厂商1对厂商2的得益不完全清楚。1)(222211121qcCqcCqcCqqQQaQPLH不完全信息古诺模型直接分析 )()1 ()(max)(max)(max11*2111*2122*122*1122qccqqaqccqqaqcqqaqcqqaLHqLqHq或者3)1(2)(632)()(6132)(1*11*21*2LHLHLLLHHHcccaqccccacqccccacq7.1.2 静态贝叶斯博弈的一般表

61、示n完全信息静态博弈的一般表达式:n静态贝叶斯博弈的一般表达式:,;,11nnuuSSG,;,;,;,;,;,1111111nnnnnnnuuppTTAAGuuTTAAG7.1.3 海萨尼转换nitaauuaaniTttttiniiniin, 1),(. 4,. 30. 2, 1,),(0. 1111各博弈方得益中选择行动方案同时从各自的行为空间个实际博弈方原来的静态博弈,即各在前述基础上,在进行博弈方的类型部分)博弈方知道其他全部或自己的类型,但不让(让每个实际博弈方知道博弈方,其中成向量取他们的类型,构方按随机方式或者说抽之前,为每个实际博弈择,其作用是在博弈方选可称为博弈方引进虚拟自然博

62、弈方,海萨尼转换把不完全信息博弈海萨尼转换把不完全信息博弈转换成不完美信息动态博弈转换成不完美信息动态博弈7.1.4 贝叶斯纳什均衡静态贝叶斯博弈策略定义:。中相应选择的行动将从自己的行为空间,博弈方类型抽取的各种为博弈方设定对于“自然”可能。函数的一个各种可能类型的一个策略,就是自己博弈方中在静态贝叶斯博弈iiiiiiiiiinnnnaAititStSTttiuuppTTAAG)()()(,;,;,;,1111贝叶斯纳什均衡定义贝叶斯纳什均衡纯策略的一个为则称策略组合都能满足所选择的行动,型和他的每一种可能的类中,如果对任意博弈方在静态贝叶斯博弈)(),()|(),(,),(,),(max)

63、(,;,;,;,*1*1*1*11*11111GSSSttpttStSaStSuatSTtiuuppTTAAGNtiiinniiiiiAaiinnnniii贝叶斯纳什均衡:贝叶斯纳什均衡:7.2 暗标拍卖jijiiijiiiiibbbbbvbbbvvvbbuu,当,当,当02/ )(),(2121)(21)(maxjiiijiiibbbPbvbbPbvi线性策略均衡0;)(jijjjjjbbPvcavbj的策略为设博弈方)(max)(max)(maxjjiiibjjijiibjjjiiibcabbvcabvPbvvcabPbviiijijjijiiiavaavavvb,当,当2)(7.5 混合

64、策略和不完全信息n海萨尼1973年结论:完全信息静态博弈中的一个混合策略纳什均衡,几乎总是可以被解释成一个有少量不完全信息的近似博弈的一个纯策略贝叶斯纳什均衡。n可理解为,混合策略的根本特征不是博弈方以随机方式选择策略,而是博弈方对其他博弈方的得益不完全确定。不完全信息夫妻之争 和 都是0,x上标准分布0, 00, 0时装妻妻子子丈夫丈夫足球足球时装不完全信息夫妻之争1 ,2wtht3 , 1,;,;,;,hwhwhwhwuuppTTAAG 0, 00, 0时装妻妻子子丈夫丈夫足球足球时装完全信息夫妻之争1 , 23 , 1wthtxhxxhxxhxwtxhxhxtxhxwxww10/)2(0)2(/)(,得益足球,得益时装妻子的临界值策略和得益妻子的临界值策略和得益丈夫的临界值策略和得益丈夫的临界值策略和得益xwxxwxwxxhxtxwxwxtxwxhhh01/ )()3(0)3(/,得益足球,得益时装均衡3392612393133926,2393xxxhxw,丈夫选足球:妻子选时装:x趋向于0时,上述两概率分布趋向于3/4和2/3。与第二章完全信息夫妻之争混合策略纳什均衡的概率分布同。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!