《博弈考试资料》PPT课件.ppt

上传人:za****8 文档编号:15810553 上传时间:2020-09-08 格式:PPT 页数:59 大小:1.05MB
收藏 版权申诉 举报 下载
《博弈考试资料》PPT课件.ppt_第1页
第1页 / 共59页
《博弈考试资料》PPT课件.ppt_第2页
第2页 / 共59页
《博弈考试资料》PPT课件.ppt_第3页
第3页 / 共59页
资源描述:

《《博弈考试资料》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《博弈考试资料》PPT课件.ppt(59页珍藏版)》请在装配图网上搜索。

1、期末考试,考试形式:开卷(满分90分)或闭卷(满分100分) 考试时间:第11周晚上上课时间 考试地点:上课课室 考试内容:在下面的六个内容中自选两个或以上的内容写一篇学习心得,要求800字以上。 1、囚徒困境 2、纳什均衡 3、理性假设 4、逆向归纳法 5、重复博弈 6、触发策略,第二章 囚徒困境与纳什均衡,一、经典案例囚徒困境 二、现实生活中的“囚徒困境” 三、纳什均衡与优势策略,本章内容,一、经典案例囚徒困境,经典案例囚徒困境,两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”: 如果两人都坦白则各判8年; 如果一人坦白另一人不坦白,坦白的放出去,不坦白的

2、判15年; 如果都不坦白则各判年。 这两个囚犯该怎么办呢?是选择互相合作(不坦白)还是互相背叛(坦白)?,1950年,斯担福大学客座教授、数学家图克(Tucker)为了形象地说明博弈过程,构造了著名的“囚徒困境” (prisoners dilemma)模型。,经典案例囚徒困境,囚徒困境的收益矩阵,两人都作出招供的选择,是其优势策略,最符合个体理性的选择。但收益却未必最大,这就是“困境”。 照博弈论的说法,这是本问题惟一的纳什均衡点。只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。这一点就是纳什均衡(Nash Equilibrium)。纳什均衡:局中人单独改变策略不会得到好处的对局

3、策略组合。 当博弈达到纳什均衡,并不一定是对参与者最有利的结果,更不意味着是对整个社会最有利的结果。,纳什均衡,纳什,在“囚徒困境”中表现最好的策略直接取决于对方采用的策略。独立于对方所用策略之外的最好决策是不存在的。 在博弈达到纳什均衡时,在外界环境没有变化的情况下,倘若各方坚持原有的利益最大化原则并理性面对现实,那么这种均衡状况就能够长期保持稳定。,经典案例囚徒困境,纳什,纳什均衡,纳什均衡是一种“不后悔”均衡。 张三和李四都想要加薪。假如只有一个员工要求加薪,老板会同意,但如果两个人都要求加薪,老板就会生气,并把两个人统统开除。 两个员工都不要求加薪并不是纳什均衡,因为当一方知道另一方没

4、有提出加薪要求时,就会后悔自己的选择。 两个员工都要求加薪也不是纳什均衡,因为两个人事后都会被开除而后悔自己的策略。 这场博弈有两个纳什均衡点,张三要求加薪而李四不要求;或李四要求而张三不要求。,二、现实生活中的“囚徒困境 ”,“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。 明宋濂宋文宪公全集记有一个故事: 玉寅生与三乌丛臣是朋友,他们曾歃血盟誓:“我辈应自励,他日入朝为官,绝不趋炎附势。如有违此誓,请神明惩罚。” 没多久,他们一起到晋国为官。当时赵宣子是晋王宠臣,各大夫均奔走于他家。玉寅生重申以前的誓言,三乌丛臣也说:“说过的话犹在耳畔,岂敢忘记!” 但三乌丛臣后悔当初的誓言,又怕玉寅生

5、知道。于是在一个大清早,鸡刚一报晓,他就前去拜望赵宣子。一进门,他忽然看到东边走廊有个人坐在那里,他走前举灯一照,那个人原来是玉寅生。,现实生活中的“囚徒困境 ”,现实生活中的“囚徒困境 ”,(升官或落选,升官或落选),(落选,升官),三乌丛臣,玉寅生,不巴结,巴结,不巴结,巴结,(升官,落选),(升官或落选,升官或落选),取决于谁巴结得更到位,如果巴结上司会有升官的机会,则其他人也面对同样的局面。假定两个人竞争一个官职,则,双方均巴结,则双方成本高;双方均不巴结,则双方成本低。然而“巴结”是双方的最佳的策略。,电信价格竞争的“囚徒困境”,学生的囚徒困境,数十道“减负令”难见效 中小学生课业负

6、担不减反增 仅1985年至2000年的15年里,中央就下达“减负令”49次。减轻中小学生过重负担喊了20多年,实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。 为什么数十道“减负令”难见效?,三、纳什均衡与优势策略,位置博弈,国美与苏宁为什么总喜欢贴身撕杀?,位置博弈,麦当劳和肯德基为什么总是相邻设店?,位置博弈,假设某条路上的顾客流量是均匀分布的,且顾客对麦当劳和肯德基无偏好,而总是乐意惠顾距自己最近的快餐店。,在顾客均匀散布的情况下,从资源的最佳配置来看,麦当劳、肯德基应该分别开在1/4、3/4处是最优,各自拥

7、有1/2的顾客量,同时顾客到快餐店的总距离最短。,位置博弈,出于理性考虑,肯德基肯定会想到:如果将店铺从3/4点处向左移一点,将从麦当劳抢夺走部分顾客。而麦当劳自然也想到从1/4点处向右移动以争取更多的顾客。,不难想象,双方博弈的结果将使他们的店铺设置在l/2中点附近达到纳什均衡状态,相依为邻且相安无事地做起快餐生意。这在博弈论中称为位置博弈。,位置博弈,现实生活中,在这条路上,顾客流量不是均匀分布的,那么这个模型是否就没有用了呢? 模型是现实的抽象,让我们更容易了解现象的本质以及分析的思路。 在现实应用中,我们可以加入其他约束条件以完善模型。 事实上,即使顾客流量不是均匀分布,结果并没有改变

8、。,政党的位置博弈,两个政党要决定自己究竟处于自由-保守意识形态的哪一个位置 假定选民平均分布在整个划分表的各个区间,并选举意识形态与自己相近的党派。为使问题具体化,我们把各个政治立场定为从0到100, 0代表极自由,而100代表极保守。,自由,保守,政党的位置博弈,在实践中,两党不可能选择完全一致的立场,但大家都在想方设法靠近中点。这一现象最早是由哥伦比亚大学经济学家哈罗德霍特林( Harold Hotelling)在1929年发现的。 霍特林指出经济和社会事务存在相似的案例:“我们的城市大得毫无经济效益,其中的商业区也太集中。卫理公会以及基督教长老会的教堂简直一模一样;苹果酒也是一个味道。

9、”,哈罗德霍特林,麦当劳与肯德基产品的位置博弈,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。 在你没有优势策略的情况下,你要做的就是:不能追求最佳,就要避免最差。即剔除所有劣势策略,不予考虑。如此一步一步做下去。 “重复剔除严格劣势策略”(iterated elimination of strictly dominated strategy)的思路:首先找出某博弈方的劣势策略(dominated strategy) ,把这个劣势策略剔除后,剩下的是一个不包含已剔除劣策略的新的博弈;然后在剔除这个新的博弈中的劣策略;继续这个过程,直到没有劣策略存在。 如果

10、剩下的策略组合是唯一的,这个唯一的策略组合就是“重复剔除占优均衡”(iterated dominance equilibrium)。,重复剔除的占优均衡,优势策略的选择迭代剔除劣势策略,麦当劳和肯德基的位置博弈为什么总相邻设店?,M,KFC,不管对手选择哪里,选2永远比选1好,因而选1是严格劣势策略。,不管对手选择哪里,选9永远比选10好,因而选10是严格劣势策略。,第四章 理性的困境,赵国洪 13602757107 ,课件邮箱 密码: 123456,理性的困境,经济学建立在两个假设前提上: (1)人是自私的,都在追求利益的最大化; (2)人是理性的,有推理能力。,自私的人是指他可以“损人利己

11、”,也可能“利人利己”,但并不会去“损己利人”、“损人损己”和“损人不利己”。,人是否聪明到了知道自己利益所在, 并知道追求利益的正确途径?,博弈游戏9:分钱博弈,游戏1 假设一个同学A捡到了100元,他想据为己有;可是另一个同学B看到了,于是威胁如果不分给他一部分,他就要向学校报告。如向学校报告,则这笔钱就要上缴,谁也得不到。 如果你是A,你分多少给B? 如果你是B,A分多少给你才接受? 请几位同学扮演A和B。,博弈游戏9:分钱博弈,游戏2 A和B提议怎样分割100元。如果B接受,这100元就按提议分割,博弈结束。如果B不同意,那么A必须决定是否再给出另一个分割提议。直到B同意提议或A不再给

12、出提议时,博弈结束。 请几位同学扮演A和B。,博弈游戏9:分钱博弈,游戏1:根据“理性人”的假定,A无论提出什么方案给B除了1分钱都不给B这种极端的情况,B只有接受,因为B接受了还有所得,而不接受将一无所获当然此时A也将一无所获。 游戏2:假设A一直会给出提议,直到提议给B分99元,自己拿1元才会停止。据此逻辑,B应该得到几乎整个“陷饼”。如果你是B,你会一直等到99:1的分割比例出现你才接受吗? 我们建议你最好不要这样。,博弈游戏9:分钱博弈,分钱博弈的现实试验,这是根据理性人的假定的结果,而实际则不是这个结果。 英国博弈论专家宾谟做了实验,发现提方案者倾向于提50:50,而接受者会倾向于:

13、如果给他的少于30%他将拒绝,多于30%则不拒绝。 这个博弈反映的是,“人是理性的”这样的假定在某些时候存在着与实际不符的情况。,博弈游戏9:分钱博弈,游戏3,A向B提议怎样分割100元。如果B接受,这100元就按提议分割,博弈结束。 如果B不同意,则A与B角色互换(即由B提出分配方案,A决定是否接受),但第二轮分割的钱会自动减少10元,即只剩下90元。 请几位同学扮演A和B。,博弈游戏9:分钱博弈,游戏3,假设第一轮中A向B提议分给B30元,B应否接受? B不应接受,因为第二轮时B可以接议分给A45元,则自己可获得45元。 所以第一轮中A应该根据逆向归纳法来确定分配方案,确保B在第一轮中接受

14、提议(即要向前展望,预测B在第二轮会提出什么方案)。 这个游戏与前面两个游戏不同之处便是这个游戏不再与自己的自尊或不公平感等情感因素相关。,博弈游戏9:分钱博弈,游戏4,如果还有第三轮呢?(即第二轮A拒绝,则进入第三轮,重新由A提出分配方案),博弈游戏9:分钱博弈,游戏5,如果还有第四轮、第五轮直到一方接受为止呢? 这变成一个不知道尽头的博弈。,第六章 逆向归纳法:向前展望,从后倒推,赵国洪 13602757107 ,强盗分赃,有五个海盗抢得100枚金币,在如何分赃问题上争吵不休。于是他们决定: (1)抽签决定各人的号码(1,2,3,4,5); (2)由1号提出分配方案,然后5人表决,如果方案

15、超过半数同意就被通过,否则他将被扔进大海喂鲨鱼; (3)1号死后,由2号提方案,4人表决,如果方案超过半数(不含半数)同意时方案通过,否则2号同样被扔进大海; (4)依次类推,直到找到一个每个人都接受的方案(当然,如果只剩下5号,他当然接受一人独吞的结果)。 假定每个强盗都是经济学假设的“理性人”,都能很理智地判断得失,作出选择。我们还假定每个判决都能顺利执行。那么,如果你是第一个强盗,你该如何提出分配方案才能够使自己的收益最大化?,强盗分赃,出乎意料的答案 1号强盗分给3号1枚金币,4号或5号强盗2枚,独得97枚。分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。,加薪谈判,

16、在博弈论的世界里没有仁慈或怜悯,只有一己之利。 在劳资博弈中,劳方是为了争取加薪,资方是为了确保员工能在工作上全力以赴。老板绝不会无条件为员工加薪,只有让老板相信对他有好处,员工才能得到加薪。 假如你对公司有所贡献,公司也依赖你。你希望加薪1000元,你对老板说,要是不加薪,你就跳槽。 假如你随意地跟老板说,那他就不会把你的跳槽威胁当真,除非老板认定,假如你得不到加薪,跳槽对你比较有利,这时他才会正视你的威胁。,加薪谈判,员工,老板,要求加薪,同意加薪,老板每年多付员工12000元,拒绝加薪,员工,不辞职,辞职,老板失去你,你需另找工作,老板不用多付薪金,加薪谈判博弈树,老板只有认为员工会选择

17、跳槽时和会考虑给你加薪,加薪谈判,让老板相信你的威胁,最好的办法就是向他证明另一家公司愿意每年多花12000元聘用你。(当然,如果真有其事,你就不必运用博弈论来要求加薪了。) 争取加薪的另一办法是自断后路,告诉公司里的每个人,如果你得不到加薪,你肯定会跳槽。你的目标是,把加薪不成而留任的局面搞得越尴尬越好。,绑架和诚实,如果你的孩子被绑架,你是否按绑匪的要求给付赎金? 如果你是绑匪,刚拿到赎金,你该不该释放人质?,绑架和诚实,假如人质的父母认为,绑匪会怕被判谋杀罪,所以会释放人质,那么父母就会相信,不管是否支付赎金,绑匪都会怕判谋杀罪而释放人质。 只有人质的父母相信付赎金可以增加孩子获释的机会

18、时,他们才会付钱。(只有职业绑匪才能认清这道理) 假如是职业绑匪,那么诚实守信会给他带来好处。职业绑匪必须让人质家属知道,过去只要家属按要求付钱,他就会放人,而且这也是唯一的选择。这样,家属大概只能如数付钱了。,是否宽恕罪犯?,假设你刚被抢劫了30元,而且你心理创伤远比财物损失大得多,例如你蒙受了大约9000元的精神损失。幸运地,劫匪被抓了起来,而且可能被判一年的徒刑。 如果你肯放弃控告,劫匪就愿意把身上所有的钱都给你,比如说3000元,那么你该不该接受劫匪的条件? 可以接受。假如劫匪躲过了牢狱之灾,将来他再抢劫你的机会是微乎其微。虽然赔偿金不足以弥补你的精神损失,可是如果他坐了牢,你就什么也

19、得不到。 不幸的是,要是用钱就能使受害人撤诉,劫匪就会越来越嚣张。,是否宽恕罪犯?,A.劫匪,不抢,相安无事,抢,B.外在因素,1%抓到劫匪,99%抓不到劫匪,劫匪平安无事,C.你,不提出控告,提出控告,劫匪坐牢,你没补偿,劫匪被释放, 你获得3000元补偿,是否宽恕罪犯?,在A点,劫匪先要决定是否抢劫你。假如他抢劫,那么外在因素在B点就会起作用。劫匪的直觉意识到,他在B点被抓的可能性只有1%。 假如在B点抓到劫匪,那么在C点你就要决定让他坐牢还是接受他3000元的赔偿。 从劫匪的观点看,假如你在C点接受3000元,那么抢劫你对他来说比较有利。因为劫匪即使不幸失手(1%机会),他也不会坐牢。尽

20、管被抓且赔偿你3000元对他并不划算,不过,他也会倾向于铤而走险。,是否宽恕罪犯?,只要劫匪知道,在C点用钱补偿你对你有利,他可能就会选择抢劫你。 因此,在博弈开始时,你就要给出可信的承诺,一旦劫匪被抓,你一定会让他坐牢。这样的承诺对你有利。但你不接受金钱补偿的承诺缺乏足够的可信性。 因此,必须由法律禁止你放弃诉讼来换取金钱赔偿,反而会让你从中受益。,旅行者困境,一个类似囚徒困境的经典博弈案例是哈佛大学巴罗教授提出的著名的“旅行者困境”: 两个旅行者从景德镇旅行回来,他们在同一间店买了同样的花瓶。提取行李时,发现花瓶被摔坏了,于是向航空公司索赔。 航空公司知道花瓶的价格大概八九十元,但不知道两

21、位旅客买花瓶的确切价格。于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。 如果两人写的一样,航空公司将认为他们讲真话,就按他们写的数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲的是真话,按低的价格赔偿,同时,航空公司对讲真话的旅客奖励2元,对讲假话的旅客罚款2元。,“旅行者困境”: 从100到0,巴罗教授通过这个虚拟案例,揭示了如果是人彻底理性、能够算计到十几步甚至几十步的话,那么他推论出的结果,很可能并不符合自己的现实利益。 巴罗教授提出这个案例旨在警世:一方面,它有启示人们在为私利考虑的时候不要太“精明”,告诫人们精明不等于高明,太精明往往会坏事;另一方面,它对理性行

22、为假设的适用性提出了警告。,罗伯特巴罗,魔瓶悖论,某日,你遇上了一个怪老头。怪老头拿出一个瓶子,说你可以买走这个瓶子,瓶子能满足你的各种愿望;但同时,持有这个瓶子会让你死后入地狱永受炼狱之苦,唯一的解法就是把这个瓶子以一个更低的价格卖给别人。 你会不会买下这个瓶子?你会以什么价格买下这个瓶子呢? 你当然不愿意花太多的钱,在你的愿望被满足之前你至少还得给自己留一点钱花;但你也不能花太少的钱,否则你会承担着卖不出去的风险。 但是,理性分析后,我们得出了一个惊人的结论:任何人都不应该以任何价格购买这个瓶子。,魔瓶悖论,严格的推理为什么会得到一个看似荒谬的结果呢? 这个推理有一个很强的前提条件,这也是

23、很多趣味博弈问题的基础假设每个人都是最聪明的,他们所做的决策都是最优的;并且每个人都知道,每个人都是最聪明的,都将选择自己的最优策略;并且每个人都知道,每个人都知道每个人是最聪明的;并且这样无限循环下去。 但现实生活中,这个假设明显不成立。或许每个人都绝顶聪明,但这一点并不是所有人都知道;即使所有人都知道,也不是每个人都知道所有人都知道。这就是所谓的不完全信息,它会对整个游戏的结果造成根本性的影响。,博弈游戏8: 饿狮博弈,请9位同学上台参与游戏。 9位同学是狮群里的狮子,且都十分饥饿。 9位同学排成一行,其从左至右的次序等于狮群里的地位等级,从左至右逐级下降。即左边排第一者的为狮王,右边第一

24、位为狮群里地位最低者; 现在再请一位同学上台,扮演绵羊。这只绵羊误闯狮群。 只有狮王才能吃绵羊,其他狮子不能吃。 狮王吃掉绵羊后,会打瞌睡;当狮王打瞌睡时,低其一级的狮子会吃掉狮王。但当其吃掉狮王后,它亦会瞌睡,低其一级的狮子也会吃掉它。依此类推,当一只狮子吃掉其上级时,其下级会吃掉它。 请问:狮王应该吃掉绵羊吗?请大家在纸上写出答案,写上姓名、学号及答案(吃或不吃),然后交上来。,博弈游戏9: 数数博弈,此游戏是否有先动优势?先走必胜的策略是什么? 逆向归纳法:每次给对手剩下3n+1个数是必胜策略。例如数30时,先报数者应当先报“1,2”,给对手剩下28个数。此后对手报1个数则自己报2个数,

25、对手报2个数自己报1个数。最后给对手剩下“27,28,29,30”4个数,即获胜。 如果改为每人每次可以报1个、2个或者3个数,取胜的策略有是什么? 如果每次可以报1个、2个、或者3个数,则每次给对手剩下4n+1个数是必胜策略。依此类推。,一、零和博弈,零和游戏游戏者有输有赢,但整个游戏的总成绩永远为零。 零和游戏:博弈当中的参与者,其利益可能严格对立,一人所得永远等于另一人所失。,零和游戏,零和游戏,两个经济学家散步,甲经济学家看见了一堆狗屎,思索着对乙说。你吃了这堆狗屎吧,我给你100万块钱。乙犹豫了一会儿,但还是经受不住诱惑,吃了那堆狗屎。当然,甲守信地给了他100万块钱。 过了一会,乙

26、也看见了一堆狗屎,就对甲说:你吃了这狗屎,我也给你100万。甲经济学家也经受不住诱惑,吃了那堆狗屎当然。乙把甲给他的 100万还了回去。 故事还没有完。走着走着,乙忽然缓过神来了,对甲说:不对阿,我们谁也没有挣到钱,却吃了两对狗屎甲也缓过神了,思考了一会儿说:可是,我们创造了200万的GNP阿!,随机策略,随机策略的最广泛用途在于以较低的监管成本促使人们遵守规则,同时解释了惩罚不一定要和罪行吻合的原因。 违章停车的罚金是正常收费标准的许多倍。设想一下,假如正常收费标准是1美元/小时,按每小时1. 01美元的标准进行处罚能不能让大家服服帖帖呢?有可能,条件是交通警察在你违章停车时一定能逮住你。而

27、这需要大量的交警,费用巨大。 监管当局有一个同样管用、代价又小的策略,就是提高罚金数目,同时放松监管力度。 假如监管属于随机性质,我们必须定出一个超过罪行本身的惩罚。规则在于,预期的惩罚应该与罪行相称,而这种心理预期应该将被逮住的概率考虑在内。 国税局的审查策略也是随机策略,警察与小偷之间的博弈,所选策略应当是随机的,不能让对方知道自己的策略,哪怕是“倾向性”的策略。 当博弈是零和博弈时,即一方所得是另外一方的所失时,对于任何一方来说,此时不可能有纯策略的占优策略。,零和游戏与混合策略,在博弈论中,可以选择出某个策略的纳什均衡,这个策略叫做纯策略。纯策略的纳什均衡只是博弈的一种特例。 所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。纯策略是参与者一次性选取的,并且坚持他选取的策略。,纳什定理与混合策略,所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。混合策略是参与者在各种备选策略中采取随机方式选取的。这就是纳什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!