运用潜意识

上传人:jin****ng 文档编号:147013613 上传时间:2022-09-01 格式:DOC 页数:16 大小:274KB
收藏 版权申诉 举报 下载
运用潜意识_第1页
第1页 / 共16页
运用潜意识_第2页
第2页 / 共16页
运用潜意识_第3页
第3页 / 共16页
资源描述:

《运用潜意识》由会员分享,可在线阅读,更多相关《运用潜意识(16页珍藏版)》请在装配图网上搜索。

1、耶鲁公开课博弈论笔记 第一节、名词解释优势策略(Dominant strategy ):不论其他局中人采取什么策略,优势策略对一个局中人 而言都是最好的策略。即某些时候它胜于其他策略,且任何时候都不会比其他策略差。注: 1、“优势策略”的优势是指你的这个策略对你的其他策略占有优势,而不是无论 对手采用什么策略,都占有优势的策略。2、采用优势策略得到的最坏的结果不一定比采用另外一个策略得到的最佳的结果略胜严格劣势策略(strietly dominated strategy):被全面的严格优势策略压住的那个策略, 也就是说不是严格优势策略以外的策略。弱劣势策略:原来不是严格劣势策略,但是经过剔除严

2、格劣势策略后,这个策略就成了严格 劣势策略。例:囚徒困境甲沉默(合作)甲认罪(背叛)乙沉默f合作)二人同服刑半年甲即时获释;乙服刑1D年乙认罪(背坂)甲服刑1D年;乙即时获释二人同服刑2年囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁, 并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选 择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作 出选择:若对方沉默、背叛会让我获释,所以会选择背叛。 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考

3、都会得出相同的结论选择背叛。背叛是两种 策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背 叛对方,结果二人同样服刑2年。例:协和谬误20 世纪 60 年代,英法两国政府联合投资开发大型超音速客机,即协和飞机。该种飞机机身 大、装饰豪华并且速度快,其开发可以说是一场豪赌,单是设计一个新引擎的成本就可能高 达数亿元。难怪政府也会被牵涉进去,竭力要为本国企业提供更大的支持。项目开展不久,英法两国政府发现:继续投资开发这样的机型,花费会急剧增加,但这 样的设计定位能否适应市场还不知道;但是停止研制也是可怕的,因为以前的投资将付诸东 流。随着研制工作的深入,他们更是无法做

4、出停止研制工作的决定。协和飞机最终研制成功, 但因飞机的缺陷(如耗油大、噪音大、污染严重等)以及运营成本太高,不适合市场竞争, 英法政府为此蒙受很大的损失。在研制过程中,如果英法政府能及早放弃,本来可以使损失减少,但他们没能做到。最 后,英国和法国航空公司宣布协和飞机退出民航市场,才算是从这个无底洞中脱身。这也是 “壮士断腕”的无奈之举。人们往往会陷入类似的误区:一项工作的成本越大,对它的后续投入就越多。其实不仅 是在制造协和飞机这样的重大项目上,就是在日常的生活中,人们在决定是否继续做一件事 情的时候,不仅是看它对自己有没有好处,而且也过于注意自己是不是已经在这件事情上面 有过投入。我们把那

5、些已经发生、不可收回的支出,如时间、金钱、精力称为“沉没成本”。沉 没的意思是说,你在正式完成交易之前投入的成本,如果一旦交易不成,就会白白损失掉。 但如果对沉没成本过分眷恋,就会继续原来的错误,造成更大的亏损。在第一节课中得出的五个结论:1、不要选择劣势策略2 、理性选择导致次优结果3 、站在他人立场分析他们会怎么做4 、先弄清你想要的,才能得到你想 要的5 、人人都是自私的第二节、囚徒困境的解决之道:1、多次博弈;2、设立规章制度,惩罚违规者;3、思想教育(效果 待定)。博弈的要素:参与者i;策略S;收益U。符号的定义:Si 表示参与者 i 的策略。 S-i 表示除参与者 i 以外其他人的

6、策略。 Ui 表示 i 的收益。名词解释: 共同知识:我知道这件事;你也知道这事;我知道你知道这事;你知道我知道你知道这事这 事;此后循环。案例:老师在课堂上让每位学生从1-100 中选择一个数字。选择到最接近全班平均数的2/3 的学生为胜利者。学生共有 50 个左右。胜利者平分奖金5美元。解决方案:st epl、假设每个人都选择100,平均数100*2/3 = 66.66。所以不能选择67-100 之间的数(严格劣势策略)。现实中有两名学生选择了。step2、剔除了 stepl中的严格劣势策略后,重复迭代,66*2/3 = 44。所 以不能选择44-67之间的数(弱劣势策略)。现实中有四名学

7、生选择了。step3、 44*2/3=29,所以不能选择29-44之间的数。现实中有13个左右选择了 30-34区间,。选择这个数区间的学生想法是 1-100平均数是50, 50*2/3=33, 所以选择33附近的数可能比较接近。这些学生低估了其同班同学的智商。step4、 29*2/3=19,所以不能选择 19-29之间的数。现实中有12个选择了。选择这个区间的学生就像螳螂捕蝉中的螳螂,却没有想到还有更多的黄雀在后。这么一直迭代下去,理论上如果所有学生都是理性人。平均数应当是1。现实中有12个学 生选择了1。应该说选择了1的学生都看出了这个博弈的窍门。但是他们的选择不是最接近 平均数的。因为

8、在现实中不可能所有人都是理性人。最终12是最接近平均数2/3的数。有9人选择了这个数。结论:迭代剔除劣势策略是个好的方法,但在现实中不能过度迭代。因为不是所有人都是理性人,而且不是所有人都有共同知识(概念见前述)。应用案例:中间选民定理两个政治候选人,为了选举须确定自己的政治立场。共有10个立场: 1、 2、 3、 4、 5、 6、 7、8、 9、 10。第个立场都有 10%选票。两个候选人要在一系列的政治主张中选择一个。规则:选民会投票给观点最相近的候选人。距离相等,该立场平分选票。候选者希望选票最 大化。st epl:试证明:S2优于S1。比较1号候选人选择S1,S2其利益U1的大小。当2

9、号候选人选择1号策略S1时U1(1、1)表示2号候选人选择S1, 1号候选人选择S1为50% U1(2、1)表示2号候选人选择S1, 1号候选 人选择S1为90%当 2 号候选人选择 2 号策略 S2 时U1(1,2)=10% U1(2,2)=50%当 2 号候选人选择 3 号策略 S3 时U1(1,3)=15% U1(2,3)=20%当 2 号候选人选择 4 号策略 S4 时U1(1,4)=20% U1(2,4)=25%下面 选择S2得票率都比S1大5%,所以S2严格优于S1。同理S9优于S10。step2:试证明:S3优于S2剔除劣势策略 S1, S10当2号候选人选择2号策略S2时U1(

10、2,2)=50% U1(3,2)=80%当 2 号候选人选择 3 号策略 S3 时U1(2,3)=20% U1(3,3)=50%当2号候选人选择4号策略S4时U1(2,4)=25% U1(3,4)=30%当 2 号候选人选择 5 号策略 S5 时U1(2,5)=30% U1(3,5)=35%下面 选择S3得票率都比S2大5%,所以S3严格优于S2。同理S8优于S9。所以S2是弱劣势策略,以下同理可证S4优于S3, S5优于S4。迭代剔除后将剩下S5, S6。结论:政治家为了赢得更多选票,尤其是大量关键的“中间选民”,会表现的趋中,各个政 治家之间的差别会变得很小。如美国选举时议题是: 0.3%

11、的税收差别,给不给移民发驾照, 同性恋能否结婚之类对生活不会有重大影响的事项。缺陷:在现实中每个立场的选民数非均匀分布;非所有人都投票;选民不只考虑政治立场 还有性格,甚至外貌;政治候选人的口号与实际行动未必一致;候选人不止两位。第三节、之前的几节课中,各个案例都是有严格劣势策略的。接下来的几个案例中没有严格劣势策略, 通过对这些没有严格劣势策略案例,可以模拟更复杂的现实情况,同时对数学的要求会加深。例:S1=u,m,d S2=L,R表格中的数值为 play1,2 选择不同策略时的得分,两个玩家都 想得到更高的得分。在这个博弈中没有严格劣势策略,因为当play2选择不同策略时,playl的策略

12、中没有一个 是始终劣势于其他策略的。我们可以用画图的方式来分析没有严格劣势策略时 Playl 应该如何选择策略的案例。如图:X轴P (r)表示、play2选择R策略的概率;Y轴表示playl的预期得分。当P (r)=0时,就是说play2选择L策略。playl选择u,m,d时的得分分别是5, 1, 3。当P (r) =100%时,就是说play2选择R策略。playl选择u,m,d时的得分分别是0, 4, 2。将这六个点分别在图中标出,然后连成直线。就得出了三个函数:U1(u,p(r)=5-5p(r);(playl 选择 u 策略时,得分随 play2选择 R 策略的概率变化而变化的函数)U1

13、(m,p(r)=3p(r)+1;U1(d,p(r)=-2p(r)+4.其中三条直线有三个交点,分别位于 P(r)=1/3; 1/2; 3/5 三处。结论:从图中可以看出,Playl要得分最高,要根据Play2的P (r)不同分三段来选择策略。当P (r)小于l/3时,应该选择u策略;当P (r)大于l/3小于3/5时;应该选择中间的 线外外代表的策略d;当P (r)大于3/5时,应该选择m策略。上面这个案例是一个纯理论阐述,下面介绍足球比赛中点球时,射手应该如何选择的问题。 这个案例的数据是基于实际比赛中的统计数据。例:点球表格中前列数字表示射手射中球的概率,如4表示40%中球率。L表示左,R

14、表示右,M表示 中。用前例中的方法画图:从图中可得出:为得到最高的点球成功率,当P(r)50%时,应该射手应该选择踢左边;当 P(r)50%时,应该射手应该选择踢右边;表示踢中路成功率的那条线始终没有最高概率, 所以射手最好不要选择踢中路。这个模型的缺陷:没有考虑射手踢球的习惯;没有考虑守门员守中路的情况(考虑三个要素 很复杂,而且中路是可以排除的严格劣势策略);没有考虑球速。比赛中的真实概率数据:守门员,射手最佳对策定义:Ui(S,S-i)=Ui(Si.S-i)或者S=Max Ui(Si,S-i)表示对手策略S-i的最佳对策。Si表示Play i的其它对策。第四节、例 合伙人博弈:2 个股东

15、都持有公司 50%股份;两者平分利润;每个股东要选择为公司投入多少时间,用工 作小时数代表双方策略 Si=(0,4)04 是连续的数,而非只能选整数,双方可以在 0 至 4 个小时之间选择。这家公司利润: 4*S1+S2+b*S1*S2(0b1/4);S1+S2 可以表示两个股东工作时间的简单相加对利润的贡献, b*S1*S2 可以表示由于两个股东相互协作对利润的贡献;考虑 到了这两个部分,所以这个公式可以很好的反映现实的情况所以,Ul(sl,s2)=l/24*(Sl+S2+b*Sl*S2)-Sl的平方。S1的平方表示股东1的努力成本假设 S2 给定 对 U1(s1,s2) 求导数 U1(s1

16、,s2)=2(1+bS2)-2S1 当 U1(s1,s2)=0 时 U1(s1,s2)值最大。所以当S1=bS2+1时,Ul(sl,s2)最大。也就是S1的最佳策略(BR)。同理S2=bSl+l是S2 的最佳策略。 BR 意为 best response 给定 b=1/4 画出 BR 的函数图在 0S11 和 2S14 这两个区间里 play1 没有最佳策略,所以 play1 不会选择这两个区间 从图上可以看出BR2(S2)只能选择红色一段。同理BRl(Sl)也只能选择红色一段。将剩下的红色区间放大,并重复上一阶段剔除,如图:在lSl5/4和3/2Sl2这两个区间里playl没有最佳策略,所以

17、playl不会选择这两个 区间,从图上可以看出BR2(S2)只能选择红色一段。同理BRl(Sl)也只能选择红色一段。不断重复以上过程,最终会得到两直线交叉的那一点:Sl=S2=l/(l-b)结论: 1、在合伙中,个人的努力获得的边际效益不断减少,所以每个人都倾向于少工作;2、 协同程度减少,会使人减少努力。在这个案例中S1=S2这个点就是著名的纳什均衡点(每个人都采用了各自最佳策略,或者说 如果某情况下无一参与者可以独自行动而增加收益)。 Page 1耶鲁大学公开课:博弈论习题集 3 (第 6-7 讲内容)Ben Polak, Econ 159a/MGT522a.由人人影视博弈论制作组 Dar

18、rencui 翻译线性城市模型:差异产品的价格竞争:在课堂中我们学到了两种双寡头垄断竞争模型:古诺 (产量)竞争模型和伯川德 (价格) 竞争模型。把企业间的竞争考成价格竞争的情况似乎更合情合理一些,然而古诺的结论却比伯川德 的结论更令人信服。在这次习题集中我们来探讨一下第三种寡头竞争模型。和伯川德模型类似, 这个模型中两家公司会进行价格竞争而非产能竞争。但与伯川德模型的不同之处在于,本模型中 两家 公司的产品并不是同质产品。用经济学的行话来说,产品之间是存在差异的。这次我就不在 板书上给大家讲解如何分析这个模型了,各位不妨独自求索。大家也不必惊慌,本次习题集采用 循序渐进的模式。请各位按照顺序

19、依次回答每个问题。首先介绍博弈? 模型中我们假设一座城市是一条街道 (一条线段)? 有两家公司:公司 1 和公司 2 。他们分别位于街道(线段)的两端- 两家公司同时分别制定产品价格 和- 两家公司的边际成本是一个常数- 每家公司都追求利润最大化? 潜在顾客平均分布在这条街道上,在每一点上都有一个潜在顾客- 顾客总数为 1 (或者可以把它理解成整个市场份额)? 每位顾客都只购买 1 单位的产品,要么买公司 1 的,要么买公司 2 的。也就是说总 需求是1 单位产品。? 处于位置 的顾客她与公司 1 的距离是 而与公司 2 的距离是- 当且仅当满足下列条件时,她会选择公司 1 的产品a)当且仅当

20、满足下列条件时,她会选择公司 2 的产品b)如果恰好位于两家公司正中间时,她就抛硬币决定买哪家公司的产品对于模型的解读:顾客需要同时考虑价格和与公司的距离这两个因素。如果把线段想象成现 实中的道路的话,我们可以用 距离 来表示到该公司的交通成本。或者,如果把线段想象 成产品某方面的质量(比如冰激凌中的脂肪含量),那么此时 差异 就表示产品实际体验与顾 客最佳预期之间的差异。从顾客的角度上看,参数 越大,那么两家公司生产的产品的差异也就 越大。如果 ,那么这两种产品就是完全替代品。Open Yale Course |人人影视博弈论制作小组 Darrencui 翻译 1 Page 2面我们需要考虑

21、什么呢?2如果公司2定价为。公司1如何定价才能垄断整个市场 (也就是说给定一个, 为何值时所有顾客都从公司1 购买产品)?假设公司1通过定价高于问题2 的答案能获得更多的收益,那么坏消息是这样做公司 1 必须放弃一部分市场份额;好消息是每一位公司 1 的顾客都会付更多的钱。3假如 和 非常接近,导致两家公司分摊市场份额 (不一定是平均分摊)。通过表 达式(a)和(b)我们可以找到一个对于购买公司1还是公司2产品完全中立的顾客。用你的答案来说明一下,在两家公司分摊市场情况下,市场对于公司 1 产品的需求是:c)由此我们就得到了当公司2 定价为 时,计算公司 1 的最佳对策所需的全部数据了。 市场

22、被分摊时,公司 1 的利润如下:d)其中 表示收入, 表示成本4.通过表达式(c)和(d),运用简单的微积分知识即可发现,在不取极端值时:5绘制公 司 1 和公 司 2 的最 佳对 策图 线。 在图像中 指出当 和时会发生什么样的变化?提示:运用一下问题1和问题2 的答案并在同一个图像中 绘制出的图像。6通过算术方法找出纳什均衡。7当时纳什均衡是什么?请给出你的答案。有人认为:“当产品相似度叫小而差异较大时竞争的激烈程度就会减弱。”这一点在本模型中是如何体现出来的呢?Open Yale Course |人人影视博弈论制作小组 Darrencui 翻译 2 Page 3几个博弈论结论:(A) . 公司希望产品存在差异。这样公司可以定更高的价格和获得更高的利润。这个想法很 简单,因为新进入市场的公司会终结这种高利润的情况。(B) . 考虑问题时 “现实一点”就可以得出更有说服力的结论。当我们排除了完全替代品这一个极 端假设后,这个模型就更具有现实意义了。(C) . 我们研究模型的方法是很典型的。这个模型是一个足够复杂的模型,因为初次遇到这 个模型的时候大家并不知道结果会是怎样的。然而通过按照我们在课堂上讲的方法(找出最佳对策 然后求出交点在哪里等)进行分析后,这次习题集是不是就很容易解答了呢?Open Yale Course |人人影视博弈论制作小组 Darrencui 翻译 3

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!