博弈论发展简述

上传人:ba****u6 文档编号:159122534 上传时间:2022-10-08 格式:DOCX 页数:4 大小:14.59KB
收藏 版权申诉 举报 下载
博弈论发展简述_第1页
第1页 / 共4页
博弈论发展简述_第2页
第2页 / 共4页
博弈论发展简述_第3页
第3页 / 共4页
资源描述:

《博弈论发展简述》由会员分享,可在线阅读,更多相关《博弈论发展简述(4页珍藏版)》请在装配图网上搜索。

1、博弈论发展简述博弈论,又称为对策论,英文名称为Game Theory,是研究主体行为发生直接相互作用时的决策以及这 种决策的均衡问题的理论oGame 一词在英文中的基本意思时游戏、比赛,故而在博弈论刚被介绍到中国时, 有的学者根据其英文名称,直译其为游戏理论。博弈的“博”字是竞争的意思,“弈”是对弈,是一种关于 在竞争中选择策略,争取最好结果的技艺。其实,博弈论是用严谨的数学模型来研究现实世界中冲突对抗条件下最优决策问题的理论,最初发源 于数学。自 20 世纪 40 年代,博弈论从数学家之手产生之后,就很快被借用到经济学领域,并在几代经济 学大师的研究和推动之下,广泛应用于经济学、社会科学、管

2、理科学、国际政治、生态学工商业活动以及 人们的日常的生活之中。博弈论的创始者是匈牙利的天才数学家冯诺依曼(19031957),他不仅是经济博弈论的创立者,同 时也是计算机的发明者。20世纪初,冯诺依曼、塞梅鲁(Zemelo)、鲍罗(Borel)就开始研究博弈的准确 的数学表达。1939年,冯诺依曼和经济学家奥斯卡摩根斯坦(Oskar Morgenstem)合作,从而使博弈论进 入经济学的广阔领域 1944年,二人共同出版了著作博弈论与经济行为,书中介绍了博弈的理论和方 法,提出了标准型、扩展性和合作型博弈模型解的概念和分析方法,从而奠定了博弈学科的利率基础,标 志着现代系统的博弈理论初步形成,

3、也象征着博弈学科的正式建立。20世纪50年代,合作型博弈的研究 和应用达到顶峰。但是,诺依曼的博弈论的局限性在于,由于过于抽象,大大限制了它的应用范围,在相 当一段时间里,人们对博弈论的研究很少,只是少数数学家的专利,影响力有限。正在此时,另一位博弈论大师纳什(Nash)博士于1950年11月在美国全国科学院的每月公报上刊登 了两篇论文,将冯诺依曼的“最小最大原理”推广到非合作博弈领域,找到了普遍化的方法和均衡点, 其理论比冯诺依曼的合作博弈论更能反映现实的情况。非合作博弈思想,即“纳什均衡”理论的提出, 标志这博弈理论新时代的开始。作为一位天才人物,纳什从上大学开始就从事纯数学的博弈论研究。

4、后来, 他在经济博弈论领域做出了划时代的贡献。他提出的纳什均衡的概念在非合作博弈理论中起着核心的作用, 其后续的研究者对博弈论的贡献,几乎都是建立在这一概念之上的。由于纳什均衡的提出和不断完善,为 博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。自20世纪50年代以来,由于纳什、泽尔腾(Selten)、海萨尼(Harsanyi)等人的努力,使博弈理论逐 渐成熟并进入实用。尤其在经济学领域,博弈论引发了经济学的“博弈论革命”博弈论的概念和方法改造 了经济学的思维,也从而推进了经济学的研究。1994年诺贝尔经济学奖授予纳什、泽尔腾和海萨尼3位博 弈论专家,有力地

5、证明了博弈论在现代经济学研究中的地位,也进一步激发了人们了解博弈论的热情。博 弈论作为现代经济学的前沿领域,已经成为占据主流地位的基本分析工具。博弈论在 20 世纪 40 年代产生时,最初是运筹学的一个分支,是较纯粹的数学方法,但是由于其理论 的普遍性,被逐步推广应用到许多研究领域,尤其是在经济学领域,博弈论改变了经济学家的思维方式, 至今引领着该领域的前沿。同时,对博弈论的研究也就方兴未艾,各种博弈理论分支更是层出不穷,演化 博弈论就是一个时期以来在原有的理论基础上发展起来的博弈论家族中的热门和新兴分支。博弈论的组成要素博弈论由3个基本要素组成:一是决策主体(player),又可译为参与人、

6、局中人或博弈方。指的是博 弈中能独立决策、独立行动并承担决策结果的个人或组织。小到一个人,大到一个跨国公司乃至一个国家, 只要能独立决策和行动,都可以成为一个博弈方,形成决策主体;二是给定的策略空间(strategy space), 就是信息结构,又叫策略集,指参与人可选择的策略和行动空间,是可选择策略的集合。每一个策略都对 应一个相应的结果,因此每个博弈方可选择的策略数量越多,博弈就越复杂;三是效用( Utility) ,是可以 定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数。上述参与人、策略 空间和效用3 个要素就构成了一个基本的博弈。博弈理论认为,一个完整的博

7、弈应当包括一下五个方面的内容:第一,博弈的参加者,即博弈过程中 独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资 料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先 后顺序;第五,博弈方的收益,即博弈方做出决策选择后的所得所失。常见的博弈类型通过博弈论学者们的研究归纳,通俗地讲,常见的博弈类型有以下几种:第一种是合作博弈和非合作 博弈。二者的主要区别在于参与者之间的博弈行为相互作用时,他们能否达成一个具有约束力的协议,如 果有,就是合作博弈,如果没有,就是非合作博弈。合作博弈强调的是团体理性、效率、公正和诚信

8、,非 合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的;第二种是重复 博弈和非重复博弈。非重复博弈就是博弈的双方博弈之后各自走人,从此不会再来博弈。重复博弈则具有 连续性的特点,同一博弈可以重复下去。非重复博弈由于是一次性的,所以容易出现欺诈等道德问题,而 重复博弈由于是连续性的,所以道德和规则的约束力较强,参与者不仅要追求一次博弈的目标最大化,而 且要追求多次博弈平均目标的最大化,这就会迫使参与者高度重视信誉,并由对抗走向合作;第三种是零 和博弈和非零和博弈。零和博弈的特点是博弈双方的成本和所得会相互换位,也即:你的所失正是我的所 得,反之一样。不具有这样特征的

9、博弈就是非零和博弈。第四种是静态博弈和动态博弈。参与双方同时决 策或同时行动的,叫静态博弈,决策或行动有先后顺序的叫动态博弈。显然,有没有先后顺序,博弈结果 和采取的策略是不同的;第五种是完全信息博弈和不完全信息博弈。信息就是知识,但不是一般的知识, 是指与决策目标和决策对象有关的特定信息,是参与人有关博弈的知识。按博弈双方拥有的程度分为: 完全信息:博弈双发对产生博弈的事情的知识都是共同知识;对称信息:博弈双方有关信息的掌握程度 是相等的;不对称信息:博弈双方对实现某一个目标所掌握的信息及采取的策略掌握程度不同,信息在 双方之间的分布是不均匀、不对称的。博弈论的经典模型:囚徒困境囚徒困境(P

10、risoner s Dilemma )。“囚徒困境”至今仍然是博弈研究的重要课题。这个故事是说, 两个罪犯犯罪后被抓,分别关押,不能见面,警察审问时分别对他们说,坦白吧,坦白你会被放走,你不 坦白另一个人坦白了,你将被判10 年。实际上两个囚徒面临的情况是:一个坦白,另一个不坦白,坦白的 将被释放,不坦白的会判10 年;如果两个人都坦白,各判5年;两个人都不坦白,都放。根据理性人的假 设,甲乙两个罪犯都会寻找自己最优目标,那就是自己被释放。如果两个人都不坦白,都会被释放,但甲 会想:如果我不坦白,乙坦白了,他会被释放,我要判10 年。我坦白了,不管乙是否坦白,我最多判 5 年, 也有可能乙不坦

11、白,我被释放。罪犯乙其实也是这么想。结果他们都坦白了,分别判了 5 年。在坦白这一 点上形成策略均衡,实现了目标最大化。实际上囚徒困境这个模型揭示了合作与竞争(或叫对抗)的关系 道理。囚徒困境的情况在生活中最常见的就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效 率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤。其中的纳什均衡就是大家 都挤,结果上车更慢了,每个人采取的都是最优战略,但是结果却是最劣,原因在于个人理性和集体理性 之间存在着冲突。博弈论的经典模型:智猪博弈智猪博弈(Boxed Pigs)。有两头猪生活在同一猪舍里,一头大猪,一头小猪,共用一个长食槽。食

12、槽 的一头有一个开关,猪用嘴一拱,食槽的另一端会掉下包子。假定按一下会掉下10 个包子,而跑去按开关 的猪会耗费两个包子的能量。如果小猪按开关,大猪先吃,等小猪按完跑过来时,大猪会吃掉 9 各包子, 小猪只能吃到 1 个;如果大猪先按开关,按完后跑过来,小猪会吃掉4 个包子,大猪可以吃到6 个。如果 不去按开关,就会被一起饿死。这个模型的最优策略组合只有一个答案:在任何情况下,都要大猪按开关, 小猪等待。因为这样,大猪会吃到6 个包子,减掉耗费掉的2 个,剩4 个,与小猪一样。但让小猪按开关, 它只能吃到1个包子,减掉耗费的2 个,亏1个。智慧型的猪不会干赔本的买卖。但如果大猪也不动,只 能双

13、双饿死。这个模型也解释了在博弈过程中,多劳者不一定多得。博弈论的经典模型:情侣博弈情侣博弈。假定一对热恋中的情侣,每周末见一次,必须见,否则活不下去。男的喜欢看足球,女的 喜欢看电影。见面后,面临选择,看足球还是看电影?热恋中的情侣因为爱,会牺牲自己的爱好去满足对 方。如果去看足球,男的满足程度为四个单位,女的满足程度是两个单位;去看电影,女的满足程度是四 个单位,男的满足程度是两个单位。在这个博弈中,有三个变量非常重要。一个变量是顺序,就是谁先提 出来,比如男的先提出来,女方尽管更愿意看电影,但是男方已经提出来了,她不愿意违背他,只好同意, 结果他们就去看足球。相反的情况也是一样。第二个是一

14、次博弈还是多次博弈。如果是多次博弈,双方就 会大体上形成一种默契,这一周看电影,下一周看足球。第三个取决于感情的深度。处于依赖程度比较高 的一方,对对方更加顺从照顾一些。一般而言,情侣之间的博弈是一个动态过程,因为恋爱就是双方之间 较长时期的磨合、了解过程。如果我们假定情侣博弈是一个动态博弈,而且总是男的先决策,女的后决策, 那么就会出现一种非常有趣的决策情景。就女方来说,无论男的是选择足球,还是选择电影,她的决策均 为四个:一个是追随决策,就是男的选择什么,她就选择什么;二是对抗策略,就是男的选择什么,她偏 不选什么;三是偏好策略,就是无论男的选什么,她都选电影,因为这是她的偏好;四是成全策

15、略,就是 无论男的选什么,她都选足球,因为足球是男的偏好,她宁可牺牲自己的偏好,而成全男方。情侣博弈在 现实生活中到处存在,它让人们思考如何人去关心别人、理解别人,处理好人际关系。博弈论的经典模型:斗鸡模型斗鸡博弈(Chicken Game)在西方,鸡是胆小的象征,斗鸡博弈指在竞争关系中,谁的胆小,谁先失 败。现在假设,有两个人要过一条独木桥,这条桥一次只能过一个人,两个人同时相向而进,在河中间碰 上了。这个博弈的结果第一种就是如果两个人继续前进,双方都会掉水里,双方丢面子,这是一种组合。 第二种是,双方都退下来,双方也都是丢面子,但是都掉不到水里去。第三种结果,甲方退下来,丢面子, 乙过去。

16、第四种结果,乙退下来,丢面子,甲顺利通过。在这四种结果中,第一种是两败俱伤;三、四两 种是一胜一败,第二种是两败不伤,这就是斗鸡博弈。在这个模型中,最优策略有两个,就是第三、第四 两种选择,即甲退下来乙先过去,或者乙退下来甲先过去。因为两种选择对整个社会来说效益最大,损失 最小。两虎相争勇者胜,如何处理竞争中的两虎关系呢?一般有四种办法:第一种是谈判,双方约定一个 条件,其中一个先退下来;第二种是制度,建立一种制度,规定从南到北的先退,或者从北到南的先退, 或者后上桥者先退;第三种是时间,双方僵持一段时间,谁先吃不住劲谁先退;第四种是妥协,妥协不一 定是最优策略,但是至少可以保证取得次优结果。

17、在工作生活中乃至处理国际关系时,得饶人处且饶人, 退一步还扩天空,都是从斗鸡博弈可以总结出的道理。博弈论的经典模型:威慑模型威慑博弈的完整名称是进入威慑博弈,是研究参与者想进入某领域,而与该领域已有竞争者的博弈模 型。假定有两个参与人,一个想进入某行业,称之为进入者,另一个已在同一行业占有一席之地,称之为 先入者。对进入者来说,不管先入者是否设置壁垒,其最优目标都是进入。而对先入者来说,要设置壁垒 必须付出巨大成本,否则不如默许。进入威慑博弈模型的启示是:要做一件事情,必须确定一个可行的目 标,不怕困难,全力以赴向目标努力,目标就会实现。另外,不是所有的威慑都没有用处,付出巨大成本 的威慑是起作用的,而要想使威慑起作用的,必须付出巨大成本。同时,进入威慑博弈也提出了一个问题 就是威胁和承诺的可信度问题,威胁实际上也是一种承诺。威胁和承诺是否可行,取决于其成本的大小, 取决于其成本和收益的比较。一般而言,成本巨大的,或者成本高于收益的威胁和承诺,可信度就比较高 反之则低。实际生活中有些制度见效甚微,就是因为惩罚力度太小,使得违规者的违规收益高于违规成本。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!