博弈论的基本概念

上传人:ba****u 文档编号:164529791 上传时间:2022-10-25 格式:DOCX 页数:8 大小:27.04KB
收藏 版权申诉 举报 下载
博弈论的基本概念_第1页
第1页 / 共8页
博弈论的基本概念_第2页
第2页 / 共8页
博弈论的基本概念_第3页
第3页 / 共8页
资源描述:

《博弈论的基本概念》由会员分享,可在线阅读,更多相关《博弈论的基本概念(8页珍藏版)》请在装配图网上搜索。

1、博弈论的基本概念 博弈论是研究两人或多人谋略和决策的理论。 博弈论思想古已有之,我国古代的孙子兵法就不仅是一部军事著作, 而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博 中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发 展,正式发展成一门学科则是在20世纪初。1928年冯诺意曼证明了博弈 论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯诺意曼和摩 根斯坦共著的划时代巨著博弈论与经济行为将二人博弈推广到 n 人博 弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和 理论体系。纳什的开创性论文n人博弈的均衡点(1950),非合作 博弈(195

2、1)等等,给出了纳什均衡的概念和均衡存在定理。 此外, 塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展 成一门较完善的的学科。 参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与 者可以是自然人,也可以是团体。 信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指 所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说 是共同知识。 策略:策略是参与者

3、如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用 si 表示参与者 i 的一个特定策 略,用Si表示参与者i的所有可选择的策略的集合(又成为而i的策略空 间)。如果n个参与者没人选择一个策略,那么s= (si,s2,sn)称 为一个策略组合。 收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常 用 ui 表示参与者 i 的收益,它是策略组合的函数。 均衡:均衡是所有参与者的最优策略组合,记为 s*。几个经典的博弈实例 例一 囚徒困境 两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至 少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审

4、讯, 并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度, 因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白, 根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。囚 坦白徒一 沉默-6, -60, -9-9, 0-1, -1沉默坦白 例二 海滩占位 甲、乙两个冷饮摊贩,他们在一个直线状的海滩上,以 同样的价格,相同的质量向均匀散布在海滩上的众多游客销售冷饮。既然 是做生意,目的总是多赚钱,甲乙两人有时在同一地点做同样的生意,竞 争是难免的,这两个摊贩应该怎样安排自己的摊位,才能相安无事的做自

5、 己的生意?(假定游客总是到据自己最近的摊位购买冷饮)。 例三 智猪争食 猪圈里有一头打猪和一头小猪。里面有一个猪食槽,槽 的对面装有控制开关。只要去拱开关,就会有一次 6 个单位的饲料流进槽 里。如果它们都不去拱开关,那么它们都吃不到饲料;如果小猪去拱,那 么等到它跑回来时,大猪已把饲料吃光了;如果大猪去拱,等它回来时可 以吃到1 个单位的饲料;如果他们一起去拱,在一起跑回来,那么大猪可以抢到4 个单位的饲料,小猪也能吃到 2 个单位的饲料。假定每拱一次开关需要消耗 0.5 个单位的饲料能量。它们长期一起进食,上面所说的情况两只猪都知道。它们应该如何选择?小猪 拱 不拱大猪拱不拱3.5, 1

6、.50.5, 56, -0.50, 0完全信息静态博弈 静态博弈:静态博弈指的是博弈的参与者同时选择各自的行动,即便是选 择行动有先后的话,后行动者也不知道先行动者所采取的行动。博弈的标准表述(策略表述)含有三个要素(1)博弈参与者集合ie N;(2)每个参与者的策略空间Sj; (3)每个参与者的收益函数ui。定义:在一个有n个参与者的博弈中,参与者的策略空间S,S2,Sn,收益 函数为片,幻,un,称G=S,S2,Sn;片,幻,uj为此博弈的一个标准表 述。定义:如果对任一 si e Si,si丰 Sj*,不等式 UjG,.%, Sj*, si+1,.,Sn) ui(s1,_,si-1, S

7、i ,si+1,.,sn)对所有的策略组合(s1,.,si-1, si+1,.,sn)都成立,那么 si*称为参与者i的严格占优策略。定义:在博弈的标准表述中,如果对所有的参与者i eN, si*是i的严格占优策略,那么策略组合S*=(S*,Sn*)称为严格占优策略均衡。定义:在标准表述的博弈中,设Si和s是参与者i的两个可选策略,若Ui(Si,.,Si_i,Si,Si+i,.,Sn)VUi(S,.,Si-i,对所有的策略组合(Si,.%, si+i,.,sn)都成立,那么称Si是相对于Si的严格劣策略。定义:如果S*=(S1*,Sn*)是逐步剔除严格劣策略剩下的唯一策略组合,则该策略称为逐步

8、剔除严格劣策略均衡。参与者2左中右1,01,20,10,30,12,01左中参上1,01,2与下0,30,1者1左中参上1,01,2与下者中右3, 34, 11, 24, 00, 21, 11, 42, 32, 4面的这个博弈中既不存在严格占优策略均衡,也不存在逐步剔除严格劣策 略均衡,对这样的博弈引入纳什均衡的概念。定义:在博弈 G二S,S2, .,Sn; U,U2,un,策略 s* = (si*,,si*,Si*,si+1 *,,sn*)满足条件:对每一个参与者i,都有对所有的si e SpUi(S*, .,Si 1 *, Si,Si + 1 *,,Sn*) Ui(S*, .,Si 1 *

9、,Si*,si+1 *,,sn*)成立,则称s*为该博弈的一个纳什均衡。 严格占优策略均衡、逐步剔除严格劣策略均衡与纳什均衡的关系:严格占 优策略均衡是纳什均衡;逐步剔除严格劣策略均衡是纳什均衡;反之不然。完全信息动态博弈 动态博弈:各参与者的行动有先后顺序,而且后行动者在自己行动之前能 观测到先行动者的行动。定义:完全信息扩展式博弈形式是一个三元组F= (N,H,P):其中N是参 与者的集合。H是A (行动的集合)中元素组成的序列的集合并且满足:(1)空序列() eH ;(2)如果一个 h eH ,则 h|k eH , h|k 表示 h 的长度为k的子序列;(3)如果一个无穷序列的所有有穷子序列都属于H, 那么h也属于H。P: H/Z N,其中ZcH且h eZ当且仅当任给h eH , 若 h Ik =h 则 h =h。对于n个参与者有限战略的扩展式表述有一种直观的图形方法,就是博弈树。设G=(ui: Z R, F= (N,H,P)扩展式博弈形式,我们称 F,( ui ) i N)为一个扩展式博弈。0,0) (2,1)

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!