序贯决策分析培训课件

上传人:痛*** 文档编号:145329728 上传时间:2022-08-29 格式:PPTX 页数:52 大小:2.03MB
收藏 版权申诉 举报 下载
序贯决策分析培训课件_第1页
第1页 / 共52页
序贯决策分析培训课件_第2页
第2页 / 共52页
序贯决策分析培训课件_第3页
第3页 / 共52页
资源描述:

《序贯决策分析培训课件》由会员分享,可在线阅读,更多相关《序贯决策分析培训课件(52页珍藏版)》请在装配图网上搜索。

1、第六章第六章 序贯决策分析序贯决策分析第一节第一节 多阶段决策多阶段决策一、多阶段决策问题一、多阶段决策问题 在经济活动中,常常遇到这样的决策问题,由于它的特殊性,需要将过程分为若干个相互联系的阶段,在它的每一个阶段都需要做出决策,从而使整个过程达到最好的活动效果。当各个阶段决策确定后,就组成了一个决策序列,因而也就决定了整个过程的一条活动路线,这种把一个问题可看作是一个前后关联的具有链状结构的多阶段过程就称为多阶段决策过程。第一节第一节 多阶段决策多阶段决策 二、多阶段决策方法二、多阶段决策方法 解决多阶段决策问题的主要方法是决策树方法和动态规划方法,决策树由节点和分支组成,每一条由树根通往

2、树梢的路线都表示一种决策方案及可能遇到的一种情况。进行决策分析时,要由树梢往树根依次计算。这种从后到前进行决策分析的方法叫做逆序归纳法。多阶段决策分析的步骤:(1)根据具体问题适当划分阶段;(2)确定各阶段的状态变量,寻找各阶段之间的联系;(3)由后到前用逆序归纳法进行决策分析。第一节第一节 多阶段决策多阶段决策 三、应用举例三、应用举例 例例6-16-1 离散情况决策分析。某企业考虑是否花费4000元钱从某科研机关购买某项技术然后产销新产品。如果买技术,可以进行大批生产(a1),中批生产(a2),或小批生产(a3),可能出现的市场销售情况也分为畅销()一般()和滞销()三种。其收益(利润,元

3、)矩阵如表6-1 123第一节第一节 多阶段决策多阶段决策表表6-1 6-1 某公司产销新产品的收益矩阵某公司产销新产品的收益矩阵第一节第一节 多阶段决策多阶段决策 为了更正确地了解市场情况,正式投产前可先生产少量产品试销。由于要增添少量生产设备等原因,试销费需要600元。由于试销前未作广告,顾客对产品不太了解,加之试销量较小,试销结果不很准确。假设试销结果分为产品受欢迎(H1),一般(H2)和不受欢迎(H3)三种,其准确度(似然分布矩阵)见表6-2所示。第一节第一节 多阶段决策多阶段决策表表6-2 6-2 试销结果的准确度试销结果的准确度 第一节第一节 多阶段决策多阶段决策 如不买此项技术,

4、把这笔费用用在其他方面,在同样的时期可获利8000元。那么,该公司应该如何决策?(1)是否买技术?(2)如果买技术,是否采取试销办法?(3)如果不试销,应大批生产,中批生产还是小批生产?如果试销,又应该如何根据试销结果决定其行动?第一节第一节 多阶段决策多阶段决策 例例6-26-2 连续情形的决策分析。某工厂现有10万元资金可供生产某种产品使用,生产过程有两个方案可供选择。方案1:每万元资金,每年可产生0.5万元的利润,年产量为2000吨。方案2:每万元资金,每年可产生0.2万元的利润,年产量为3000吨。每年可用一部分资金采取一种方案生产,另外一部分资金采取另一种方案进行生产,但一年内不变。

5、假设前一年的利润可作为下一年的资金在两个方案间再行分配,但一个方案前一年的资金不得在下一年向另一方案转移。那么,为使四年内的总产量最高,该厂在这四年中应该如何分配资金?第二节第二节 序贯决策序贯决策 有些决策问题,在进行决策后又产生一些新情况,需要进行新的决策,接着又有一些新的情况,又需要进行新的决策。这样决策、情况、决策,就构成一个序列,这就是序列决策。解决序列问题的有利办法仍然是决策树。例例6-36-3 设有某石油勘探队,在一片估计能出油的荒田钻探,可以先做地震试验,然后决定钻井与否。或者不做地震试验,只凭经验决定钻井与否。做地震试验的费用每次30000元,钻井费用为10000元。若钻井后

6、出油,这井队可收入40000元;若不出油就没有任何收入。各种情况下出油的概率已估计出,并标在图6-2上。问钻井队的决策者如何做出决策使收入的期望值为最大。第二节第二节 序贯决策序贯决策图图6-2 6-2 原决策树原决策树 第三节第三节 马尔可夫决策马尔可夫决策 一、马尔可夫决策问题一、马尔可夫决策问题 决策问题采取的行动已经确定,但将这个行动付诸实践的过程又分为几个时期。在不同的时期,系统可以处在不同的状态,而这些状态发生的概率又可受前面时期实际所处状态的影响。其中一种最简单、最基本的情形,是每一时期状态参数的概率分布只与这一时期的前一时期实际所处的状态有关,而与更早的状态无关,这就是所谓的马

7、尔可夫链。利用马氏过程分析系统当前状态并预测未来状态的决策方法,称为马尔可夫决策。第三节第三节 马尔可夫决策马尔可夫决策 二、马尔可夫链与转移概率矩阵二、马尔可夫链与转移概率矩阵 随机过程 如果对任意 都存在 则称 具有马尔可夫性 条件概率 称为转移概率,也称一步转移概率。,),(TttX,21Tttttin111111)(|)()()(|)(nnnnnnxtxytxPxtxxtxytxPTttX),(ixjxPnn1|第三节第三节 马尔可夫决策马尔可夫决策 各状态之间的转移概率可记为 其中 ,对所有i;且 ,对所有i,j,称P为一步转移概率矩阵。定义:如果随机过程 满足下述性质,则称 是一个

8、有限状态的马尔可夫链(Markov)。kkkkppppP11111jijp0ijp,1,0,tXttX第三节第三节 马尔可夫决策马尔可夫决策(1)具有有限种状态;(2)具有马尔可夫性;(3)转移概率具有平稳性。第三节第三节 马尔可夫决策马尔可夫决策 三、稳态概率三、稳态概率 称 为稳态概率。且 因此我们可以从n n步转移矩阵的 极限取得稳态概率分布jxPPnnnjnjlimlim)(jnnnnjxPixjxPlim|lim0PPPnn1PPPnnnn1)(limlimn第三节第三节 马尔可夫决策马尔可夫决策 得 记 ,则 ,且 此方程组为稳态方程Pkkkkkk111111k21P11kii第三

9、节第三节 马尔可夫决策马尔可夫决策 四、马尔可夫应用实例四、马尔可夫应用实例 例例6-66-6 某生产商标 为的产品的厂商为了与另外两个生产同类产品 和 的厂家竞争,有三种可供选择的措施:(1)发放有奖债券;(2)开展广告宣传;(3)优质售后服务。三种方案分别实施以后,经统计调查可知,该类商品的市场占有率的转移矩阵分别是 第三节第三节 马尔可夫决策马尔可夫决策 已知三种商标的商品的月总销售量为一千万件,每件可获利1元。另外,三种措施的成本费分别为150万,40万,30万。为长远利益考虑,生产商标为 的产品的厂商应该采取何种措施?30.040.030.035.045.020.005.015.08

10、0.01P75.015.010.010.080.010.005.005.090.02P75.015.010.010.080.010.005.005.090.03P第三节第三节 马尔可夫决策马尔可夫决策 例例6-76-7 我国出口某种设备,在国际市场上的销售状况有两种:畅销和滞销。畅销每年可以获利100万元,滞销时每年仅获利30万元。以一年为一个时期,如果不采用广告推广产品或采取广告措施,状态的转移矩阵分别为如表6-5、表6-6所示。假定上一年处于畅销状态,每年的广告费为15万元。为了保证今后3年的利润最大化,是否应该采用广告措施?例例6-86-8 在上例中,如果每年是否采取广告措施可根据上一年

11、的经营情况确定。那么,应该如何决策?第三节第三节 马尔可夫决策马尔可夫决策畅销滞销畅销0.80.2滞销0.40.6畅销滞销畅销0.90.1滞销0.70.3表表6-3 6-3 不采取广告措施不采取广告措施 表表6-46-4采取广告措施采取广告措施第四节第四节 群决策简介群决策简介 一、群决策概念一、群决策概念 在现实生活中,决策往往是群体行为,是由多人参加进行行动方案的选择活动。这些组织的成员、代表就是群体决策者中的一员。作为群体决策,其决策程序、决策评价标准与单个决策者的决策有很大的差异,在决策原则、方法、许多方面都有新的内容,因而应用单个决策者的决策方法进行群决策在许多方面都受到了限制。第四

12、节第四节 群决策简介群决策简介 群体决策理论研究的问题一般具有三个前提:自主性。决策者有独立选择机会,其行动不受较高层权利的支配,但不排除群体成员间相互影响。共存性。决策成员都在已知的共同条件下进行选择。共意性。群体做出的必然是所有参与者一致能够接受的方案。第四节第四节 群决策简介群决策简介 群体决策研究比个人决策研究要复杂很多。这主要由几个因素引起:优先度。集体中每个成员都有各自的目标和优先观念以及不同的效用函数。主观概率判断。群体中各成员由于信息的感受和处理方式不一样,对未来状态出现概率的估计也不同。沟通。集体决策可以在完全没有沟通信息的情况下进行,而更多的决策是在有相互沟通信息的情况下进

13、行。第四节第四节 群决策简介群决策简介 二、群体决策的有效程度二、群体决策的有效程度(一)群体决策的有利因素(一)群体决策的有利因素 群体决策所需运用的知识和信息,可从群体中取得。参加群体决策的决策者往往也是决策的执行人,因而决策就成为大家的决议,从而能为更多成员所接受。(二)群体决策的不利因素(二)群体决策的不利因素 在群体里制定决策时,每个成员在表态时往往有一定的压力。“固执己见”也是群体决策中的一个障碍。第四节第四节 群决策简介群决策简介(三)群体决策与个人决策的对比(三)群体决策与个人决策的对比(1)决策的正确性:群体决策比较切合实际。(2)决策的速度:群体决策需要比个人决策花费更多的

14、时间。(3)决策的创造性:个人决策具有较大的创造性。(4)决策的风险性:会出现群体决策的极化现象。第四节第四节 群决策简介群决策简介 三、群体决策的规则:简单多数规则三、群体决策的规则:简单多数规则 简单多数规则即少数服从多数,尽管少数并不满意此方案,但由于某种约束或者有其他受益,而愿意继续留在此集体内并认同方案的实施。这种简单多数规则在运用中视具体环境而有不同形式。例如联合国安理会提案通过的常任理事国一票否决。个人选择符合传递性规则的话,群体决策结果却无法符合传递性。这样,选择的顺序将影响到选择结果,理性选择是难以相容的。这个有名的悖论是南逊(E.J.Nanson)1882年提出的。第四节第

15、四节 群决策简介群决策简介 法国数学家康多西特(M.Condorcet)在18世纪也注意到多数原则的相悖结论,提出了成对比较的规则。18世纪法国的另一位数学家波德(J.C.de Borda)则提出反映优先强度的排序规则。波德规则在实用时亦会出现相悖的情况。一是由于波德规则的结果和方案数相关。另一个原因是波德数未提供优先强度的信息。第四节第四节 群决策简介群决策简介 以上各种决策规则都反映了人们对于一种通用的公平的群体决策规则的追求。这种需要是显而易见的,有集体就有如何公平合理地反映集体意见的问题。50年代,阿罗等人证明了社会选择并不能在完全符合理性的条件下将个人选择顺序集结为群体的选择顺序,少

16、数服从多数的规则并不能提供一个令人满意的社会选择顺序。第四节第四节 群决策简介群决策简介四、常用的群决策方法及应用实例四、常用的群决策方法及应用实例(一)委托求解法(一)委托求解法 假设:第一,群中各成员对选择权都负有责任;第二,群中各成员对选择权的值各有各的意见。1.委托过程还必须满足以下三点公设。(1)(委托公设)群的n个成员中的每一个人,都有一委托小组,这个小组是由群中其余n-1个成员组成.成员i对委托小组每个成员j指定一个权数 ,有 ijP第四节第四节 群决策简介群决策简介当且仅当i=j时,并且 (2)(决策公设)每个委托小组都有一形式为 的群效用函数,对方案进行排队,权数 按委托公设

17、确定。(3)(代替公设)用联系到成员i的委托小组的群效用函数去代替成员i的效用函数,每次替代均作为委托求解的一个步骤),2,1,(,10njipij),2,1(,11nipnjij0ijpniiixUxU1)()(ijP第四节第四节 群决策简介群决策简介2委托求解法的步骤 假设成员i知道其他每个成员的效用函数,不知道其他成员设定的权.成员i能够根据其他成员的效用函数选择权 ,使这些效用函数的组合几乎能够反映成员i的偏好。),1(njpij第四节第四节 群决策简介群决策简介(1)设成员i对他委托的小组中各成员的效用 ,指定的权系数为 ,则成员i的效用函数 用委托组的群效用函数代替,即 (2)将步

18、骤(1)得到的效用函数 作为各成员的效用函数,一般仍用原设定的权系数 ,第二步再产生成员i的新的委托效用函数),2,1(,11niupunjojiji),2,1(,110)2(12niupupunjnjjijjijioju),1(njpij1iuijp1iu第四节第四节 群决策简介群决策简介(3)继续上面的委托过程,则成员i第k步的委托效用函数 如果 的每个分量均收敛,委托过程将产生唯一的群效用函数。即),2,1(,10)(11niupupunjjkijnjkjijkikunjjkkikiupuniuu10lim),2,1(,limkiu第四节第四节 群决策简介群决策简介 这里,u为群效用函数

19、,为成员i第k步的委托效用函数。又 这里应该注意通过上式计算 时,应该借助齐次马尔可夫链的遍历性,归结为求解方程组 即 满足条件 的唯一解。0uuTKTPlimTppppkkkk1limlim),2,1(,1njpniijijnjj11第四节第四节 群决策简介群决策简介(二)逐步形成群的意见的方法:名义群体法(二)逐步形成群的意见的方法:名义群体法(NGTNGT:Nominal Group TechniqueNominal Group Technique)(1)适合规模较小的群,以59个成员为宜,整个过程通常需要6090分钟。(2)步骤:群中有一组织者去指导实施以下步骤:第四节第四节 群决策简

20、介群决策简介 第一,每个成员在安静的环境下写出自己的意见;第二,组织者不分先后的听取并记录这些意见;第三,集体逐条讨论这些意见,并清楚它们的意义;第四,对归纳意见所形成的条目的重要性作初步投票;第五,讨论初步投票结果;第六,最终投票。第四节第四节 群决策简介群决策简介(三)特尔菲法(三)特尔菲法(DelphiDelphi法)法)1.1.此种方法与上述此种方法与上述NGTNGT方法相似,不同之处在于方法相似,不同之处在于:(1)成员数以2050人为宜;(2)书面反映;(3)整个过程大约需要12个小时。第四节第四节 群决策简介群决策简介 2.2.三个重要特征:三个重要特征:(1)匿名反应:向群中每

21、个成员发意见咨询表,匿名反应意见;(2)迭代和受控反馈:包括几次迭代(轮),每一轮都把收集到的意见经过统计处理反馈给群中的成员,经过信息反馈,各成员意见将逐步集中;(3)统计群的反应:把最后一轮得到的各成员的意见,组合成群的意见。第四节第四节 群决策简介群决策简介 3.3.DelphiDelphi法的实施步骤:法的实施步骤:(1)提出问题;(要进行决策,预测或技术咨询的问题)(2)选择并确定群中成员(反应者);对群成员的要求:代表性广;对问题较熟悉,丰富的知识,经验,权威性;感兴趣,有时间投入;人数适当.第四节第四节 群决策简介群决策简介(3)制订第一个咨询表,并散发给群的成员;(4)收集第一

22、个咨询表,并进行分析;(5)制订第二个咨询表,并散发给群的成员;(6)收集第二个咨询表,并对数据进行统计处理;(7)制订第三个咨询表,并散发给群的成员;(8)收集第三个咨询表,并对新数据进行统计处理;(9)准备最后的报告。第四节第四节 群决策简介群决策简介 4.4.几种常用的统计指标和计算方法几种常用的统计指标和计算方法。(1 1)中位数和上,下四分位点)中位数和上,下四分位点 设中位数为 T0,组织预测时间为 T,中位数与组织预测时间之差为 ,则上四分位点 T1和下四分位点T2 分别为 XTT0XTT3201XTT3502第四节第四节 群决策简介群决策简介(2 2)均值和方差)均值和方差 方

23、案的优劣程度常用方案的评分值表示。方案评分均值和方差分别为),2,1(,)(11),2,1(,1121njMamDnjamMmijijjmiijj第四节第四节 群决策简介群决策简介(3 3)满分频率和变异系数)满分频率和变异系数 满分频率是对第j个方案打满分专家人数和参加咨询专家人数之比。满分频率 变异系数表示方案评分值的波动程度。变异系数),2,1(,njmmKjjmiijmijijjjjamMamMV1121)(11第四节第四节 群决策简介群决策简介(4 4)协调系数)协调系数 协调系数表示专家评价中的相互协调程度,用方案的评价等级测算。当各位专家对各方案没有给出相同等级时,协调系数计算公

24、式为njjdnnmW1232)(12njjjjSnSd11其中miijjcS1第四节第四节 群决策简介群决策简介 当存在相同等级时,上式应该调整为 其中Ti为相同等级指标,计算公式为njjmiidTmnnmW12132)(12)(13kLkkittT第四节第四节 群决策简介群决策简介(5 5)多指标群组决策方法)多指标群组决策方法 综合加权法概念:综合加权法概念:设有m个方案,n个目标,s个决策者。n个目标的权重向量为 第k个决策者的权重系数为).,2,1(0,1,),(121njwwwwwWjnjjTn),2,1(0,1,1skkskkk第四节第四节 群决策简介群决策简介综合加权法的步骤是综

25、合加权法的步骤是:第一,专家组的每个决策者单独对各方案进行多指标决策。设第k个决策者对第i个方案的第j个目标评价值为 ,评价值采用统一标准评分,得到评价值矩阵).,2,1;,2,1()(skmiukijnmkijkuU)()()(第四节第四节 群决策简介群决策简介第二,分别计算各方案的算术加权平均分和几何加权平均分。算术加权平均分为 几何加权平均分为),2,1;,2,1(,1)()(skmiuWpnjkijjki),2,1;,2,1(,)(1)()(skmiuqnjwkijkij第四节第四节 群决策简介群决策简介第三,计算各方案的混合平均分为 第四,计算各方案的总体平均分第五,计算各方案的评价系数第六,根据评价系数 ,从小到大排列各方案群组决策的优先序。2)()()(kikikiqpt),2,1(,1)(mitvskkiki),2,1(,1mivvemiiiiie演讲完毕,谢谢观看!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!