不确定型决策边际分析马尔可夫决策课件

上传人:仙*** 文档编号:217021389 上传时间:2023-06-09 格式:PPT 页数:24 大小:729KB
收藏 版权申诉 举报 下载
不确定型决策边际分析马尔可夫决策课件_第1页
第1页 / 共24页
不确定型决策边际分析马尔可夫决策课件_第2页
第2页 / 共24页
不确定型决策边际分析马尔可夫决策课件_第3页
第3页 / 共24页
资源描述:

《不确定型决策边际分析马尔可夫决策课件》由会员分享,可在线阅读,更多相关《不确定型决策边际分析马尔可夫决策课件(24页珍藏版)》请在装配图网上搜索。

1、决策分析系统优化与决策理论决策分析基础2决策分析基础决策分析基础2.1不确定型决策不确定型决策2.2风险型决策风险型决策2.3序贯决策序贯决策2.4悖论悖论2.5风险型决策的风险估计风险型决策的风险估计2.6Markov决策决策2.7贝叶斯决策贝叶斯决策系统优化与决策理论决策分析基础2.1不确定型决策不确定型决策2.1.1悲观主义决策准则2.1.2乐观主义决策准则2.1.3等可能性准则2.1.4最小机会损失准则系统优化与决策理论决策分析基础例例1 某企业成批生产成批销售,生产能力为40吨/天,每天可销售0,10,20,30,40吨,每销售1吨可获利5万元,若生产后销售不出,每吨损失1万元。Ej

2、Si事件010203040策略00000010-105050505020-204010010010030-30309015015040-402080140200决策矩阵如何决策如何决策?系统优化与决策理论决策分析基础从最坏的可能结果中选择最好的结果,即:(maxmin)决策准则EjSI事件Min010203040策略0000000max10-1050505050-1020-2040100100100-2030-303090150150-3040-402080140200-402.1.1悲观主义决策准则悲观主义决策准则系统优化与决策理论决策分析基础决不放弃任何一个可获得好结果的机会EjSi事件M

3、ax010203040策略000000010-10505050505020-204010010010010030-30309015015015040-4020801402002002.1.22.1.2 乐观主义决策准则乐观主义决策准则系统优化与决策理论决策分析基础决策者按各事件等可能发生的情况计算各策略的收益期望值。在所有这些期望中选择最大者,对应的策略为决策策略。EjSi事件010203040策略000000010-10505050503820-20401001001006430-3030901501507840-40208014020080max2.1.32.1.3 等可能性准则等可能性准

4、则系统优化与决策理论决策分析基础从所有最大机会损失值中选取最小者,它对应的策略为决策策略。EjSI事件Max010203040策略0050100150200200101005010015015020201005010010030302010050504040302010040min2.1.42.1.4 最小机会损失准则最小机会损失准则系统优化与决策理论决策分析基础2.2风险型决策风险型决策2.2.1风险型决策的几个假设2.2.2最大期望效益值决策2.2.3最小机会损失决策准则2.2.4全情报价值2.2.5边际分析法系统优化与决策理论决策分析基础设某企业采取方案Ai,售出产品的概率为Pi,盈利为

5、MP,过剩产品的概率为1-Pi,损失ML,则盈亏平衡的边际条件为;盈利转折点的边际概率为,则2.2.52.2.5 边际分析法边际分析法最优方案:系统优化与决策理论决策分析基础例例3:小面包店每天早晨从食品厂购进面包若干,若零售,买进批发价每只5分,卖出每只8分,如果上午未卖完,下午处理价为每只4分,假定统计了过去100天的产物需求情况如下:天数51010202015155需要量(只)400410420430440450460470问:这个面包铺每天问:这个面包铺每天 进货时应该怎样决策进货时应该怎样决策?系统优化与决策理论决策分析基础解解:(1)求边际概率盈利:(分)亏本:(分)(2)各种需要

6、的发生概率与售出概率Pi天数需要量(只)发生概率售出概率Pi54000.051104100.10.95104200.100.85204300.200.75204400.200.55154500.150.35154600.150.2054700.050.05系统优化与决策理论决策分析基础 例例4:某工厂成批生产某种产品,批发价为0.05元/个,成本0.03元/个,这个产品每天生产,当天销售,如果当天卖不出去,每天损失0.01元,已知这个工厂每天的产量可以是:0个,1000个,2000个,3000个,4000个,根据调查,商场需要量及发生概率如下:市场需要量(个)01000200030004000

7、概率0.10.20.40.20.1试问工厂领导应怎样决策?试问工厂领导应怎样决策?系统优化与决策理论决策分析基础(1)边际分析法以1000个产品为1个单位盈利:Mp=1000(0.05-0.03)=20元亏本:ML=1000 x0.01=10(元)需求量(个)发生概率售出概率00.1110000.20.92000*0.40.7*0.3330000.20.340000.10.1最优方案=需求量2000个系统优化与决策理论决策分析基础2.6Markov决策决策 2.6.1基本概念2.6.2应用举例2.6.3吸收马尔可夫链及其应用系统优化与决策理论决策分析基础定义定义4考虑一个具有n个可能结果(状态

8、)S1,S2,Sn的系统,如果系统由状态Si变化到Sj,就称为系统的状态转移,其概率Pij就称为状态转移概率,简称为转移概率。定义定义1概率向量:任意一个行向量P=(P1,P2,Pn),如果满足:Pi0(1in),则向量P称为概率向量。定义定义2概率矩阵:一个n阶方阵A=(aij),如果具有性质:(1)aij0(1in,1jn)(2)(1in)则称方阵为概率矩阵。定义定义3不变向量:设是n维非零向量,A是n阶方阵,如果A=,则称是方阵A的不变向量。例如:=(2,-1),则A=2.6.12.6.1 基本概念基本概念系统优化与决策理论决策分析基础定义定义8Markov过程:如果一个系统在状态转移过

9、程中,下一步处于什么状态是仅与现在的状态有关,而与过去的的状态无关。定义定义5状态转移矩阵:由状态转移概率pij(1in,1jn)构成的矩阵P=(pij)叫状态转移矩阵(1in)定义定义6r步状态转移概率:设系统由状态Si出发,经过r步状态转移到达状态Sj,称其概率pij(r)为r步状态转移概率(r=1,2,)定义定义7r步状态转移矩阵:由r步状态转移概率pij(r)构成的矩阵P(r)=(pij(r)(1in)由此可见,Markov过程的状态转移关系完全由状态转移矩阵决定。系统优化与决策理论决策分析基础2.6.2应用举例应用举例例1:设有一个800户的居民区,在该区经营的某种产品有A.B.C三

10、种厂牌,各牌号之间有广告,服务,包装设计以及推销方面的竞争很激烈,市场情报员通过调查,就可以预测市场上未来的三种厂牌的购买分布模型。7月份800名消费者购买倾向显示为转移频数矩阵系统优化与决策理论决策分析基础转移概率矩阵设市场占有率向量为x=(XA,XB,XC)其中XA,XB,XC分别代A,B,C三种牌号产品的市场占有率预测8月份市场占有率向量为:X1=X0P同样预测9月份的市场占有率向量为:X2=X1P=(0.272,0.300,0.428)XA+XB+XC=1XA=0.249XB=0.27XC=0.481即X=(0.249,0.27,0.481)设X为稳定市场占有率向量,则XP=X系统优化

11、与决策理论决策分析基础例2:首都出租汽车公司,在北京国际机场颐和园以及北京饭店设立三个出租汽车站,经抽样调查,顾客在三个地方租还车的转移概率如下,该公司欲选一处附设汽车保养厂,问设在何处最好?结果为国际机场为最选择场所解:转移概率矩阵为:求解稳定状态下的不变向量X=还车处租车处国际机场颐和园北京饭店国际机场0.80.20颐和园0.200.8北京饭店0.20.20.6系统优化与决策理论决策分析基础例3:广告方案的选择某国生产同一产品的有R,A,B三个公司,国内市场的平均占有率为R28%,A39%,B33%。R公司为了扩大市场,计划开展了一个广告方案中选择一个R公司的两个区域进行试验,已知这两个区

12、域初始的市场占有率为R30%,A40%,B30%,这两个区域用户的初始转移概率矩阵是P假定区域2采用广告方案1,区域2采用方案2,经过一段试验,发现两个区域用户的转移概率矩阵为区域2试问:(1)R公司如果不作广告,平稳状态下,它在这两个地区的市场占在率是否达到国内市场占有率水平?(2)如果这两个广告方案的费用相同,问平稳状态下哪个方案较优?区域1系统优化与决策理论决策分析基础解:(1)如果R公司不作广告稳定状态下,三个公司在这两个区域的市场占有率为(X、Y、Z)R公司如果不作广告,稳定状态下,它在两个区域市占有率将为27.78%,近似等于它在国内市场的平均占有率28%。(2)方案1R公司的市场

13、占有率将达到因此,建议采取广告方案2方案2R公司的市场占有率将达到41.7%系统优化与决策理论决策分析基础2.6.3 吸收马尔可夫链及其应用吸收马尔可夫链及其应用其中:(1)nn子矩阵Q表示系统的不返回状态之间的关系。(2)nm子矩阵R表示不返回状态和吸收状态之间的关系。(3)子矩阵I是m阶单位矩阵。(4)子矩阵是mn的零矩阵。当一个系统处于有限状态j的条件概率与任何过去的状态无关,而只与目前的状态I有关的时候,这个系统就可的用一个有限的Markov过程来描述。时间离散和状态离散的Markov过程马尔柯夫链(Markovchains)(1)不返回状态:一旦离开了这种状态,就决不会再进来。(2)吸收状态(遍历状态):一旦进入了这种状态,就不会再出来。一个具有几个不返回状态和m个吸收状态的马尔可夫链可以用转移矩阵P表示为:系统优化与决策理论决策分析基础例4某工厂有4个加工车间和一个成品库,一个废品库,工厂的产品必须依次经过4个车间的顺序加工,每个车间的成品率和废品率(或返工率),如图所示,问这个工厂的平均成品率为多少?开始123455废品库成品库0.950.900.950.070.930.050.100.05解:4个不返回状态(即加工车间1、2、3、4)2个不吸收状态,成品库5和废品库6状态转移P

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!