管理系统模拟4

上传人:沈*** 文档编号:214377233 上传时间:2023-05-29 格式:PPT 页数:70 大小:492KB
收藏 版权申诉 举报 下载
管理系统模拟4_第1页
第1页 / 共70页
管理系统模拟4_第2页
第2页 / 共70页
管理系统模拟4_第3页
第3页 / 共70页
资源描述:

《管理系统模拟4》由会员分享,可在线阅读,更多相关《管理系统模拟4(70页珍藏版)》请在装配图网上搜索。

1、4 输入数据建模输入数据建模 4.1 建立输入数据模型的方法建立输入数据模型的方法建立输入数据模型可以采用如下三种方法之一:建立输入数据模型可以采用如下三种方法之一:(1)在仿真运行中直接使用收集到的数据(2)把收集到的数据定义为经验分布(3)将数据拟合为某种理论分布1输入数据建模输入数据建模原始数据原始数据原始数据经验分布理论分布处理处理确定数值范围计算频率预处理分布类型辨识参数估计拟合度检验输入数据模型输入数据模型直接使用2(1)在仿真运行中直接使用收集到的数据)在仿真运行中直接使用收集到的数据该方法很直接,也可以用来做确定性模型的有效性检验有效性检验,但是有两个缺点缺点:(1)只能用收集

2、到的历史数据来驱动仿真模型;(2)经常没用足够多的数据来进行多次仿真试验。3(2)把收集到的数据定义为经验分布)把收集到的数据定义为经验分布该方法可以根据实际数据值的范围范围、某个数据值出现的频频率率,用随机数来产生所需要的随机变量值,能够产生足够多的数据来进行多次仿真试验。4(3)将数据拟合为某种理论分布)将数据拟合为某种理论分布如果发现所收集的数据能够较好地服从某种理论分布(Theoretical Distribution),倾向于采用第 3种方法而不是第2种方法。建立输入数据理论分布的几个主要步骤建立输入数据理论分布的几个主要步骤收集原始数据基本统计分布的辨识参数估计以拟合度检验54.2

3、 收集原始数据收集原始数据一、收集输入数据的方法一、收集输入数据的方法()通过实际观测实际观测获得系统的输入数据。()由项目管理人员项目管理人员提供的实际系统运行数据。()从已经发表的研究成果、论文研究成果、论文中收集类似系统的输入数据模型。二、收集数据时,要注意以下几点:二、收集数据时,要注意以下几点:()在收集数据的同时就分析数据,确定收集到的数据是否足够。()将性质相同的数据集组合在一起。()确定两个随机变量是否相关。()注意一组观测到的、似乎是独立的样本是否具有自相关性。64.3 随机变量分布的辨识随机变量分布的辨识 连续型连续型随机变量分布类型辨识 离散型离散型随机变量分布类型辨识点

4、统计法直方图法线图法点统计法74.3.1连续型随机变量分布类型辨识连续型随机变量分布类型辨识(1)点统计法)点统计法点统计法确定连续随机变量分布类型的基本思路为,首先计算连续型随机变量的偏差系数偏差系数,再根据偏差系数的特征寻求与其相近的理论分布,并假设随机变量的分布为这一理论分布。偏差系数是偏差与均值的比:其中:var(x)随机变量分布的方差;E(x)均值。8如果有随机变量X,则有:其中:随机变量采集数据的均值;s2(n)随机变量采集数据的方差。所以,910点统计法点统计法例例41:用汽车到达银行的时间间隔原始数据汽车到达银行的时间间隔原始数据接近1,假设间隔服从指数分布。11(2)直方图法

5、)直方图法 直方图是一种图形估计方法。基本原理是:基本原理是:用观测到的样本数值建立随机变量的概率密度函数分布概率密度函数分布的直方图,然后把得到的直方图与理论分布的概率密度函数曲线图形做对比对比,从图形上图形上直观地判断被观测随机变量是否满足某种理论分布。12具体做法:具体做法:1)将所有观测数值分为k个区间长度相等的相邻区间。bj-1,bj),j=1,2,k。区间宽度b=bjbj-12)对于第i个区间bj-1,bj),令gj表示在第j个区间中的观测数据数量nj占整个观测数据的比例,即gj=njn。3)定义函数,4)将定义的观测数据取值的区间画在横坐标轴上,在垂直坐标轴上标记出频率函数,画出

6、被观测变量的直方图。5)将直方图与理论分布的概率密度函数对比,确定被观测数据服从哪种理论分布。13b0 b1 b2 b3 bj bj-1 bkx1 x2 xa xa+1 xb xb+1 xc xi+1 xm Xm+1 xnbbbbb14例例42:1)首先确定观测数据的范围 在观测到的间隔时间数据中,最小间隔是0.01min,最大间隔是1.96min,观测数值范围为0.0,2.0。2)确定相邻区间宽度为b=0.1,b0=0,b20=2.0,构造出20个长度相等的相邻区间。153)统计第j个区间所包括的观测数据数目占所有观测数据数目的比例gj,下表中列出了具体数值。164)根据上表给出函数h(X)

7、。5)将连续的区间在横轴上表出,将函数h(x)的数值在纵轴上表出,画出直方图。6)将直方图与理论分布的概率密度函数曲线做比较。从图形上看,间隔符合服从指数分布。17要注意选择区间宽度要注意选择区间宽度18194.3.2 离散型随机变量分布类型的辨识离散型随机变量分布类型的辨识(1)点统计法)点统计法与连续型随机变量点统计法方法相同,同样是采用计算偏差系数的方法,寻找偏差系数相近的理论分布进行假设。20(2)线图法)线图法 线图法是把采集到的数据与假设的理论分布的概率质量函数曲线进行比较。如果找到相近的,则可以假设其为该理论分布。具体做法步骤如下:设观察数据为:x1,x2,xn;将其按递增顺序排

8、列,设共有 m个取值(mn),分别为:x(1),x(2),x(m);x(i)的数据个数占整个观测数据个数的比例数为hi;以x(i)作为自变量,以hi的值为函数值,即:hi=f(x(i)),i=1,2,m;由函数值 hi向相应的自变量 X(i)做垂线所得的图形称为线图(见下图);与假设的理论分布的概率质量函数概率质量函数比较,确定随机变量的分布。2122例:观测在7:00am7:05am时间段内到达某十字路口西北拐角的车辆数目。每周观测 5天,连续观测 20周,在 5分钟内到达的车辆数目列表 45中。23244.4 参数估计参数估计用直方图或线图确定样本数据服从的理论分布理论分布之后,还要根据已

9、经观察到的样本计算出理论分布的参数理论分布的参数。如果可以确定理论分布的参数,我们就建立了输入参数的一个数学模型,可以用前面(第三章)介绍的方法来生成随机变量的数值随机变量的数值。25按照统计学的说法,假设某随机变量的总体分布是F,分布F的参数未知,要用已经观测到的部分样本来计算全部样本总体分布F的参数的真值,这样的统计推断问题被称为估计估计(Estimation)。在数理统计学中有许多参数估计的方法。点估计:点估计:如果用统计方法给出的结果是关于参数真值的一个点,称为点估计(点估计(Point Estimation);区间估计:区间估计:如果给出参数真值存在的一个区间,称为区间估计区间估计(

10、Interval Estimation)。26点估计点估计(1)样本均值样本均值 样本均值是随机变量X期望值E(X)的一个点估计,刻画了随机变量的一个特征,即随机变量倾向于某个数值,(2)样本方差样本方差 样本的方差越大,说明样本与均值的偏离越大,即样本数值的分散性大;反之,样本的方差越小,说明样本数值的集中程度比较高。2728例:用汽车到达银行的时间间隔原始数据汽车到达银行的时间间隔原始数据即:29例:用车辆数目数据车辆数目数据即:304.5 拟合度检验拟合度检验 通过做辨识和参数估计,可以估计出观测样本的分布及其参数。在得到了这个估计的理论分布及其参数之后,需要判断观测样本分布与估计的理论

11、分布的接近程度,即确定估计的理论分布的拟合度。比较直观的方法之一是直接把直方图与所估计理论分布的概率密度函数曲线做对比。假设所估计理论分布的概率密度函数为,对于连续型随机变量,比较的具体方法是:把直方图与b 曲线画在一起。31例:我们估计汽车银行顾客到达时间间隔服从=2.506的指数分布,将直方图与概率密度曲线做对比。拟合样本数据得到顾客到达间隔时间的概率密度函数,直方图与画在一起:3233拟合度检验的定量方法:拟合度检验的定量方法:2检验(ChiSquare Test)KolmogorovSmirnov检验(柯尔莫哥洛夫斯米尔诺夫检验、KS检验)344.5.12 检验(检验(ChiSquar

12、e Test)2 检验以下假设是否成立。H0:随机变量X满足假定的分布;如果H0假设被接受,那么被检验的随机变量就满足所假定的分布;如果H0假设被拒绝,则被检验的随机变量不满足所假定的分布。352 检验的方法:(1)将n个观测样本按数值大小分到k个相邻区间aj-1,aj)(j=1,2,k)中,按照公式计算2 统计量。其中 Nj为在第 j个区间中的观测样本数观测样本数,pj为按照假设的分布确定的假设的分布确定的样本在该区间中出现的概率。对于连续连续型型变变量量,对于离散型随机离散型随机变变量量,是所假设的分布的概率密度函数,是所假设的分布的概率质量函数。36(2)2服从ks1自由度的ChiSqu

13、are分布。k为所划分区间的数目,s为所假定的分布的参数数目。如果则H0假设被拒绝。是显著水平,相应的(1一)100就是置信度。37不要求k个相邻区间的宽度都相等。对于离散型随机变量,区间的数量由观测样本的取值数目确定;对于连续型随机变量,区间数量采用表4.8中的推荐值。38例46:在5分钟内到达十字路口西南拐角的车辆数目被假设为服从泊松分布,通过参数拟合得到3.64。在显著水平0.05时,用2测试检验在5分钟内到达十字路口西南拐角的车辆数目是否服从所假设的泊松分布。离散泊松分布的概率质量函数为,39表49是按照离散泊松分布的概率密度函数计算出的整数X取值011时的概率质量。将总共100个样本

14、值分为7个相邻的区间,再根据离散泊松分布的概率密度质量计算出,如果满足所假定的泊松分布,在每个取值区间内应该出现的样本数目npi;。pi为所假设的泊松分布取第i个区间中的数值的概率质量,n为全部样本的数目。检测统计量的计算过程在表410中列出。40统计量 显著水平取为0.05。泊松分布有一个参数,则上分布的自由度为,k-S-1=7-1-1=5查表可得关键值,因此在显著水平取0.05,H0假设被拒绝,即样本数据不服从不服从所假定的泊松分布。41 在计算2统计量时,Ni是分段区间中所包含的样本数量,换算成占全部样本的比例就可以得到直方图直方图。pi则是所假设的理论分布的数值出现在分段区间内的概率,

15、代表了概率密度函数或概率质量。2 统计量可以被理解为直方图与概率密度函数曲线或线图与概率质量函数曲线偏差曲线的偏差量偏差量,2 测试则是定量化的直方图与概率密度或线图与概率质量函数曲线对比方法。采用2测试需要确定分段区间确定分段区间,如何确定分段区间没有严格的规则,区间数量不同对统计量有比较大的影响。对于同一组样本,在选择某个区间数量时,得到了样本不服从所假设分布的结论;选择另外的区间数目,则可能得出样本服从所假设分布的结论。另外,当样本数量样本数量比较少的时候,不能采用2测试。424.5.2 KolmogorovSmirnov 检验检验KS检验是把经验分布函数与所假设分布的分布函数做比较。使

16、用KS检验不用确定分段区间,对样本数量也没有限制。43KS检验步骤检验步骤假设观测到一组样本X1,X2,Xn,进行KS测试的步骤如下:(1)定义样本的经验分布函数)定义样本的经验分布函数Fn(X)。Fn(x)是数值小于等于X的观测样本占全部样本数目的比例(2)计计算算KS统计统计量量Dn。Dn是经验分布函数Fn(x)与所假设的分布函数的最大偏差值。44将观测值按照递增的顺序排列X(1)X(2)X(n),分别计算,统计量Dn的值越大,经验分布函数与所假设的分布函数的偏差越大。(3)判断样本是否服从所假设的分布。)判断样本是否服从所假设的分布。根据将统计量与一定显著水平下的关键值dn,比较,如果D

17、ndn,,则H0假设被接受,样本服从所假设的分布;否则,H0假设被拒绝,样本不服从假设的分布。45K检验临界值表检验临界值表46 例4.7:在100分钟时间内观测到了50个顾客到达的间隔时间,单位分钟。按照顾客到达的先后顺序,时间间隔如下:用KS测试检验间隔时间是否满足指数分布?47顾客到达的间隔时间是在(0,100)时间区间上收集到的,如果间隔时间间隔时间服从指数分布,那么顾客到达时间到达时间在(0,100)时间区间上是均匀分布的。为了方便起见,把顾客到达时间规一化规一化到(0,1)区间上。规一化后的到达时间如下:48经验分布函数与(0,1)均匀分布均匀分布偏差的计算过程列在表411中。从表

18、 411可以得到,所以 KS统计量 49统计量D的关键值可以查表得到,取显著水平a0.05,当n=50时,统计量D比关键值小,所以检验结果表明间隔时间服从指数分布。最初的KS测试只能应用于所假设分布的参数全部已知的场合,不能使用参数估计所给出的参数。改进后的KS测试可以使用从样本得到的参数,有关详细内容参见相关书籍。虽然KS测试有它的优势,但与2测试相比它的应用范围比较小。50例:某随机数发生器产生出 5个随机数,ui0.44,0.81,0.14,0.05,0.93,要求显著性水平为=0.05。用KS检验是否符合均匀分布。51首先将所产生的随机数由小到大排列,并进行检验步骤中的各项计算,如下表

19、所示:由表可见 D+0.26,D0.21,故Dmax(0.26,0.21)0.26。当 0.05和N5时,由表 3-1可知D的临界值D5,0.950.565。由于DD5,0.95,故不能拒绝所产生的随机数的分布与理论均匀分布之间无显著差异的假设。52SN(X)和)和F(x)的比较)的比较0.05 0.14 0.44 0.810.9353思考:已知有如下随机数:53,47,42,46,47,51,51,59,47,51(1)对其做理论分布假设并检验。(提示及要求:第1步:用偏差判断属于哪种概率密度函数的分布;第2步:做直方图,从图形上判断属于哪种概率密度函数的分布;第3步:用第一步计算的参数和第

20、二步得到的直方图的结论,做一条理论分布曲线与直方图相拟合或用卡方检验、KS检验。)(2)有人认为符合泊松分布,你认为对吗,说明理由。544.7 经验分布经验分布当无法用理论分布来拟合输入数据或者不需要采用理论分布的时候,我们直接用观测到的数据及每个数据占全部数据的比例来定义一个分布,这种分布被称为经验分布(Empirical Distribution)。经验分布具有离散离散和连续连续两种类型。554.7.1 离散型变量的经验分布离散型变量的经验分布假定观测到的样本数据为X1,X 2,Xn,建立离散数据经验分布的步骤如下。(1)计算样本数值的相对频率。n个样本共有k个取值,按照递增的顺序排列X(

21、1)X(2)X(n)(kn)。对于每样本值X(j),p(j)是数值为X(j)的样本的数目占全部观测样本的比例,称为相对频率。(2)将样本值X(j)及其对应的相对频率p(j)列表,或做相对频率的直方图 56例:对中午到餐厅就餐的顾客进行观察,发现每批顾客的入数在18之间。需要确定每批顾客数目的数据模型。观测了最近的300批顾客,每批顾客数目及其相应的出现次数在下表中列出。每批客人的数目出现次数相对频率1300.10 21100.37 3450.15 4710.24 5120.04 6130.04 770.02 8120.04 57在图4.9中给出的每批顾客数目的累计频率曲线累计频率曲线代表了样本

22、的经验分布经验分布 58批量到达过程,是系统仿真中经常遇到的一种到达模式,如一批多个工件同时进入加工系统、一批多个顾客同时到达餐厅、一个订单中包括多种商品等。我们首先首先要确定各批次之间的间隔时间服从哪种分布,通常是指数分布。然然后后,再来建立每个批次的顾客数量模型。设N(t)是到在时刻为止,已经到达的顾客批次数目。我们可以建立到达过程N(t),t0的模型。如果Bi是第i个批次中的顾客数目,X(t)是到t时刻为止已经到达的顾客数目。假定B满足独立同分布,而且独立于到达过程N(t),t0,那么 X(t),t0是一个复合过程。59例:604.7.2 连续型变量的经验分布连续型变量的经验分布对于连续

23、型变量,不定义概率密度函数,而直接用累计累计频率频率定义分布函数。在定义的经验分布的时候,需要考虑两种情况:能够得到原始的全部观测数据;能够得到原始的全部观测数据;只能得到变量数值落在若干区间内的次数。只能得到变量数值落在若干区间内的次数。61 能够得到原始的全部观测数据能够得到原始的全部观测数据假设得到了全部样本X1,X2,Xn,可以得到分段线分段线性的分布函数性的分布函数。定义分布函数的步骤如下。(1)将观测到的样本按照数值增大的顺序增大的顺序排列,设X(i)为第i个最小的数据值,即X(1)X(2),X(n)(2)按照下列公式计算分布函数F(x),62例:63 只能得到变量数值落在若干区间

24、内的次数只能得到变量数值落在若干区间内的次数不知道原始的样本数值是多少,但是知道样本总数为n,样本按照k个相邻区间(a0,al,(a1,a2,(ak-1,a k,分成k组。落在第j个区间内的样本数量为nj,按照以下步骤定义分段线性的经验分布函数G。(1)定义经验分布函数G在区间分界点上的数值。64(2)进行线性插值,计算在每个区间内的分布函数。65 例例:输送带系统出现故障时需要用一段时间进行维修,共收集到了100个维修时间。如表4.14所示,维修时间以半小时为间隔分为6个相邻区间。建立维修时间的模型。根据区间的变界值,a00.0,a63.0。在区间分界点上的分布函数值为:G(0)0,G(0.5)0.21,G(1.0)0.33,G(1.5)=0.62,G(2.0)0.81,G(2.5)0.89,G(3.0)1.00。66产生随机数为0.83,则维修时间为多少?G(x)0.83G(2.0)0.81,G(2.5)0.89,由公式:0.830.81(x-2.0)(0.89-0.81)/(2.5-2.0)解得:X=2.1256768经验分布产生的随机变量取值只能在样本的最小值和最大最小值和最大值之间值之间。如果得到的样本数目比较少,由于无法生成比样本最大值更大的数字,影响了经验分布的可靠性可靠性。69本章要求通过例子熟练掌握、加深理解输入建模的方法70

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!