基于R软件的统计模拟

上传人:zhan****gclb 文档编号:219594643 上传时间:2023-06-26 格式:PPT 页数:21 大小:1,011KB
收藏 版权申诉 举报 下载
基于R软件的统计模拟_第1页
第1页 / 共21页
基于R软件的统计模拟_第2页
第2页 / 共21页
基于R软件的统计模拟_第3页
第3页 / 共21页
资源描述:

《基于R软件的统计模拟》由会员分享,可在线阅读,更多相关《基于R软件的统计模拟(21页珍藏版)》请在装配图网上搜索。

1、基于R软件的统计模拟 奚 潭(南京财经大学统计系2006级)主要内容主要内容1.统计模拟的基本概念2.赶火车问题3.R软件的统计模拟功能4.应用R软件模拟验证大数定律5.应用R软件模拟验证中心极限定理一、统计模拟的基本概念(一)统计模拟的定义 统计模拟即是计算机统计模拟,它实质上是计算统计模拟即是计算机统计模拟,它实质上是计算机建模,而这里的计算机模型就是计算机方法、统计机建模,而这里的计算机模型就是计算机方法、统计模型模型(如程序、流程图、算法等如程序、流程图、算法等),它是架于计算机理,它是架于计算机理论和实际问题之间的桥梁。它与统计建模的关系如下论和实际问题之间的桥梁。它与统计建模的关系

2、如下图。图。实际问题实际问题实际问题实际问题统计、逻辑统计、逻辑统计、逻辑统计、逻辑 模模模模型型型型计算机模拟(程序、算法)计算机模拟(程序、算法)计算机模拟(程序、算法)计算机模拟(程序、算法)统计、计算机解统计、计算机解统计、计算机解统计、计算机解实际解实际解实际解实际解一、统计模拟的基本概念(二)统计模拟方法 一般地,统计模拟分类如下:一般地,统计模拟分类如下:若按状态变量的变化性质分为若按状态变量的变化性质分为连续随机模拟连续随机模拟连续随机模拟连续随机模拟和和离散离散离散离散随机模拟随机模拟随机模拟随机模拟。而按变量是否随时间变化又可分为而按变量是否随时间变化又可分为动态随机模拟动

3、态随机模拟动态随机模拟动态随机模拟和和静态随机模拟静态随机模拟静态随机模拟静态随机模拟。常用的统计模拟方法主要有以下几种:常用的统计模拟方法主要有以下几种:1.1.1.1.蒙特卡罗法蒙特卡罗法蒙特卡罗法蒙特卡罗法 2.2.2.2.系统模拟方法系统模拟方法系统模拟方法系统模拟方法 3.3.3.3.其它方法:其它方法:其它方法:其它方法:包括包括Bootstrap(Bootstrap(自助法自助法)、MCMCMCMC(马氏链蒙特卡罗法)等。(马氏链蒙特卡罗法)等。一、统计模拟的基本概念(三)统计模拟的一般步骤二、赶火车问题二、赶火车问题火车离站时刻13:0013:0513:10概率0.70.20.

4、1 一列列车从A站开往B站,某人每天赶往B站上车。他已经了解到火车从A站到B站的运行时间是服从均值为30min,标准差为2min的正态随机变量。火车大约下午13:00离开A站,此人大约13:30到达B站。火车离开A站的时刻及概率如表1所示,此人到达B站的时刻及概率如表2所示。问此人能赶上火车的概率有多大?表1:火车离开A站的时刻及概率表2:某人到达B站的时刻及概率 人到站时刻13:2813:3013:3213:34概率0.30.40.20.1二、赶火车问题二、赶火车问题问题的分析问题的分析 这个问题用概率论的方法求解十分困难,它涉及此人到达时刻、火车离开站的时刻、火车运行时间几个随机变量,而且

5、火车运行时间是服从正态分布的随机变量,没有有效的解析方法来进行概率计算。在这种情况下可以用计算机模拟的方法来解决。:火车从A站出发的时刻;:火车从A站到B站的运行时间;:某人到达B站的时刻;:随机变量 服从正态分布的均值;:随机变量 服从正态分布的标准差;二、赶火车问题二、赶火车问题进行计算机统计模拟的基础是抽象现实系统的数学模型进行计算机统计模拟的基础是抽象现实系统的数学模型进行计算机统计模拟的基础是抽象现实系统的数学模型进行计算机统计模拟的基础是抽象现实系统的数学模型为了便于建模,对模型中使用的变量作出如下假定:为了便于建模,对模型中使用的变量作出如下假定:为了便于建模,对模型中使用的变量

6、作出如下假定:为了便于建模,对模型中使用的变量作出如下假定:此人能及时赶上火车的充分必要条件为:,所以此人能赶上火车的概率模型为:。二、赶火车问题二、赶火车问题为了分析简化,假定13时为时刻t=0,则变量 、的分布律为:05100.70.20.1283032340.30.40.20.1二、赶火车问题二、赶火车问题R R R R软件求解的总算法:软件求解的总算法:软件求解的总算法:软件求解的总算法:关系式成立产生随机数验证模型成立次数k=k+1否是计算估计结果k/n成立次数不变试验次数是否达到n次是否编写R程序借助区间(0,1)分布产生的随机数,对变量 、概率分布进行统计模拟;根据变量 、概率分

7、布及模拟程序、命令产生n 个随机分布数;使用随机产生的n 组随机数验证模型中的关系表达式是否成立;计算n 次模拟实验中,使得关系表达式成立的次数k;当时,以作为此人能赶上火车的概率p 的近似估计;进入演示进入演示进入演示进入演示windows(7,3)prb=replicate(100,#括号内程序重复括号内程序重复括号内程序重复括号内程序重复100100次次次次x=sample(c(0,5,10),1,prob=c(0.7,0.2,0.1)y=sample(c(28,30,32,34),1,prob=c(0.3,0.4,0.2,0.1)plot(0:40,rep(1,41),type=n,x

8、lab=time,ylab=,axes=FALSE)axis(1,0:40)r=rnorm(1,30,2)points(x,1,pch=15)i=0while(i=y)points(y,1,pch=19)Sys.sleep(0.1)points(y,1,pch=19)title(ifelse(x+ry)mean(prb)进入模拟三、三、R软件软件的统计模拟功能的统计模拟功能 1、R软件优秀的随机数模拟功能软件优秀的随机数模拟功能分布产生随机数序列命令参数设置binomialrbinom()n,size,probchi-squared rchisq()n,df,ncpexponentialexp

9、()n,rate F F()n,df1,df2,ncpnormal norm()n,mean,sdPoisson pois()n,lambdaStudents t t()n,df,ncpunifomunif()n,min,max 生产某概率分布的随机数是实现统计模拟的前提条件,而使用R命令可以生成以下常用分布的随机数:三、三、R软件软件的的统计模拟功能统计模拟功能 2、优良的编程环境和编程语言、优良的编程环境和编程语言 R所拥有的好的兼容性、拓展性和强大的内置函数有利于统计模拟的实现。3、高效率的向量运算功能、高效率的向量运算功能 使用R拥有的向量运算功能可以大大减少程序运行的时间,提高程序运

10、行的效率。下面以求解下面以求解PiPi的程序为例加以说明的程序为例加以说明未采用R向量运算功能的程序为:mc1-function(n)set.seed(1234579)k-0;x-runif(n);y-runif(n);for(iin1:n)if(xi2+yi21)k-k+1;data.frame(Pi=4*k/n)引入向量运算功能改进后的程序为:mc1-function(n)set.seed(1234579)k-0;x-runif(n);y-runif(n);k-length(xx2+y2-下面用下面用R R软件软件分别执行两个程序,看看有什么差异分别执行两个程序,看看有什么差异 程序程序1

11、 1 .程序程序2 2三、三、R软件软件的统计模拟功能的统计模拟功能 四、应用四、应用R软件软件模拟验证大数定律模拟验证大数定律 1、验证的大数定律有:、验证的大数定律有:(1)伯努利大数定理 设 是 次独立重复试验中事件 发生的次数。是事件 在每次试验中发生的概率,则对于任意正数 0,有(2)辛钦定理:设随机变量 相互独立,服从同一分布,且具有数学期望 ,则对于任意正数 ,有四、四、应用应用R软件软件模拟验证大数定律模拟验证大数定律 2、在、在R软件实现的算法思想:软件实现的算法思想:由大数定律可知,当,样本的均值趋向与理论分布的期望,因此利用样本容量逐渐增大这一趋势来模拟这一趋势,在这种趋

12、势下,样本的均值与理论分布期望的误差应该呈现出越来越小的趋势,同时,根据上述思想,分别对五种常用分布下的大数定律进行验证。四、四、应用应用R软件软件模拟验证大数定律模拟验证大数定律 大数定律模拟算法大数定律模拟算法设置参数值产生m维序列绘图试验次数是否达到m次是否编写R程序选择分布类型产生随机数计算样本均值y 设置循环的跳跃步长设置循环的跳跃步长设置循环的跳跃步长设置循环的跳跃步长 、的第一次抽样的第一次抽样的第一次抽样的第一次抽样的样本容量初始值的样本容量初始值的样本容量初始值的样本容量初始值 和上限值和上限值和上限值和上限值 ;利用函数利用函数利用函数利用函数 产生由各模拟样本空间大小组成

13、的产生由各模拟样本空间大小组成的产生由各模拟样本空间大小组成的产生由各模拟样本空间大小组成的m m 维序列;维序列;维序列;维序列;选择随机数选择随机数选择随机数选择随机数 的分布类型,本文中的相关的分布类型,本文中的相关的分布类型,本文中的相关的分布类型,本文中的相关程序仅选择了常用的随机分布:正态分布、指数程序仅选择了常用的随机分布:正态分布、指数程序仅选择了常用的随机分布:正态分布、指数程序仅选择了常用的随机分布:正态分布、指数分布、均匀分布、泊松分布、二项分布、两点分分布、均匀分布、泊松分布、二项分布、两点分分布、均匀分布、泊松分布、二项分布、两点分分布、均匀分布、泊松分布、二项分布、

14、两点分布;布;布;布;利用利用利用利用R R R R软件产生软件产生软件产生软件产生n n个服从同一分布的随机数个服从同一分布的随机数个服从同一分布的随机数个服从同一分布的随机数 ;计算计算计算计算 (或(或(或(或 )的值;)的值;)的值;)的值;若循环次数若循环次数若循环次数若循环次数 im im是否编写R程序产生随机数计算标准化随机变量设置参数j和step中心极限定理模拟算法中心极限定理模拟算法 选择随机变量选择随机变量选择随机变量选择随机变量 的分布类型,主要分布类型的分布类型,主要分布类型的分布类型,主要分布类型的分布类型,主要分布类型有正态分布、指数分布、均匀分布、泊松分布、有正态

15、分布、指数分布、均匀分布、泊松分布、有正态分布、指数分布、均匀分布、泊松分布、有正态分布、指数分布、均匀分布、泊松分布、二项分布和两点分布;二项分布和两点分布;二项分布和两点分布;二项分布和两点分布;设置模拟试验总次数设置模拟试验总次数设置模拟试验总次数设置模拟试验总次数m m 及每次模拟试验中随及每次模拟试验中随及每次模拟试验中随及每次模拟试验中随机变量的个数机变量的个数机变量的个数机变量的个数n n 的值的值的值的值;利用利用利用利用R R R R软件模拟产生软件模拟产生软件模拟产生软件模拟产生n n n n个服从同一分布的随机数个服从同一分布的随机数个服从同一分布的随机数个服从同一分布的

16、随机数 ;使用产生的使用产生的使用产生的使用产生的n n 个随机数计算标准化随机变量值个随机数计算标准化随机变量值个随机数计算标准化随机变量值个随机数计算标准化随机变量值 设置循环变量设置循环变量设置循环变量设置循环变量j j 和循环的跳跃步长和循环的跳跃步长和循环的跳跃步长和循环的跳跃步长 ,当当当当 时,重复步骤时,重复步骤时,重复步骤时,重复步骤、,直至,直至,直至,直至 ;对对对对m m 个个个个 值进行正态性检验和描述性统计分值进行正态性检验和描述性统计分值进行正态性检验和描述性统计分值进行正态性检验和描述性统计分析,包括直观的析,包括直观的析,包括直观的析,包括直观的QQQQQQQQ图检验、正态性图检验、正态性图检验、正态性图检验、正态性W W 检验以及偏检验以及偏检验以及偏检验以及偏度系数、峰度系数、均值和方差。度系数、峰度系数、均值和方差。度系数、峰度系数、均值和方差。度系数、峰度系数、均值和方差。进入演示进入演示五、应用五、应用R软件模拟验证中心极限定理软件模拟验证中心极限定理 非常感谢!非常感谢!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!