(概率论与数理统计-茆诗松)-第5章-统计量及其分布(5.3)

上传人:每**** 文档编号:144932173 上传时间:2022-08-28 格式:PPTX 页数:41 大小:341.08KB
收藏 版权申诉 举报 下载
(概率论与数理统计-茆诗松)-第5章-统计量及其分布(5.3)_第1页
第1页 / 共41页
(概率论与数理统计-茆诗松)-第5章-统计量及其分布(5.3)_第2页
第2页 / 共41页
(概率论与数理统计-茆诗松)-第5章-统计量及其分布(5.3)_第3页
第3页 / 共41页
资源描述:

《(概率论与数理统计-茆诗松)-第5章-统计量及其分布(5.3)》由会员分享,可在线阅读,更多相关《(概率论与数理统计-茆诗松)-第5章-统计量及其分布(5.3)(41页珍藏版)》请在装配图网上搜索。

1、l样本均值l样本方差l样本标准差l样本偏度l样本峰度l次序统计量l样本分位数l样本中位数12021/3/10当人们需要从样本获得对总体各种参数的认识时,最好的方法是构造样本的函数,不同的函数反映总体的不同特征。定义5.3.1 设设 x1,x2,xn 为取自某总体的样为取自某总体的样 本,若样本函数本,若样本函数T=T(x1,x2,xn)中不中不含有含有 任何任何未知参数。则称未知参数。则称T为为统计量统计量。统计量统计量的的分布称为分布称为抽样分布。抽样分布。按照这一定义:若 x1,x2,xn 为样本,则 以及经验分布函数都是统计量是统计量。而当,2 未知时,x1,x1/等均不是统计量不是统计

2、量。l统计量是样本的一个函数l统计量是统计推断的基础l 尽管统计量不依赖于未知参数,但是它的分布一般是依赖于未知参数的。niiniixx121,定义5.3.2 设 x1,x2,xn为取自某总体的样本,其算术平均值称为样本均值,一般用 表示,即思考:在分组样本场合,样本均值如何计算?二者结果相同吗?x x=(x1+xn)/n定理5.3.2 数据观测值与均值的偏差平方和 最小,即在形如 (xic)2 的函数中,样本均值的基本性质:定理5.3.1 若把样本中的数据与样本均值之差 称为偏差,则样本所有偏差之和为0,即 最小,其中c为任意给定常数。1()0.niixx2()ixx52021/3/10样本

3、均值的抽样分布:定理5.3.3 设x1,x2,xn 是来自某个总体的样本,x为样本均值。(1)若总体分布为N(,2),则xx的精确分布为N(,2/n);(2)若总体分布未知或不是正态分布,但 E(x)=,Var(x)=2,则n 较大时 的渐近分 布为N(,2/n)。这里渐近分布是指n 较大时的近似分布.72021/3/101.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布3.推断总体均值的理论基础82021/3/102211()1niisxxn称为样本标差。s*=s*2定义5.3.3称为样本方差,其算术平方根在n 不大时,常用 作为样本方差,其算术平

4、方根也称为样本标准差。221*1()niisxxnxi与样本均值的平均偏差平方和与样本均值的平均偏差平方和92021/3/10在这个定义中,(xi x)2n1称为偏差平方和的自由度。其含义是:x在 确定后,n 个偏差x1x,x2x,xnx能自由取值,因为只有n1个数据可以自由变动,而第n个则不 (xi x)=0.称为偏差平方和,中样本偏差平方和有三个不同的表达式:(xix)2=xi2 (xi)2/n=xi2 nx它们都可用来计算样本方差。思考:分组样本如何计算样本方差?样本均值的数学期望和方差,以及样本方差的数学期望都不依赖于总体的分布形式。定理5.3.4 设总体 X 具有二阶矩,即 E(x)

5、=,Var(x)=2 x1,x2,xn 为从该总体得到的样本,x和s2 分别是样本均值和样本方差,则E(x)=,Var(x)=2/n,E(s2)=2 Q8Q3Q7l样本矩l次序统计量l样本分位数l箱线图132021/3/10样本均值和样本方差的更一般的推广是样本矩,这是一类常见的统计量。定义5.3.4 ak=(xik)/n 称为样本 k 阶原点矩,特别,样本一阶原点矩就是样本均值。称为样本k阶中心矩矩。特别,样本二阶中心矩就是样本方差。bk=(xi x)k/nx样本偏度1反映了总体分布密度曲线的对称性信息。样本峰度2反映了总体分布密度曲线在其峰值附近的陡峭程度。定义:1=b3/b23/2 称为

6、样本偏度,2=b4/b22 称为样本峰度。x162021/3/10数据分布偏斜程度的测度偏态系数=0=0为对称分布偏态系数 0 0为右偏分布偏态系数 0 0为左偏分布偏态系数大于1或小于-1,被称为高度偏态分布;偏态系数在0.51或 -1-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低 数据分布扁平程度的测度峰态系数=0=0扁平峰度适中峰态系数000为尖峰分布172021/3/10一、定义定义5.3.7 设设 x1,x2,xn 是取自总体是取自总体X的样本的样本,x(i)称为该样本的第称为该样本的第i 个个次序统计量,次序统计量,它的取值它的取值 是将样本观测值由小是将样本

7、观测值由小到大排列后得到的第到大排列后得到的第 i 个个 观测值观测值。其中,其中,x(1)=min x1,x2,xn 称为该称为该样本的样本的最小次序统计量最小次序统计量,称称 x(n)=max x1,x2,xn 为该为该样本的样本的最大次序统计量。最大次序统计量。xp在在一个样本中,一个样本中,x1,x2,xn 是独立同分布的,而是独立同分布的,而次序统计次序统计量量 x(1),x(2),x(n)则既不独立,分布也则既不独立,分布也不相同不相同,看下例。,看下例。xpP(x(1)=0)=?202021/3/10 0 1 2(1)xp1927727127(3)x7271927p127 0 1

8、 2可以清楚地看到这三个次序统计量的分布是不相同的。三个次序统计量的分布是不相同的。(2)x1327727p727 0 1 2212021/3/10进一步,我们可以给出两个次序统计量的联合分布,如,x(1)和x(2)的联合分布列为01207/279/273/27104/273/272001/27x(1)x(2)222021/3/10因为 P(x(1)=0,x(2)=0)=7/27 ,二者不等,由此可看出x(1)和和 x(2)是不独立的是不独立的。而 P(x(1)=0)*P(x(2)=0)=(19/27)*(7/27),232021/3/10二、单个次序统计量的分布定理5.3.5 设总体X的密度

9、函数为p(x),分布 函数为F(x),x1,x2,xn为样本,则第k个 次序统计量x(k)的密度函数为)()(1()()!()!1(!)(1xpxFxFknknxpknkk242021/3/10例例5.3.7 设总体密度函数为设总体密度函数为 p(x)=3x2,0 x 1.从该总体抽得一个容量为从该总体抽得一个容量为5的样本,的样本,试计算试计算 P(x(2)1/2)。)()(1()()!()!1(!)(1xpxFxFknknxpknkk例例5.3.8 设总体分布为设总体分布为U(0,1),x1,x2,xn为样为样 本,本,试求第试求第 k 个次序统计量的分布。个次序统计量的分布。)()(1(

10、)()!()!1(!)(1xpxFxFknknxpknkk三、多个次序统计量的联合分布对任意多个次序统计量可给出其联合分布,以两个为例说明:定理5.3.6 在定理5.3.5的记号下,次序统计 量(x(i),x(j),(i j)的联合分布密度函数为zyzpypzFyFzFyFjnijinzypjnijiij),()()(1)()()()!()!1()!1(!),(11次序统计量的函数在实际中经常用到。次序统计量的函数在实际中经常用到。如如 样本极差样本极差 Rn=x(n)x(1)282021/3/10令令 R=x(n)x(1),由 R 0,可以推出0 x(1)=x(n)R 1 R,则例5.3.9

11、 设总体分布为U(0,1),x1,x2,xn 为 样本,则(x(n),x(1)的联合密度函数为p1,n(y,z)=n(n1)(zy)n-2,0 y z 1这正是参数为(n1,2)的贝塔分布。1220()(1)()d(1)(1)rnnRprn nyryyn nrr样本中位数也是一个很常见的统计量,它也是次序统计量的函数,通常如下定义:更一般地,样本p分位数mp可如下定义:120.5122,12nnnxnmxxn 为奇数,为偶数(1)()(1),1(2nppnpnpxnpmxxnp若不是整数),若是整数例:某数学补习小组11人年龄(岁)为:17,19,22,24,25,28,34,35,36,37

12、,38(另一种方法)三个四分位数的位置分别为:Q1所在的位置=(11+1)/4=3,Q2所在的位置=2(11+1)/4=6,Q3所在的位置=3(11+1)/4=9。下四分位数、中位数和上四分位数,即:Q1=22(岁)、Q2=28(岁)、Q3=36(岁)312021/3/10定理5.3.7 设总体密度函数为p(x),xp为其p分 位数,p(x)在xp处连续且 p(xp)0,则特别,对样本中位数,当n时近似地有当n 时样本 p 分位数 mp 的渐近分布为2(1),pppppmNxn p x0.50.520.51,4mNxn p x例5.3.10 设总体为柯西分布,密度函数为p(x,)=1/(1+(

13、x)2),x0.5 x1,x2,xn m0.5 m0.5 AN(,2/4n).Q30342021/3/10次序统计量的应用之一是五数概括与箱线图。在得到有序样本后,容易计算如下五个值:最小观测值 xmin=x(1),最大观测值 xmax=x(n),中位数 m0.5,第一4分位数 Q1=m0.25,第三4分位数 Q3=m0.75.所谓五数概括就是指用这五个数:xmin,Q1,m0.5,Q3,xmax来大致描述一批数据的轮廓。362021/3/10372021/3/10课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理

14、财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177382021/3/10Min-Max25%-75%Median value455565758595105英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础392021/3/10min-max25%-75%median value455565758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11402021/3/10习题5.37、8、15、17、1830(2)(3)33(2)35412021/3/10

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!