统计学原理:第七章 概率分布与抽样分布

上传人:努力****83 文档编号:190721407 上传时间:2023-02-28 格式:PPT 页数:52 大小:1.75MB
收藏 版权申诉 举报 下载
统计学原理:第七章 概率分布与抽样分布_第1页
第1页 / 共52页
统计学原理:第七章 概率分布与抽样分布_第2页
第2页 / 共52页
统计学原理:第七章 概率分布与抽样分布_第3页
第3页 / 共52页
资源描述:

《统计学原理:第七章 概率分布与抽样分布》由会员分享,可在线阅读,更多相关《统计学原理:第七章 概率分布与抽样分布(52页珍藏版)》请在装配图网上搜索。

1、第七章第七章 概率分布与抽样分布概率分布与抽样分布q随机变量及其概率分布随机变量及其概率分布 q抽样及抽样分布抽样及抽样分布 一、随机变量及其概率分布一、随机变量及其概率分布(一)随机变量(一)随机变量 1.1.随机现象、随机事件与样本空间随机现象、随机事件与样本空间 随机现象:一种现象,在有几种可能结果的情况下,随机现象:一种现象,在有几种可能结果的情况下,一种结果可能出现,也可能不出现;如果出现,可一种结果可能出现,也可能不出现;如果出现,可能这样发生,也可能那样发生;可能是一种结果,能这样发生,也可能那样发生;可能是一种结果,也可能是几种结果,但这都无法预知,这种现象也也可能是几种结果,

2、但这都无法预知,这种现象也称为偶然现象。称为偶然现象。为了研究随机或偶然现象的统计规律性,需要进为了研究随机或偶然现象的统计规律性,需要进行各种科学试验或对事物某种特征进行观测。行各种科学试验或对事物某种特征进行观测。通常具备以下三个特征的试验称为随机试验:通常具备以下三个特征的试验称为随机试验:(1 1)试验可以在相同条件下重复进行;)试验可以在相同条件下重复进行;(2 2)每次试验的可能结果不止一个,并且能在实验之)每次试验的可能结果不止一个,并且能在实验之前明确知道所有可能出现的结果。前明确知道所有可能出现的结果。(3 3)每次试验之前不能肯定会出现哪个结果,但可以)每次试验之前不能肯定

3、会出现哪个结果,但可以肯定每次试验总会出现这些可能结果中的一个。肯定每次试验总会出现这些可能结果中的一个。随机事件:随机试验中可能出现或可能不出现的事情。随机事件:随机试验中可能出现或可能不出现的事情。每一个可能结果称为基本事件;由若干个基本事件组合每一个可能结果称为基本事件;由若干个基本事件组合而成的事件称为复合事件;每次试验一定发生的事件称为必而成的事件称为复合事件;每次试验一定发生的事件称为必然事件;而每次试验一定不发生的事件称为不可能事件,记然事件;而每次试验一定不发生的事件称为不可能事件,记为为F F。样本空间:在一项试验中,我们把试验中所有可能结果样本空间:在一项试验中,我们把试验

4、中所有可能结果的集合定义为样本空间,记为的集合定义为样本空间,记为W W。样本空间中每一特定的试验结果,称为样本点,记为样本空间中每一特定的试验结果,称为样本点,记为w w,显然显然W W=(=(w w1 1,w w2 2.w wk)。以下表以下表7.17.1中的几例,说明样本空间和样本点:中的几例,说明样本空间和样本点:试验试验 样本空间样本空间W W =(w w)投一枚硬币观察正面投一枚硬币观察正面H H 和反面和反面T T 出现的情况出现的情况W W =(H H ,T T)将一枚硬币投三次,观察出现正面将一枚硬币投三次,观察出现正面H H 的次数的次数W W =(0 0,1 1,2 2,

5、3 3)掷一颗骰子,观察出现的点数掷一颗骰子,观察出现的点数 W W =(0 0,1 1,2 2,3 3,4 4,5 5,6 6)2.2.随机事件的概率随机事件的概率在概率论中随机事件发生可能性大小的数值称为随机事在概率论中随机事件发生可能性大小的数值称为随机事件的概率,记作件的概率,记作P(A)。假定在相同条件下,重复进行次试验,事件发生了次,假定在相同条件下,重复进行次试验,事件发生了次,则事件发生的概率可以记为则事件发生的概率可以记为:nmAA重复试验的次数发生的次数事件【例例7.17.1】某集团公司所属三个子公司员工人数资料如某集团公司所属三个子公司员工人数资料如表表7.27.2所示所

6、示:子公司子公司男员工男员工女员工女员工合计合计甲子公司甲子公司乙子公司乙子公司丙子公司丙子公司202030302525303030302525505060605050合合 计计75758585160160若以若以A表示表示”抽中的职工为男性抽中的职工为男性”,以以B表示表示”抽中的员工为甲抽中的员工为甲子公司职工子公司职工”,则则:47.016075集团公司员工人数集团公司男性员工人数A表表7.2 7.2 某集团公司所属子公司员工人数统计某集团公司所属子公司员工人数统计31.016050)(集团公司员工人数集团甲子公司员工人数B3.随机变量及其分布随机变量及其分布(1 1)随机变量)随机变量

7、随机实验结果的变量;随机实验结果的变量;一个取值对应随机试验的一个可能结果;一个取值对应随机试验的一个可能结果;随着试验结果不同而变化;随着试验结果不同而变化;一般用希腊字母希腊字母x x、h h、V V大写字母如大写字母如X、Y、Z.来表来表示。示。按其取值情况可以把随机变量分为两类:按其取值情况可以把随机变量分为两类:离散型随机变量:有限个或无限可列个值。离散型随机变量:有限个或无限可列个值。非离散型随机变量:可以在整个数轴上取值,或至少有非离散型随机变量:可以在整个数轴上取值,或至少有一部分值取某实数区间的全部值。一部分值取某实数区间的全部值。(2 2)随机变量的分布函数)随机变量的分布

8、函数m随机变量分布函数的定义及性质随机变量分布函数的定义及性质 设设X 是一个随机变量是一个随机变量,x是任意实数,函数是任意实数,函数F(x)=)=P Xx 称为称为X 的分布函数的分布函数。其中其中 Xx 表示表示X 取小于等于取小于等于x 的每一个值所对应的基的每一个值所对应的基本事件的和事件。本事件的和事件。分布函数是定义在分布函数是定义在(-,+(-,+)上的一个函数,它具有如下上的一个函数,它具有如下性质:性质:F(x)是一个不减函数;是一个不减函数;00F(x)1,)1,F(+)=1,(+)=1,F(-)=-1(-)=-1;F(x)是右连续的,即是右连续的,即F(x+0 0)=F

9、(x)对任意的实数对任意的实数ab,有有)()(aFbFbXaP)()()(bXFaFbFbXaP)()()(aXFaFbFbXaPm离散型随机变量的概率分布离散型随机变量的概率分布设离散型随机变量设离散型随机变量 X 所有可能取的所有可能取的值为值为xk(k=1,2,),X 取各个可能值取各个可能值的概率,即事件的概率,即事件X=xk发生的概率为发生的概率为:PX=xk=pk,k=1,2,1,2,我们将上式称为离散型随机变量我们将上式称为离散型随机变量X 的概率分布或者分布律,即下表的概率分布或者分布律,即下表7.37.3所所示:示:一分钟内呼一分钟内呼叫电话的次叫电话的次数是数是离散型离散

10、型随机变量随机变量 Xx1x2xkpkp1p2pk表表7.3 7.3 离散性随机变量的概率分布离散性随机变量的概率分布容易知道,分布律具有如下性质:容易知道,分布律具有如下性质:pk00,k=1,2,.=1,2,.;11kkp【例例7.27.2】仍然以掷骰子为例,将出现的点数记仍然以掷骰子为例,将出现的点数记作随机变量,其概率分布如表作随机变量,其概率分布如表7.47.4所示:所示:表表7.4 7.4 掷一颗骰子出现点数的概率分布掷一颗骰子出现点数的概率分布X1 2 3 4 5 61 2 3 4 5 6p1/6 1/6 1/61/6 1/61/6 1/61/6 1/61/6 1/61/6 m连

11、续型随机变量的概率分布连续型随机变量的概率分布如果对于随机变量如果对于随机变量X 的分布函数的分布函数 F(x),存在非负函存在非负函数数f(x),对于任意实数对于任意实数x,有有 dttfxFx)()(则称则称X 为连续型随机变量为连续型随机变量,其中函数其中函数f(x)称为称为X的概率的概率密度函数密度函数,简称为概率密度。概率密度具有如下性质:简称为概率密度。概率密度具有如下性质:0)(xf1)(dxxf21)()()(1221xxdxxfxFxFxXxP若若f(x)在点在点x处连续处连续,则有则有 )()(xfxF(二)随机变量的数字特征(二)随机变量的数字特征 1.随机变量的数学期望

12、随机变量的数学期望设设X 的分布列为的分布列为pk=PX=xk,k=1,2,1,2,若级数若级数绝对收敛,则称级数绝对收敛,则称级数 为为X的数学期望,记为:的数学期望,记为:1kkkp1kkkp1)(kkkpxXE【例例7.37.3】假设有十只相同的电器元件,其中有两假设有十只相同的电器元件,其中有两只废品。装配仪器时,从这批元件中任取一只,如果是只废品。装配仪器时,从这批元件中任取一只,如果是废品,则扔掉重新任取一只;如果仍是废品,则扔掉再废品,则扔掉重新任取一只;如果仍是废品,则扔掉再取一只。试求在取到正品之前,已取出的废品数的分布取一只。试求在取到正品之前,已取出的废品数的分布和数学期

13、望。和数学期望。解:设解:设X 表示取到正品之前已取出的废品数,显然表示取到正品之前已取出的废品数,显然X 是一个离散型的随机变量,其所有可能取值为是一个离散型的随机变量,其所有可能取值为0 0,1,2,1,2。且且 541080XP458910821XP45189108121XPX 的分布律如表的分布律如表7.57.5所示:所示:p表表7.5 7.5 离散型随机变量离散型随机变量X 的概率分布的概率分布 X0 1 2 0 1 2 p4/5 8/45 1/45 4/5 8/45 1/45 所以,废品数的数学期望为:所以,废品数的数学期望为:9245124581540)(XE(1 1)连续型随机

14、变量的数学期望)连续型随机变量的数学期望设设X 的密度函数为的密度函数为f(x),如果积分如果积分 绝对收敛,绝对收敛,则称此积分为则称此积分为X 的数学期望,即的数学期望,即dxxxf)(dxxxfXE)()(【例例7.47.4】设随机变量的概率密度为设随机变量的概率密度为 其他,0,21,2,10,)(xxxxxf求随机变量求随机变量X 的数学期望的数学期望E(X)。解:解:1)2()()(21102dxxxdxxdxxxfXE(2 2)随机变量函数的数学期望)随机变量函数的数学期望设设X为随机变量,则称为随机变量,则称h h=g(X)为随机变量为随机变量X 的函数,显的函数,显然然h h

15、 也是随机变量。其数学期望为:也是随机变量。其数学期望为:X为离散,且为离散,且h h =g(X),则,则 1)()()(kkpXgXEgEhX为连续,且为连续,且h h =g(X),则,则 dxxfxgXEgE)()()()(h【例例7.57.5】不妨再考虑例不妨再考虑例7.37.3,求废品数(离散型随,求废品数(离散型随机变量)平方的数学期望机变量)平方的数学期望E(X2 2)解:解:15445124581540)(2222XE【例例7.67.6】试求例试求例7.47.4中连续型随机变量的平方的数中连续型随机变量的平方的数学期望学期望E(X2 2)解:解:67)2()()(21210322

16、dxxxdxxdxxfxXE(3 3)数学期望的性质)数学期望的性质sE(c)=)=c(c为常数为常数);sE(aX)=)=aE(X);sE(X+b)=)=E(X)+)+b;sE(aX+b)=)=aE(X)+)+b;【例例7.77.7】设随机变量设随机变量X及及X2 2的数学期望分别为的数学期望分别为E(X)=1,)=1,E(X2 2)=7/6,)=7/6,试求试求E(X+3),+3),E(X2 2+3+3X+1)+1)解解:根据数学期望的性质,可以求得根据数学期望的性质,可以求得4313)()3(XEXE631113671)(3)()13(22XEXEXXE2.方差方差(1 1)方差的定义)

17、方差的定义设设X 为随机变量,若为随机变量,若EX-E(X)2存在,则称它为存在,则称它为X 的方的方差,记为差,记为:D(X)=EX-E(X)2并且并且 称为称为X 的标准差。为了方便,方差和标准差的标准差。为了方便,方差和标准差也可以用也可以用s s和和s s 2 2表示。表示。方差的计算方法方差的计算方法:)(XDX X为离散型,则为离散型,则X X为连续型,则为连续型,则 kkkpXExXD21)()(dxxfXExXD)()()(2简捷计算公式为简捷计算公式为 222)()()()(XEXEXEXEXD【例例7.87.8】根据例根据例7.37.3和例和例7.47.4,分别计算其中涉及

18、到,分别计算其中涉及到的随机变量的方差。的随机变量的方差。解解:根据前面得出的结果,对于例根据前面得出的结果,对于例7.3,7.3,E(X)=2/9,)=2/9,E(X2 2)=4/15=4/15 由方差的定义和计算公式,可以求得该离散型随机变量由方差的定义和计算公式,可以求得该离散型随机变量X 的方差为的方差为:40588)92(154)()()()(2222XEXEXEXEXD对于例对于例7.4,7.4,E(X)=1,)=1,E(X 2 2)=7/6,)=7/6,从而该连续型随机变从而该连续型随机变量的方差为量的方差为:61)1(67)()()()(2222XEXEXEXEXD(2 2)方

19、差的性质)方差的性质0)(cD)()(2XDkkXD)()(XDbXD)()(2XDkbkXD若若X 具有期望具有期望E(X)及方差及方差D(X),则,则X的标准化随的标准化随机变量机变量 )()(XDXEXh具有期望具有期望Eh h=0,=0,方差方差Dh h=1=1。3.协方差及相关系数协方差及相关系数(1 1)协方差与相关系数的定义)协方差与相关系数的定义量量EX-E(X)Y-E(Y)成为随机变量成为随机变量X 与与Y 的协方差,记的协方差,记为,即为,即Cov(X,Y),即即)()(),(YEYXEXEYXCov而而 )()(),(YDXDYXCovXY称为随机变量称为随机变量X 与与

20、Y 的相关系数。的相关系数。(2 2)协方差的性质)协方差的性质),(),(XYCovYXCov是常数baXYabCovbYaXCov,),(),(),(),(),(2121YXCovYXCovYXXCov思考一下思考一下如何证明如何证明【例例7.97.9】设随机变量设随机变量X 和和Y 的相关系数为的相关系数为0.90.9,若,若Z=X-0.4-0.4,试求,试求Y 与与Z 的相关系数的相关系数 YZ。解:因解:因Z=X-0.4-0.4,所以,所以 ),(),()4.0,(),(YXCovXYCovXYCovZYCov)()4.0()(XDXDZD9.0)()(),()()(),(XYYZX

21、DYDYXCovZDYDZYCov(三)常见随机变量的概率分布及数字特征(三)常见随机变量的概率分布及数字特征 1.常见离散型随机变量的概率分布及数字特征常见离散型随机变量的概率分布及数字特征常用的离散型概率分布包括两点分布、二项分布常用的离散型概率分布包括两点分布、二项分布、泊泊松分布。松分布。两点分布两点分布 (0-1)(0-1)分布分布 质量不质量不合格合格质量质量合格合格只有两种可能结果的随机试验,称之为只有两种可能结果的随机试验,称之为伯努利试验伯努利试验。比如检查一件产品的质量。比如检查一件产品的质量(要么合格,要么不合格)、抛一枚硬币(要么合格,要么不合格)、抛一枚硬币(要么出现

22、正面,要么出现反面)等。一(要么出现正面,要么出现反面)等。一般地,把两个试验结果分别看作是般地,把两个试验结果分别看作是“成功成功”与与“失败失败”,用数值,用数值“1”1”和和“0”0”表示。表示。将一次伯努利试验成功的次数定义为一个离散型随机将一次伯努利试验成功的次数定义为一个离散型随机变量,它的概率分布就是最简单的分布类型,即两点分布。变量,它的概率分布就是最简单的分布类型,即两点分布。设随机变量设随机变量X 只可能取只可能取0 0和和1 1两个值,它的概率分布为:两个值,它的概率分布为:1,0,)1()(1kppkXPkk如表如表7.67.6所示所示:X0 01 1pk1-pp则称则

23、称X 服从两点分布,也称为服从两点分布,也称为0-10-1分布。分布。两点分布的数学期望和方差为:两点分布的数学期望和方差为:)1()(,)(ppXDpXEp是指一是指一次伯努利次伯努利试验中成试验中成功地可能功地可能性大小性大小 二项分布二项分布n重伯努利试验重伯努利试验 一次试验只有两种可能结果,即一次试验只有两种可能结果,即“成功成功”和和“失失败败”;一次试验一次试验“成功成功”的概率为的概率为p ,“,“失败失败”的概率为的概率为q=1-=1-p,而且概率,而且概率p对每次试验都是相同的;对每次试验都是相同的;试验是独立重复地进行了试验是独立重复地进行了n次;次;在在n次试验中,次试

24、验中,“成功成功”的次数对应一个离散型随机的次数对应一个离散型随机变量,用变量,用X 来表示。来表示。在在n重贝努里试验中,重贝努里试验中,“成功成功”的次数的次数X 服从参数为服从参数为n、p的二项分布,记为的二项分布,记为 X B(n,p)。二项分布的概率函数:二项分布的概率函数:pqpkppCkpxnxxnn1,10.,2,1,0)1()(二项分布适用于放回摸球、掷硬币、产品检查、婴儿性二项分布适用于放回摸球、掷硬币、产品检查、婴儿性别调查等,当时二项分布就是两点分布。别调查等,当时二项分布就是两点分布。二项分布的数学期望和方差为:二项分布的数学期望和方差为:)1()(,)(pnpXDn

25、pXE【例例7.97.9】已知一批产品的次品率为已知一批产品的次品率为4 4,从中有放回,从中有放回(抽取后再放回去)地抽取(抽取后再放回去)地抽取5 5个。求个。求5 5个产品中个产品中(1 1)没有次品的概率;)没有次品的概率;(2 2)恰好有一个次品的概率。)恰好有一个次品的概率。解解:根据题意,该问题相当于根据题意,该问题相当于5 5重伯努利试验,每次试重伯努利试验,每次试验若把验若把“抽取次品抽取次品”当作当作“成功成功”,那么,那么p=4%=4%。设设X为抽为抽取的次品数,显然有取的次品数,显然有XB(5,0.045,0.04),从而根据定义就有:,从而根据定义就有:815.0)0

26、4.01()04.0()0(05005CXP170.0)04.01()04.0()1(15115CXP 泊松分布泊松分布 X 服从泊松分布,记为服从泊松分布,记为XP():泊松分布的概率函数为:泊松分布的概率函数为:e!)(xxXPx泊松分布的数学期望和方差为:泊松分布的数学期望和方差为:)(,)(XDXE2.常见连续型随机变量的概率分布及数字特征常见连续型随机变量的概率分布及数字特征 均匀分布均匀分布 其他01)(bxaabxf分布函数为:分布函数为:01xaxaFxaxbbaxb概率密度为:概率密度为:期望和方差为:期望和方差为:12)()(,2)(2abXDbaXE密度函数为密度函数为

27、:00,00,)(xxexfx分布函数为:分布函数为:0001xxexFx期望和方差为:期望和方差为:21)(,1)(XDXE指数分布指数分布 正态分布正态分布 一般正态分布一般正态分布 密度函数为:密度函数为:xexfx,21)(222)(ss密度函数的两个特殊的性质:密度函数的两个特殊的性质:f(x)处处连续;处处连续;曲线曲线f(x)关于关于x=对称;对称;分布函数为分布函数为:xtdtexXPxF222)(21)()(ss期望和方差为期望和方差为:2)(,)(sXDXE标准正态分布标准正态分布 密度函数为:密度函数为:xexx,2122分布函数为:分布函数为:dtexXPxtx2221

28、)()(F标准正态分布具有以下性质:标准正态分布具有以下性质:21)0();0(),(1)(FFFaaa)()()(abdxxbXaPbaFF 若若XN(,s s 2),则随机变量,则随机变量 服从标准正态分布,服从标准正态分布,即即XN(0,1)(0,1)若若X XN N(,s s 2 2),要求,要求P(x1 1 X 3|3s s 的概率很小,因此可认为正态随机变量的取的概率很小,因此可认为正态随机变量的取值几乎全部集中在值几乎全部集中在 3 3s s,+3+3s s 区间内。区间内。一般正态分布与标准正态分布的关系一般正态分布与标准正态分布的关系二、抽样及抽样分布二、抽样及抽样分布(一)

29、抽样方法(一)抽样方法 抽样的基本概念抽样的基本概念总体总体又称为全及总体或者母体,是由具有某种特定性质的又称为全及总体或者母体,是由具有某种特定性质的许多个别事物组成的整体,也就是我们所要调查研究的现许多个别事物组成的整体,也就是我们所要调查研究的现象的全体。组成总体的每个个别事物叫总体单位,总体单象的全体。组成总体的每个个别事物叫总体单位,总体单位数通常用位数通常用N表示。表示。样本样本也称为子样,是由从总体中按照随机原则抽取的一部也称为子样,是由从总体中按照随机原则抽取的一部分单位所构成的集合体。样本种单位数的多少称为样本容分单位所构成的集合体。样本种单位数的多少称为样本容量,通常用量,

30、通常用n表示。一般来说,当表示。一般来说,当n大于等于大于等于3030时,所取样时,所取样本就成为大样本;反之,就称为小样本。本就成为大样本;反之,就称为小样本。总体指标总体指标 总体指标是指反映总体数量特征的综合指标,又称总体总体指标是指反映总体数量特征的综合指标,又称总体参数。在一个总体中,总体指标是唯一确定的量,而且是一参数。在一个总体中,总体指标是唯一确定的量,而且是一个未知的量,需要通过样本进行推算。个未知的量,需要通过样本进行推算。常用的总体指标有总体平均数、总体标准差、总体成数常用的总体指标有总体平均数、总体标准差、总体成数和总体成数的标准差等,分别用和总体成数的标准差等,分别用

31、,s s,P ,s sp来表示。来表示。总体标准差的计算公式为:总体标准差的计算公式为:NX2)(s总体成数标准差的计算公式为:总体成数标准差的计算公式为:)1(PPPsX X表示总体表示总体单位的某数单位的某数量标志值量标志值 P P总体中具有总体中具有某一标志表现某一标志表现的单位数在总的单位数在总体单位数中所体单位数中所占的比重。占的比重。样本指标样本指标反映样本数量特征的综合指标,又称为样本统计量。反映样本数量特征的综合指标,又称为样本统计量。样本指标有样本平均数、样本标准差、样本成数和样本样本指标有样本平均数、样本标准差、样本成数和样本成数的标准差,分别用成数的标准差,分别用 表示。

32、表示。pspsx,样本标准差的计算公式为:样本标准差的计算公式为:1)(2nxxs样本成数标准差的计算公式为:样本成数标准差的计算公式为:)1(ppspx表示样本总体单位的某数量标志值表示样本总体单位的某数量标志值 p表示样本成数,即样本中具有某一标志表现的单位表示样本成数,即样本中具有某一标志表现的单位数在样本单位数中所占的比重。数在样本单位数中所占的比重。抽样方法抽样方法概率抽样概率抽样非概率抽样非概率抽样重复抽样重复抽样不重复抽样不重复抽样简单随机抽样简单随机抽样等距抽样等距抽样 分层抽样分层抽样 整群抽样整群抽样 多级抽样多级抽样 即放回抽样。比如,要从即放回抽样。比如,要从总体总体N

33、个单位中随机抽取个单位中随机抽取容量为容量为n的样本,每次从的样本,每次从总体中抽取一个单位,把总体中抽取一个单位,把这看作是一次试验,将结这看作是一次试验,将结果记录后放回总体中,重果记录后放回总体中,重新参加下一次的抽取;将新参加下一次的抽取;将此过程连续进行此过程连续进行n次次 即不放回抽样,是指从即不放回抽样,是指从总体中抽取的单位不再总体中抽取的单位不再放回去,只从剩下的单放回去,只从剩下的单位中进行抽取位中进行抽取 等距抽样也称为系统抽样,等距抽样也称为系统抽样,它是按照某种顺序给总体它是按照某种顺序给总体中所有单元编号,然后随中所有单元编号,然后随机地抽取一个编号作为样机地抽取一

34、个编号作为样本的第一个单元,样本的本的第一个单元,样本的其它单元则按照某种确定其它单元则按照某种确定的规则抽取(如等距原则)的规则抽取(如等距原则)先将总体按照某种特征先将总体按照某种特征或指标分成几个排斥的或指标分成几个排斥的又是穷尽的子总体,或又是穷尽的子总体,或层,然后在每个层内按层,然后在每个层内按照随机的方法抽取元素照随机的方法抽取元素 先将总体划成许多相互先将总体划成许多相互排斥的子总体或群,然排斥的子总体或群,然后以群为初级抽样单元,后以群为初级抽样单元,按某种概率抽样技术,按某种概率抽样技术,如简单随机抽样,从中如简单随机抽样,从中抽取若干个群,对抽中抽取若干个群,对抽中的群内

35、的所有单元都进的群内的所有单元都进行调查行调查 第一阶段从所有群中第一阶段从所有群中抽取若干群,在每个抽取若干群,在每个抽中的群中,再抽取抽中的群中,再抽取若干单元进行调查若干单元进行调查 (二)抽样分布(二)抽样分布 1.抽样分布的基本类型抽样分布的基本类型 2 2分布分布 222212.nXXX概率密度函数为概率密度函数为:0,00,)2(21)(2122yyeynyfynn期望和方差为期望和方差为:nDnE2)(,)(22 t 分布分布 nYXt/概率密度函数为概率密度函数为:tntnnnthn,)1()2()21()(212根据根据 函数的性质,有函数的性质,有 2221)(limtn

36、eth即当即当n足够大时,足够大时,t 分布近似于标准正态分布分布近似于标准正态分布N(0,1)(0,1)。F分布分布 21/nVnUF概率密度函数为概率密度函数为:0,00)1)(2()2()(21()(221211)2/(2/212111yynynnnynnnyfnnnn 2.常见的抽样分布常见的抽样分布样本均值的抽样分布样本均值的抽样分布 (1 1)重复抽样条件下样本均值的抽样分布)重复抽样条件下样本均值的抽样分布单个样本均值的抽样分布单个样本均值的抽样分布m 如果抽取的样本是大样本,样本均值如果抽取的样本是大样本,样本均值 的概率分布趋的概率分布趋近于期望为近于期望为,方差为方差为s

37、s2 2/n的正态分布,即的正态分布,即x),(2nNxs将样本均值这一随机变量标准化将样本均值这一随机变量标准化,得到一个数学期望为得到一个数学期望为0 0且方差为且方差为1 1的标准正态变量,即此标准正态变量为的标准正态变量,即此标准正态变量为z,则有:,则有:)1,0(/Nnxzs两个样本均值之差的抽样分布两个样本均值之差的抽样分布假设假设X1 1、X2 2是两个相互独立的正态总体,是两个相互独立的正态总体,现从两个总现从两个总体中分别抽取容量为体中分别抽取容量为n1 1和和n2 2的两个简单随机样本,则两个的两个简单随机样本,则两个样本均值之差样本均值之差 的抽样分布仍然服从正态分布,

38、其数的抽样分布仍然服从正态分布,其数学期望为学期望为:21XX 2121 XXE方差为:方差为:22212121nnXXDss如果如果X1 1、X2 2是两个相互独立的非正态总体,只要样本是两个相互独立的非正态总体,只要样本容量足够大容量足够大(n1 1,n2 23030),两个样本均值之差,两个样本均值之差 的抽样的抽样分布近似服从正态分布,其数学期望和方差不变。分布近似服从正态分布,其数学期望和方差不变。21XX(2)(2)不重复抽样条件下样本均值的抽样分布不重复抽样条件下样本均值的抽样分布不重复抽样与重复抽样条件下的情况基本相同不重复抽样与重复抽样条件下的情况基本相同,惟一不惟一不同的是

39、样本方差不再是同的是样本方差不再是s s2/n,而是等于重复抽样的样本均值而是等于重复抽样的样本均值的方差乘以修正因子的方差乘以修正因子 。所以只要样本的容量足够大所以只要样本的容量足够大,样本均值样本均值 的概率分布的概率分布趋近于期望为趋近于期望为,方差为,方差为 的正态分布,即的正态分布,即 1NnNx12NnNns1,2NnNnNxs 样本成数的抽样分布样本成数的抽样分布(1 1)重复抽样条件下样本成数的抽样分布)重复抽样条件下样本成数的抽样分布 单个样本成数的抽样分布单个样本成数的抽样分布 大样本条件下样本成数大样本条件下样本成数p近似地服从均值为总体成数近似地服从均值为总体成数P,

40、方差为方差为P(1-(1-P)/)/n的正态分布,即的正态分布,即 )1(,(nPPPNp样本成数进行标准化变换后,得到一个数学期望为样本成数进行标准化变换后,得到一个数学期望为0 0且且方差为方差为1 1的标准正态变量,即此标准正态变量为的标准正态变量,即此标准正态变量为z,则有:,则有:)1,0(/)1(NnPPPpz两个样本成数之差的抽样分布两个样本成数之差的抽样分布数学期望为:数学期望为:2121PPppE方差为:方差为:2221112111nppnppppDP P1 1、p p2 2分别是分别是具有某种特征具有某种特征的单位在各自的单位在各自总体中的比例总体中的比例 n1 1、n2

41、2为分别从两个相对为分别从两个相对独立的总体中抽取出的两个独立的总体中抽取出的两个简单随机样本的容量数简单随机样本的容量数n1 1、n2 230,30,且且 n1 1p1 1、n1 1(1-(1-p)和和n2 2p2 2、n2 2(1-(1-p2 2)都大于等于都大于等于5 5样本方差的抽样分布样本方差的抽样分布 (1)(1)重复抽样条件下样本方差的抽样分布重复抽样条件下样本方差的抽样分布 单个样本方差的抽样分布单个样本方差的抽样分布 如果观测的总体服从正态分布,则来自正态总体的一个如果观测的总体服从正态分布,则来自正态总体的一个容量为容量为n的简单随机样本,其样本方差的简单随机样本,其样本方

42、差 与与总体方差的比值的总体方差的比值的n-1-1倍,倍,服从自由度为服从自由度为n-1-1的的 2 2分布,即分布,即有:有:)1/()(22nxxs)1()1(222nsns(2)(2)不重复抽样条件下样本成数的抽样分布不重复抽样条件下样本成数的抽样分布样本方差不再是样本方差不再是P(1-P)/n,而是等于重复抽样的样本均而是等于重复抽样的样本均值的方差乘以修正因子值的方差乘以修正因子N-n/N-1-1,即在不重复抽样条件下,即在不重复抽样条件下,样样本均值的方差为:本均值的方差为:所以只要样本的容量所以只要样本的容量n足够大足够大,样本均值样本均值 的概率分布的概率分布趋近于期望为趋近于

43、期望为,方差为,方差为 的正态分布,的正态分布,即即 x1)1(2NnNnPPps1)1(2NnNnPPps1)1(,NnNnPPPNp两个样本方差之比的抽样分布两个样本方差之比的抽样分布 假设假设,X1 1和和X2 2是两个相互独立的正态总体,是两个相互独立的正态总体,现从两个总体中分别抽取容量为和的两个简单现从两个总体中分别抽取容量为和的两个简单随机样本,随机样本,S12、S22分别是他们的样本方差,则统计量为:分别是他们的样本方差,则统计量为:),(2111sNX),(2222sNX22222121/ssSSF 服从自由度为服从自由度为(n1 1-1-1,n2 2-1)-1)的的F分布。分布。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!