抽样与参数估计

上传人:陆** 文档编号:170692068 上传时间:2022-11-22 格式:DOCX 页数:20 大小:129.40KB
收藏 版权申诉 举报 下载
抽样与参数估计_第1页
第1页 / 共20页
抽样与参数估计_第2页
第2页 / 共20页
抽样与参数估计_第3页
第3页 / 共20页
资源描述:

《抽样与参数估计》由会员分享,可在线阅读,更多相关《抽样与参数估计(20页珍藏版)》请在装配图网上搜索。

1、第四章推断统计:利用样本统计量对总体某些性质或数量特点进行推断。从数据得到对现实世界的结论的过程就叫做统计推断 (statisticalinference)。那个调查例子是估量总体参数(某种意见的比例)的一个过程。估量 (estimation) 是统计推断的重要内容之一。统计推断的另一个要紧内容 是本章第二节要介绍的假设检验 (hypothesis testing) 。因此本节内容确实是由样本数据对总体参数进行估量,即:学习目标:了解抽样和抽样分布的差不多概念明白得抽样分布与总体分布的关系了解点估量的概念和估量量的优良标准把握总体均值、总体比例和总体方差的区间估量第一节 抽样与抽样分布 回忆相

2、关概念:总体、个体和样本 抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并 依照样本数据所提供的信息来推断总体的数量特点。总体(Population):调查研究的事物或现象的全体参数个体(Item unit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体统计量样本容(Sample size):样本中所含个体的数量一样将样本单位数许多于三十个的样本称为大样本,样本单位数不到三十 个的样本称为小样本。一、抽样方法及抽样分布1、抽样方法(1)、概率抽样:依照已知的概率选取样本 、简单随机抽样:完全随机地抽选样本,使得每一个样本都有相同的机 会(概率)被

3、抽中。注意: 在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为 重复抽样与不重复抽样。而且,依照抽样中是否排序,所能抽到的样本个数往 往不同。 、分层抽样:总体分成不同的“层”(类),然后在每一层内进行抽样 、整群抽样:将一组被调查者(群)作为一个抽样单位 、等距抽样:在样本框中每隔一定距离抽选一个被调查者(2)非概率抽样:不是完全按随机原则选取样本 、非随机抽样:由调查人员自由选取被调查者 、判定抽样:通过某些条件过滤来选择被调查者(3)、配额抽样:选择一群特定数目、满足特定条件的被调查者2、抽样分布 一样地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分

4、布(sampling distribution某个样本统计量(如均值、比例、方差等)的抽样分布,从理论上说确实是在重复选取容量为n的样本时,由每一个样本运算出的该统计量数值的相对频数分布 或概率分布。二、样本均值的抽样分布与中心极限定理1、样本均值的抽样分布(一个例子)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别 为 X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下另Xi-i1N均值和方差( x -卩)i 2 = I= 1.25N样本均值的抽样分布123接收频率现从总体中抽取n = 2的简单随机样本,在重复抽样条件下,共有42 = 16个样本。

5、所有样本的结果如下表所有可能的n=2的样本(共16个)第一个观看值第二个观看值1,11,21,31,42,12,22,32,43,13,23,33,44,14,24,34,4运算出各样本的均值,如下表。并给出样本均值的抽样分布nxi卩_ i=1左 M1.0+1.5+4.0162.5 卩 (x 卩=)2i-XO 2 i=1疋M=(1.0 2.5)2 + + (4.0 2.5)2 = 062516 .O2n16个样本的均值(x)第一个观看值第二个观看值1.01.52.02.51.52.02.53.02.02.53.03.52.53.03.54.0所有样本均值的均值和方差:式中:M为样本数目 比较及

6、结论: 1. 样本均值的均值(数学期望)等于总体均值2. 样本均值的方差等于总体方差的 1/n2、中心极限定理当总体服从正态分布N (卩,。2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X的数学期望为,方差为。2/n。即xN(U,o2/n)中心极限定理:设从均值为P,方差为O2的一个任意总体中抽取容量为n的样 本,当n充分大时(一样,N 30就能够用中心极限定理了),样本均值X的抽 样分布近似服从均值为P、方差为o2/n的正态分布。即有:丄h和ix vn也即有,X -卩 N(0,1)N事实上,样本均值抽样分布的数字特点一方面与总体分布的均值和方差有关,另 一方面也与抽样的方法是

7、重复抽样依旧不重复抽样有关。不管是重复抽样或不重 复抽样,样本均值的数学期望始终等于总体的均值。但在不重复抽样条件下,样 本均值的方差需要用修正系数N二去修正重复抽样时均值的方差。当N专门大,而N/N =5且n(l-p)=5)满足时,与p相关的样本为大样本),样本比例抽样分布趋 向于以样本期望值为中心、以样本方差为方差的正态分布1、期望值(Expected value ofp): E (p)=P2、标准差(Standard deviation of p):不重复抽样:重复抽样:*四、样本方差的抽样分布要用样本方差s2去推断总体的方差。2必须明白样本方差的分布。设总体服从正态分布XN (口,0

8、2 ),X1, X2, , Xn 为来自该正态总体的样本统计证明比值的抽样分布为自由度是)的X2分布即:Y ( - x)/ x 2 (n -1)ivn - Ds 2i=8 2 8 2X 2分布的性质:(1)、X 2分布的变量始终为正;2)、X22(n )Ln,2n 。第二节 参数估量的差不多方法一、估量量和估量值参数是总体的数值特点 A parameter is a numerical characteristic of a population。) 参数估量:确实是用样本统计量去估量总体的参数。数字特点总体参数(0)样本统计量(0)个 总 体均值Ax比例PP方差5 2s 2估量量(9)( e

9、stimator )用于估量总体某一参数的样本统计量(随机变量)的名称。样本均值,样本比例、样本方差等都能够是一个估量量。估量值(estimate):用来估量总体参数时运算出来的估量量的具体数值。例如:样本均值确实是总体均值卩的一个估量量假如样本均值匚=3,则3确实是卩的估量值二、点估量与判定估量量的优良性准则(一)、点估量点估量(Point Estimate)确实是用样本估量量的值直截了当作为总体参数的估量值。设0是总体分布中一个要估量的参数。例如,总体分布的均值、方差等。现在从 总体中得到一个随机样本X , X,,X,如何估量0 ?1 2 n记估量0的估量量(统计量)为0 (x , X,,

10、X ),简记为o1 2 n若得到一组样本观看值x ,x ,.,x,就能够得到0的估量值:0 (x ,x ,.,x ),也1 2 n 1 2 n记为0。总体分布参数0 的点估量,确实是求出的估量值0。点估量的方法一样有矩估量发法、极大似然估量法等。概念要点:1. 从总体中抽取一个样本,依照该样本的统计量对总体的未知参数作出一个数值 点的估量。例如: 用样本均值作为总体未知均值的估量值确实是一个点估量2. 点估量没有给出估量值接近总体未知参数程度的信息3. 其理论基础是抽样分布(二)、估量量的优良性准则要估量总体的某一指标,并非只能用一个样本指标,而可能有多个指标可供选择, 即对同一总体参数,可能

11、会有不同的估量量。作为一个好的估量量,估量量必须 具有如下性质:无偏性、有效性、一致性。1无偏性(Unbiasedness ):样本估量量的数学期望(均值)等于被估总体参数的真值;假如E(0 ) =0,贝y称0为0的无偏估量量。能够证明,总体方差b 2的样本矩估量量s 2是无偏估量量。2、有效性(Efficiency):好的点估量量应具有较小的方差;在用估量量0来估量总体的某个参数0时,假如对其它所有对0 的估量量0总是有:Var() Var0 )那么,那个估量量0确实是总体参数9的有效估量量。3、一致性(Consistency):随着样本容量的增大,估量量越来越接近被估量的总体参数。假如9

12、满足:lim P(9 -9)= 1,即:nI nnslim 9 =9nns则称为9 的一致估量量。n能够证明:样本均值、样本比例、样本标准差的点估量是无偏、有效、一致的三、抽样误差与区间估量(一)、抽样误差(Sampling Error) 一个样本能够得到总体参数的一个点估量,该点估量值与总体参数真值之间的差 异,即为抽样误差。有三个相互联系的概念:1、实际抽样误差:具体样本的估量值9 与总体参数的实际值9 之间的离差(9 - 9)2、抽样平均误差:所有可能样本估量值与相应总体参数的平均差异程度。3、抽样极限误差一定概率下抽样误差的可能范畴(也称承诺误差):9 -9 、统计学上往往用抽样极限误

13、差来测度抽样误差的大小或者说测度点估量的精 度。缘故:总体参数值往往并不明白,因此,实际抽样误差与抽样平均误差也往 往无法求出,但在抽样分布大体明白的情形下,抽样极限误差是能够估量出来的。 、 抽样平均误差是所有可能样本值与总体指标值之间的平均离差,它说明抽样估量的准确度;而抽样极限误差是样本指标值与总体指标值的离差绝对值是说明 抽样估量的准确程度的范畴。这也就决定了两者存在一定的联系。通常,把抽样 极限误差与抽样平均误差相比,从而使单一样本的抽样极限误差标准化,一样称 为概率度或相对误差范畴,即置信度。 抽样极限误差的估量总是要和一定的概率保证程度联系在一起的。缘故:样本 统计量往往是一随机

14、变量,它与总体参数真值之差也是一个随机变量,因此就不 能期望某次抽样的样本估量值落在一定区间内是一个必定事件,而只能给予一定 的概率保证。因此,在进行抽样估量时,既需要考虑抽样误差的可能范畴,同时 还需考虑落到这一范畴的概率大小。前者是估量的准确度问题,后者是估量的可 靠性问题,两者紧密联系不可分开。这也正是区间估量所关怀的要紧问题。(二)、区间估量(Interval Estimate)在点估量的基础上,给出总体参数估量的一范畴,称为参数的区间估量。若总体分布含一个未知参数0,找出了两个依靠于样本X ,X,,X的估量量:12n0 (X ,X,,X ) 0 (X ,X,,X )112n212n使

15、得P(0 0 0 )二 1 -a1 2其中,0 Ya Y1,显著性水平a 一样取0.05或0.01,则称随机区间为的100(1-a ) %的置信区间。百分数100 (1-a ) %被称为置信度或置信水平。1. 依照一个样本的观看值给出总体参数的估量范畴给出总体参数落在这一区间的概率例如:总体均值落在5070之间,置信度为95%2、置信水平 总体未知参数落在区间内的概率 .表示为(1 -a), a为显著性水平,是总体参数未在区间内的概率 .常用的显著性水平值有99%, 95%, 90%,相应的a为0.01, 0.05, 0.10。3、区间估量的要点 依据样本指标和抽样误差去推算总体指标时,只是确

16、定了总体指标的估量范 畴,并没有确定其具体值。那个范畴表现为一个上限和一个下限,从而构成一个 区间。 所得的估量区间表示的只是一个可能范畴,而不是绝对的范畴。总体指标在 那个范畴内的可能性为置信概率(1 -)。 扩大抽样极限误差能够提高抽样推断的可靠程度,但准确程度会降低;反之, 缩小抽样极限误差会降低抽样推断的可靠程度,但准确程度会提高。第三节 一个总体参数的区间估量4.3.1总体均值的区间估量1、区间估量的差不多原理以总体均值的区间估量为例来说明区间估量的差不多原理。在重复抽样或无限总体抽样的情形下,我们明白有e(X)二卩、。一=2,由此X n能够明白样本均值X落到总体均值卩的两侧各为一个

17、抽样标准差范畴内的概率0.687 3;落在两个抽样标准差范畴内的概率为0.954 5。而实际上,X是已知的, 卩而是未知的,也正是我们要估量的。由于X和卩的距离是对称的,因此假如 有95%的样本均值落在卩的两个标准误差的范畴内,则也确实是说,约有95% 的样本均值所构成的两个标准误差的区间会包括卩。即若有P(卩26 _ X 卩 + 26 一)沁 95%XX则有P(卩26 _ X 卩 + 26 一)二 P(X 26 一 卩 X + 26 一)沁 95%XXXX通俗地说,假如我们抽取 100 个样本来估量总体的均值,有 100 个样本均值所构成的 100 个区间中,约有 95 个区间包含总体均值。

18、2、正态总体且方差已知,或非正态总体、方差未知、大样本当总体服从正态总体且方差已知,或非正态总体、方差未知但大样本时,样本均值的抽样分布为正态分布,有E(X)二卩、c_=2。即 x *X-uz 二N (0,1)5对显著性水平a,有P ( z Z Z ) = 1 - a,即有:a 2a 2P (X Z c / 7 n u 30)X土Z/历a2X 土 Z s / 扁a2小样本(n 30)X 土 Z/4na2x土tS/Jna2( n-1)非正态 分布大样本(n 30)X 土 Z g hjna2X 土 Z s/扁a2备注假如采取不重复抽样,而且抽样比专门大时,_ g |N-n七莎N -14.3.2 总

19、体比例的区间估量1、大样本重复抽样时的估量方法当样本容量专门大时,样本比例p的抽样分布服从正态分布近似。即假如 n - p 5 且 n - (1 - p) 5,则pN(兀,乞),其中“为总体的比例。n样本比例p通过标准化后的随机变量服从标准正态分布,即p 冗严(1-冗)n则总体比例兀在置信水平(1 -a )下的置信区间为:冗-(1 -冗) N用上式运算总体比例兀的置信区间时,兀的值应该是已知的,但实际上却不然, 兀的值恰恰是我们要估量的,因此我们用样本的比例p来代替兀,现在运算总体比例兀的置信区间可表示为:Z . p (1 p)是估量总体 n24.3.6)式中Za为标准正态分布右侧面积为a f

20、 2时的Z值,2比例时的边际误差。总体比例的置信区间有两部分组成:总体比例的点估量值和描述估量量精确度的 土值,那个土值称为边际误差。2、大样本不重复抽样时的估量方法在不重复抽样条件下,样本比例p的方差为:5 2 =理上刃 (J)p n N 1 现在总体比例兀在置信水平(1 -a )下的置信区间为:4.3.7)【例】某企业在一项关于职工流淌缘故的研究中,从该企业前职工的总体中随机 选取了 200 人组成一个样本。在对其进行访问时,有 140 人说他们离开该企业 是由于同治理人员不能融洽相处。试对由于这种缘故而离开该企业的人员的真正 比例构造 95%的置信区间。解:已知 n=200, p =0.

21、7, n* p =1405, n*(1-p)=605, a= 0.95,Za/2=1.96依照式(4.3.6),得(p土Z 0已)=(0.7土 1.96:四辺)n2002=(0.636,0.764)因此我们能够以 95的概率保证该企业职工由于同治理人员不能融洽相处而离 开的比例在 63.6%76.4%之间设X , X,,X来自正态总体X e N(卩,6 2)的容量为n的样本,参数6未知。为12n了估量6 2,可依照样本方差s2来确定其在置信水平(1 -a)下的置信区间。aa从Z 2分布表中查得咒1a2和吒2( P(咒2 Za-2)=込;P(咒2 %1纭2)= 1 -込),使得下式成立:(n -

22、 1)s 2P(咒2X2 ) = 1 -a1-a 26 2a 2即:P(n -1)s 2(n -1)s2)=1 -a因此,总体参数6 2在置信水平(1-a)下的置信区间为:4.3.8)(n 一 1) s 2 (n 一 1) s 2 X2 %2a 21-a 2【例】假定 A 品牌 25公斤袋装大米的重量服从正态分布。现随机抽取 13 袋测得它们的重量分别是:24.0、24.2、24.4、24.6、24.7、24.8、25.0、25.1、 25.1、25.2、25.3、25.4、25.6 公斤,试以 95%的置信水平估量该品牌袋装大 米重量的标准差。解:因为a = 0.05,n-1 =12,查%2

23、分布表,得:X ia2 = 4.404 和 Xa 2=23.337因此,置信水平为95%的总体方差的置信区间是1212s 2 6 2 s 223.3374.404由原始数据可运算得到s2 =0-23,代入上式得:0.1186 2 0.627因此 0.34 6 0.79所求信区间是:(0.34, 0.79)第四节 样本容量的确定1、确定样本容量的理论依据样本容量对估量精度有较大的阻碍,从理论上说,样本容量越大,对总体特 点的估量误差越小;但从实践角度看,抽样数目过大,则会增大调查及相关的工 作量。因此,样本容量的确定是至关重要的。一样说来,抽样数目以满足在一定的概率保证下抽样误差不超过给定的承诺

24、 范畴的最小样本容量为界。因此,可依照抽样极限误差与抽样数目的关系来确定 抽样数。 说明:确定样本容量时一样要考虑抽样方法的阻碍,即重复抽样和不重复抽样。2、总体均值参数估量中抽样数目的确定为了简单,可直截了当考虑大样本的情形,这时样本均值x服从正态分布即因此在 1- a 的置信度下,存在临界值 Z a/2 ,使得或 x-川 Z . b(x)依照抽样极限误差的定义,若用a 2样本均值估量总体均值的极限误差(边际误差)为A_,则: xZ b(X)二 Z(b / ,:n)二 A-a 2a 2x故,在该置信度下,假如承诺误差为A一时,能够其为极限误差解出必须的抽样 x数:)b 2 /Ala 2 x由

25、此可知,此抽样数目由总体方差、承诺误差以及概率保证程度三者确定。例】一家广告公司想估量某类商店去年所花的平均广告费用有多少。体会说明,总体方差约为 1800000 元。如置信度取 95%,并要使估量处在总体平均值邻近 500 元的范畴内,这家广告公司应抽多大的样本? 解:已知5 2=1800000,a=0.05, Za/2=1.96,A_ =500应抽取的样本容量为:xn = V2 b 2 A2.a 2 x=(1.96)2 (1800000)/5002=27.65 沁 283、总体比例参数估量中的抽样数目确定在大样本下,样本比例的分布趋近于如下正态分布pN(P, P(1 -P)/n),因此:N

26、(0,1),P(1 - P) n设在 1-a 的置信度下,对应的临界值为 Za/2 ,则易知|p - P Z P(1- P):n因此,假如承诺误差为Ap,可得最小的抽样数目: 注:1、假如总体方差或总体比例未知,可用样本方差或样本比例代替。2、为了保证抽样推断的把握程度,若有多个可供参考的方差数值,应选其 中方差最大值来运算。关于比例的方差,比例应取接近50%的样本(Why?)。 【例】一家市场调研公司想估量某地区有彩色电视机的家庭所占的比例。该公司 期望对比例P的估量误差不超过0.05,要求的可靠程度为95%,应抽多大容量 的样本(没有可利用的 p 估量值)解:已知Ap =0.05,a=0.05,Z“2=1.96,当p未知时用最大方差0.25代替.应抽(0.05)2取的样本容量为二(1.96)2 (0.5) (1 0.5)

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!