统计学抽样分析PPT课件

上传人:痛*** 文档编号:144195278 上传时间:2022-08-26 格式:PPT 页数:146 大小:1.50MB
收藏 版权申诉 举报 下载
统计学抽样分析PPT课件_第1页
第1页 / 共146页
统计学抽样分析PPT课件_第2页
第2页 / 共146页
统计学抽样分析PPT课件_第3页
第3页 / 共146页
资源描述:

《统计学抽样分析PPT课件》由会员分享,可在线阅读,更多相关《统计学抽样分析PPT课件(146页珍藏版)》请在装配图网上搜索。

1、抽样估计的现实应用抽样估计的现实应用例例1 一汽车轮胎制造商生产一种被认为一汽车轮胎制造商生产一种被认为寿命更寿命更长的新型轮胎长的新型轮胎。120个个样本样本测试平均里程:36,500公里推断新轮胎新轮胎平均寿命平均寿命:36,500公里400个样本 支持人数:160推断支持该候选人的选民支持该候选人的选民占全部选民的比例:占全部选民的比例:160/400=40%例例2:某党派想支持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计支持该候选人的民众支持该候选人的民众占全部登记投票人总数的比例占全部登记投票人总数的比例。由于时间及财力的限制:本章要求:本章要求:教学目的

2、:教学目的:本章阐述参数估计的理论与方法,通过学习使学生能运用不同的抽样方式对总体参数进行估计及进行假设检验。教学重点及难点:教学重点及难点:教学重点:教学重点:抽样误差的计算;简单随机抽样下总体参数的区间估计及简单随机抽样下样本单位数的计算;假设检验。教学难点:教学难点:抽样平均误差的计算,参数的区间估计。主要教学内容及要求:主要教学内容及要求:1、了解抽样方案设计的主要内容和抽样方案的检验;了解抽样分布的概念和定理;2、理解抽样法的意义、特点;3、掌握抽样误差、抽样平均差和抽样极限误差等概念的涵义;掌握影响抽样误差大小的因素;掌握确定必要样本单位数目的方法;掌握统计假设检验。4、熟练掌握抽

3、样推断中的基本原理和方法,能够利用样本资料推断总体指标。5、能运用excel计算有关样本统计量,进行总体参数的区间估计。统计推断统计推断参数(未知量)参数(未知量)统统计量(已知量)计量(已知量)第二节第二节 抽样调查的基本概念及抽样调查的基本概念及理论依据理论依据 一、全及总体和抽样总体一、全及总体和抽样总体 二、全及指标和抽样指标二、全及指标和抽样指标 三、抽样方法和样本的可能数目三、抽样方法和样本的可能数目 四、四、抽样调查的理论依据抽样调查的理论依据研究对象的全体,即第一章中研究对象的全体,即第一章中学过的总体。学过的总体。按随机原则从全及总体中抽取一按随机原则从全及总体中抽取一部分单

4、位组成的集合体,又叫抽样部分单位组成的集合体,又叫抽样总体。总体。样本总体中所包括的单位数叫样本容样本总体中所包括的单位数叫样本容量,一般用量,一般用n n表示表示1 1、大样本(、大样本(n30 2n30 2、小样本、小样本(n30(n30)全及总体中所包括的单位数一般用全及总体中所包括的单位数一般用N表示。表示。1、有限总体有限总体 2、无限总体、无限总体NNXXX,210N1NmiimiiiNiiffXXNXX111或miiimiiNiifXXfXXN1211211或miiimiiNiifXXfXXN121212211或P1NNQ,NNP01 PQP1PP PQP1P2P 有最大值有最大

5、值时,时,当当P5.0QP nnxxx,210n1n m1iim1iiin1iiffxxnxx或或 m1ii2im1iin1i2ifxx1f1sxx1n1s或或 m1ii2im1ii2n1i2i2fxx1f1sxx1n1s或或为自由度为自由度为 的无偏估计2为 的无偏估计pnnqnnp1,01pqnnppnnsp111pqnnppnnsp1112为 的无偏估计2P为 的无偏估计P pqp1pnnsp pqp1pnns2p m1ii2im1iiN1i2ifXXf1XXn1s或或 m1ii2im1ii2N1i2i2fXXf1XXn1s或或例例3:某大公司人事部经理整理其某大公司人事部经理整理其25

6、00个中层干部个中层干部的档案。其中一项内容是考察这些中层干部的的档案。其中一项内容是考察这些中层干部的平均年薪平均年薪及及参加过公司培训计划的比例参加过公司培训计划的比例。总体:总体:2500名中层干部名中层干部 如果:如果:上述情况可由每个人的个人档案中得知,上述情况可由每个人的个人档案中得知,可容易地测出这可容易地测出这2500名中层干部的平均年薪及名中层干部的平均年薪及标准差。标准差。假如假如:1:已经得到了如下的结果:总体均值总体均值:=51800 总体标准差总体标准差:=4000 参数参数是总体的是总体的数值特征数值特征 上述上述总体均值总体均值、总体标准差总体标准差、比例比例均称

7、为总均称为总体的体的参数参数 2、同时,有1500人参加了公司培训,则则参加公司培训计划的参加公司培训计划的比例比例为:为:P=1500/2500=0.60如:如:例3中的中层干部平均年薪平均年薪,年薪标准差年薪标准差及受培训受培训人数所占比例人数所占比例均为该公司中层干部这一总体的参数。抽样估计抽样估计就是要通过样本而非总体来估计总体参数就是要通过样本而非总体来估计总体参数。假如随机抽取了一个容量为30的样本:工资工资 是否参加培训是否参加培训 49094.3 Yes 53263.9 Yes 49643.5 Yes 00.5181430/1554420n/xxi72.334729/32500

8、9260)1n/()xx(s2i 63.030/19p 假如假如根据该样本求得的根据该样本求得的年薪样本年薪样本平均数平均数、标标准差准差及及参加过培训计划人数的参加过培训计划人数的比例比例分别为:分别为:继续继续抽取抽取抽出抽出个体个体登记登记特征特征放回放回总体总体抽出抽出个体个体登记登记特征特征继续继续抽取抽取nNnNB=)1()1(nNNNANn!)1()1(!nnNNNnACNnNn !)21(1nNnNnNCDnNnNn )(对样本的对样本的要求不同要求不同考虑顺序的抽样考虑顺序的抽样 ABBA不考虑顺序的抽样不考虑顺序的抽样 AB=BA两种分两种分类交叉类交叉考虑顺序的重复抽样考

9、虑顺序的重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样例:从例:从A、B、C、D四个工人中随机抽取四个工人中随机抽取二人组成一样本,可能的样本是:二人组成一样本,可能的样本是:考虑顺序的重复抽样考虑顺序的重复抽样 考虑顺序的不重复抽样考虑顺序的不重复抽样AA AB AC AD AA AB AC AD BA BB BC BD BA BB BC BD CA CB CC CD CA CB CC CDDA DB DC DD DA DB DC DD 不考虑顺序的重复抽样不考虑顺序的重复抽样 不考虑顺序的不重复抽样不考虑

10、顺序的不重复抽样AA AB AC AD AA AB AC AD BA BB BC BD BA BB BC BD CA CB CC CD CA CB CC CDDA DB DC DD DA DB DC DD Xx1 Xx2 Pp 1Pp 2Xnx根据所有可能样本的样平均数或根据所有可能样本的样平均数或样本成数计算的标准差,即每一样本成数计算的标准差,即每一次抽样的样本指标和总体指标之次抽样的样本指标和总体指标之间的平均差异程度。间的平均差异程度。MiixXxM121xiXixM1)(2nxxS注意:不要混淆抽样注意:不要混淆抽样平均误差与样本标准差!平均误差与样本标准差!例:有例:有4个工人,月

11、产量分别为个工人,月产量分别为40,50,70,80,这一总体平均数和标准差为:,这一总体平均数和标准差为:81.15410004)6080()6070()6050()6040(N)XX(22222 60480705040NXX 总体平均数总体平均数标标准准差差现用重复抽样的方法从现用重复抽样的方法从4 4人中抽取人中抽取2 2人构成样本,求样本的平均数,用以代表人构成样本,求样本的平均数,用以代表4 4人总体的平均水平,所有可能的样本及样本的平均工资列表如下:人总体的平均水平,所有可能的样本及样本的平均工资列表如下:序号序号样本变量样本变量样本平均数样本平均数平均数离差平均数离差离差平方离差

12、平方(1)(2)1404040-204002405045-152253407055-5254408060005504045-152256505050-1010075070600085080655259704055-52510705060001170707010100127080751522513804060001480506552515807075152251680808020400合计合计-960-2000 E 2E 样本平均数的平均数:样本平均数的平均数:抽样平均误差抽样平均误差6016960可能的样)E(本数目本数目18.11162000K)(Eu2x 18.11281.15nux nn

13、x2NnnNnNnx1122当N500时,有NnNnNNnN11nPPp1NnnPPNnNnPPp1111当N500时,有NnNnNNnN11spsP1122ffxxnxx或ppnn11n练习练习 1、对某乡进行简单重复抽样调查,抽出、对某乡进行简单重复抽样调查,抽出100个农户,个农户,户均年收入户均年收入2000元,年收入标准差元,年收入标准差100元,求抽样平元,求抽样平均误差。若抽取的是均误差。若抽取的是200户,则抽样平均误差以是多户,则抽样平均误差以是多少。若要使抽样平均误差降低为原来的一半,则应少。若要使抽样平均误差降低为原来的一半,则应抽多少户。抽多少户。2、对某县人口用不重复

14、抽样方法按、对某县人口用不重复抽样方法按1/10比例抽出比例抽出1万人进行调查,得知样本平均年龄万人进行调查,得知样本平均年龄40岁,年龄标准岁,年龄标准差差20岁,求抽样平均误差。岁,求抽样平均误差。3、某县人口、某县人口10万人,用简单随机不重复抽样方法抽万人,用简单随机不重复抽样方法抽取取1/10的人口进行调查,得知男性人口比重为的人口进行调查,得知男性人口比重为51%,求男性人口比重的抽样平均误差。求男性人口比重的抽样平均误差。4、对某乡进行简单随机重复抽样调查,抽出、对某乡进行简单随机重复抽样调查,抽出100个个农户进行调查,得知年收入在农户进行调查,得知年收入在1800元以上的占元

15、以上的占95%,求农户年收入在求农户年收入在1800元以上比重的抽样平均误差。元以上比重的抽样平均误差。注意:注意:1、统计学上往往用、统计学上往往用抽样极限误差抽样极限误差来测度抽样误差来测度抽样误差的大小或者说测度点估计的精度。的大小或者说测度点估计的精度。原因:原因:总体参数值往往并不知道,因此,总体参数值往往并不知道,因此,实际抽实际抽样误差样误差与与抽样平均误差抽样平均误差也往往无法求出,但在抽样分也往往无法求出,但在抽样分布大体知道的情况下,布大体知道的情况下,抽样极限误差抽样极限误差是可以估计出来是可以估计出来的。的。2、抽样极限误差的估计总是要和一定的概率保、抽样极限误差的估计

16、总是要和一定的概率保证程度联系在一起的。证程度联系在一起的。原因:原因:样本统计量往往是一随机变量,它与总体样本统计量往往是一随机变量,它与总体参数真值之差也是一个随机变量,因此就不能期望参数真值之差也是一个随机变量,因此就不能期望某次抽样的样本估计值落在一定区间内是一个必然某次抽样的样本估计值落在一定区间内是一个必然事件,而只能给予一定的概率保证。事件,而只能给予一定的概率保证。因此,因此,在进行抽样估计时,既需要考虑抽样误在进行抽样估计时,既需要考虑抽样误差的差的可能范围可能范围,同时还需考虑落到这一范围的,同时还需考虑落到这一范围的概率概率大小大小。前者是前者是估计的准确度估计的准确度问

17、题,后者是问题,后者是估计的可靠估计的可靠性性问题,两者紧密联系不可分开。这也正是区间估问题,两者紧密联系不可分开。这也正是区间估计所关心的主要问题。计所关心的主要问题。平均产量的分布如下:平均产量的分布如下:样本平均数样本平均数404550556065707580频数频数121242121频率频率1/162/161/162/164/162/161/162/161/16k21ppp)x|X(|p 21162164162)6055(P)5|X(|p 1610161162164162161)7050(P)10|X(|p 1614162161162164162161162)7545(P)15|X(|

18、p 11616161162161162164162161162161)8040(P)20|X(|p 实际计算中一般不直接计算概率保证程度,实际计算中一般不直接计算概率保证程度,由于由于 ,xxxXxt )t(F)t|X|P()x|X(|px xxt ppt 所以抽样极限误差是概率度所以抽样极限误差是概率度t的函数的函数 据中心极限定理,当总体为正态或总体非据中心极限定理,当总体为正态或总体非正态但正态但n30时,样本均值的分布趋近于正态分时,样本均值的分布趋近于正态分布;布;当当n足够大时,样本成数的分布近似为正态足够大时,样本成数的分布近似为正态分布。分布。2x2x)uXx21x)xx(21

19、x)x(eu21e21f (xxxXxt 2t21)t(e21f ttt21)t(dte21f2n1)()(XxXxE)n,X(Nx )nP1P,P(Np)()(PpPpEn1X510样本抽样分布样本抽样分布原总体分布原总体分布xX dte21x2ttt2 tt 2211在实际中,一般将这种对应函数关系在实际中,一般将这种对应函数关系编成编成正态概率表正态概率表供直接查用供直接查用68.27%95.45%99.73%),(2nXNxXxx2x3x2xx3x估计的准确度估计的准确度和估计的可靠性估计的可靠性问题 若,则称为的无偏若,则称为的无偏估计量估计量)(E第四节第四节 全及指标的推断全及指

20、标的推断若,则称为比更有效的估计量若,则称为比更有效的估计量2121n 若对于任意若对于任意0,有,有1 limPnq 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量。为的无偏、有效、一致估计量。xX1nSpPpPsxX,0.6827xxXX样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线0.9545xx2XX样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线 0.9973落在落在范围内的概率范围内的概率为为99.73%Xxx3XxxxxxxXxXx,或,其中,其中,为极限

21、误差为极限误差xxt x22snsnx或NnnsNnnx1122或xxt xxxxxxXxXx,或,ppppppPpPp,或,其中,其中,为极限误差为极限误差ppt nnp12p np1pnpp 或或 Nn1np1pNn1n2pp或或ppt ppppppPpPp,或,1、按照质量要求,灯、按照质量要求,灯泡使用寿命在泡使用寿命在1000小时小时以上为合格品试,以以上为合格品试,以95.45%的概率保证度估的概率保证度估计该批灯泡的耐用时数计该批灯泡的耐用时数和合格率;和合格率;2、试以、试以99%的概率保的概率保证程度估计计该批灯泡证程度估计计该批灯泡的而用时数和合格率。的而用时数和合格率。使

22、用时间(小时)使用时间(小时)灯泡数(个)灯泡数(个)900以下以下2900-9504950-1000111000-1050711050-1100841100-1150181150-120071200以上以上3合计合计200例:某灯泡厂对例:某灯泡厂对10000个产品进行使用寿命检验,随个产品进行使用寿命检验,随机不重复抽取机不重复抽取2%的样本进行测试。所得资料如下:的样本进行测试。所得资料如下:使用时间(小使用时间(小时)时)组中值组中值 灯泡数灯泡数(个)(个)900以下以下8758752 2175017506624866248900-9509259254 437003700696966

23、9696950-10009759751111107251072573964739641000-1050102510257171727757277572704727041050-1100107510758484903009030027216272161100-1150112511251818202502025083232832321150-1200117511757 78225822597468974681200以上以上122512253 3367536758467284672合计合计200200211400211400575200575200 xfxf fxx2 7541.3%)21(2006

24、3.53)Nn1(n22x 63.5312005752001ffxxs1057200211400fxfx2 2查表得t%45.95)t(F 51.77541.32txx 51.106451.71057xx上限 因此,该批灯泡的使用寿命在因此,该批灯泡的使用寿命在1049.49-1064.51之间,其概率保证之间,其概率保证度为度为95.45%49.104951.71057xx下限 使用时间(小时)使用时间(小时)灯泡数(个)灯泡数(个)f900以下以下2 2900-9504 4950-100011111000-105071711050-110084841100-115018181150-120

25、07 71200以上以上3 3合计合计200200因此,该批灯泡的合格率在因此,该批灯泡的合格率在87.6%-95.4%之间,其之间,其概率保证度为概率保证度为95.45%5.91200183nnp1 1200%)5.8%5.91(2001n)p1(np%952.1%)21(1200%5.8%5.91)Nn1(1n)P1(Pp%4.95%9.3%5.91pp上限%6.87%9.3%5.91pp下限 2查表得t%45.95)t(F%90.3%952.12tpp 1、若允许的误差范围若允许的误差范围为为10小时小时,试估计该批,试估计该批灯泡的耐用时数;灯泡的耐用时数;2、按照质量要求,灯、按照质

26、量要求,灯泡使用寿命在泡使用寿命在1000小时小时以上为合格品,以上为合格品,要求合要求合格率误差不超过格率误差不超过3%,试估计该批灯泡的合格试估计该批灯泡的合格率。率。使用时间(小使用时间(小时)时)灯泡数(个)灯泡数(个)900以下以下2900-9504950-1000111000-1050711050-1100841100-1150181150-120071200以上以上3合计合计200例:某灯泡厂对例:某灯泡厂对10000个产品进行使用寿命检验,随个产品进行使用寿命检验,随机重复抽取机重复抽取2%的样本进行测试。所得资料如下:的样本进行测试。所得资料如下:使用时间(小使用时间(小时)

27、时)组中值组中值 灯泡数灯泡数 (个)(个)900以下以下8758752 2175017506624866248900-9509259254 4370037006969669696950-10009759751111107251072573964739641000-1050102510257171727757277572704727041050-1100107510758484903009030027216272161100-1150112511251818202502025083232832321150-1200117511757 78225822597468974681200以上以上122

28、512253 3367536758467284672合计合计200200211400211400575200575200 xfxf fxx2 7541.3%)21(20063.53)Nn1(n22x 63.5312005752001ffxxs1057200211400fxfx2 1067101057xx上限 1057101057xx下限 66.27541.310 xxxXxt9917.0)查表得F(t 因此,该批灯泡的使用寿命在因此,该批灯泡的使用寿命在1047-1067之之间,其概率保证度为间,其概率保证度为99.17%使用时间(小时)使用时间(小时)灯泡数(个)灯泡数(个)f900以下以下

29、2 2900-9504 4950-100011111000-105071711050-110084841100-115018181150-12007 71200以上以上3 3合计合计200200因此,该批灯泡的合格率在因此,该批灯泡的合格率在88.5%-94.5%之间,其之间,其概率保证度为概率保证度为87.15%5.91200183nnp1 1200%)5.8%5.91(200)1np1(nps%972.11200%5.8%5.911n)P1(Pup%5.94%3%5.91pp上限%5.88%3%5.91pp下限 52.1%972.1%3Pptppp 8715.0)52.1查表得F(t 按按

30、 日产量分组(件)日产量分组(件)组中值(件)组中值(件)工人数(人)工人数(人)110114114118118122122126126130130134134138138142112116120124128132136140371823211864合计合计100按按 日产量分组日产量分组(件)(件)组中值组中值(件)(件)工人数工人数(人)(人)11011411411811812212212612613013013413413813814211211612012412813213614037182321186433681221602852268823768165605887006489284

31、648600784合计合计100126004144xfxffxx2件件47.69941441126100126002ffxxsfxfx件614.01000100110047.6122Nnnsx 件件203.1614.096.1txx XXN203.11261000203.11261000,203.1126203.1126XNX按按 日产量分组日产量分组(件)(件)组中值(件)组中值(件)工人数(人)工人数(人)110114114118118122122126126130130134134138138142112116120124128132136140371823211864合计合计100 x

32、f 0568.0029.096.1t029.01000100111001.09.0Nn11np1p,9.010090nnp,96.1Z,10n,90n,100n,1000Nppp101 则则己己知知PNP0568.09.010000568.09.01000,0568.09.00568.09.0NPP样本容量样本容量找出在规定误差找出在规定误差范围内的最小样范围内的最小样本容量本容量找出在限定费用找出在限定费用范围内的最大样范围内的最大样本容量本容量,nZZxx22222xxZn通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。或或 S S通常未知。

33、一般通常未知。一般按以下方法确定其估计按以下方法确定其估计值:过去的经验数据;值:过去的经验数据;试验调查样本的试验调查样本的S S。计算结果通常向上进位计算结果通常向上进位,Nn1ntt2xx 22x2222x22NNtNNtn 袋袋袋袋在在不不重重复复抽抽样样条条件件下下:袋袋则则在在重重复复抽抽样样条条件件下下:克克克克己己知知10001.9925251000025210000tNNtn1005252tn,2t,5,25,10000N22222222x222222x22x ,1nPPZZpp22211PPPPPPZn通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极

34、限误差。定抽样极限误差。计算结果通常向上进位计算结果通常向上进位 通常未知。一般按以下通常未知。一般按以下方法确定其估计值:过方法确定其估计值:过去的经验数据;试验调去的经验数据;试验调查样本的查样本的 ;取方差;取方差的最大值的最大值0.250.25。2P2Ps,11NnnPPZZppPPNPNPPPZNPPNZnpp11112222 件件件件在不重复抽样条件下:在不重复抽样条件下:件件则在重复抽样条件下:则在重复抽样条件下:己知己知577004.5760651.0303.050000651.035000P1PtNP1PNtn65103.00651.03P1Ptn,0651.0P1P,3t,

35、3,5000N22222p2222p22pp 2x22x22tn 22x2222x22NNtNNtn 修正系数为 9507.02861.21734.2该企业集团所拥有的固定资产原值应为16.8510.9507=16.020(亿元)(亿元)所拥有固定资产所拥有固定资产原值的普查结果为原值的普查结果为16.851亿元亿元某企业集团某企业集团抽取样本单位时,应确保每个总体单位都抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位集和整理时,不能随意遗漏或更换样本单位在其他条件相同的情况下,选抽样误差

36、在其他条件相同的情况下,选抽样误差最小的方案最小的方案在其他条件相同的情况下,选费用最少在其他条件相同的情况下,选费用最少的方案的方案总体总体N样本样本n等额抽取等额抽取等比例抽取等比例抽取2NkN1N1n2nkn类型抽样的抽样平均误差类型抽样的抽样平均误差 在在重重复复抽抽样样情情况况下下:为为各各组组的的总总体体单单位位数数为为全全及及总总体体单单位位数数,即即为为分分类类数数目目平平均均组组内内方方差差2ix2ii2ikii 1i nN N NNNNk ()2ixn (1)nN 在在不不重重复复抽抽样样情情况况下下:重重 复复 抽抽 样样在在 成成 数数 情情 况况 下下:pp(1p)n

37、 不不重重复复抽抽样样:pp(1p)n(1)nN 某农场种小麦某农场种小麦1200012000公顷,其中平原公顷,其中平原36003600公顷,公顷,丘陵丘陵60006000公顷,山地公顷,山地24002400公顷,现用类型抽样法调公顷,现用类型抽样法调查查12001200公顷,以各种麦田占全农场面积的比重分配公顷,以各种麦田占全农场面积的比重分配抽样面积数量。抽样面积数量。麦田类型抽样的平均误差计算表麦田类型抽样的平均误差计算表类类 型型全场播种全场播种面积面积(公顷公顷)抽样调抽样调查面积查面积(公顷)(公顷)单位面积单位面积产量不均产量不均匀程度指匀程度指标标(千克千克)符符 号号Nin

38、ii丘陵地区丘陵地区 6000600 750337500000平原地区平原地区 3600360 840254016000山山 地地 24002401000240000000合合 计计120001200-831516000iin2例例22222iiiiiiiixn831516000692930()n1200N Nn(1)nN6929301200 (1)519.697522.8()120012000 千克或千克iiiipp(1 p)n186P(1 P)15.5%n1200p(1 p)n0.1551200(1)(1)1.078%nN120012000 高产麦田比重的平均误差计算表高产麦田比重的平均误

39、差计算表类别高产田比重(%)非高产田比重(%)麦田不均匀程度指标(%)抽样调查面积(公顷)pi(1-pi)ni符号pi1-pipi(1-pi)ni丘陵802016 60096.0平原9010 9 36032.4山地604024 24057.6合计-1200 186(总体单位按某一标志排序)(总体单位按某一标志排序)1.1.若若按无关标志排队按无关标志排队公式用以上纯随机抽样的公式,一般采用公式用以上纯随机抽样的公式,一般采用不重复抽样公式:不重复抽样公式:xp2n (1)nNp(1p)n (1)nN 为为简简便便起起见见,也也可可采采用用重重复复抽抽样样公公式式。机械抽样机械抽样(等距抽样等距

40、抽样)的抽样平均误差的抽样平均误差 2.2.若若按有关标志排队按有关标志排队2xp np(1 p)n 公式用类型抽样的公式:公式用类型抽样的公式:hlpdnnnnnABCDEFGHIJKLMNOPLHPD样本容量样本容量整群抽样的抽样平均误差整群抽样的抽样平均误差 整群抽样的抽样平均误差受三个因素影响:整群抽样的抽样平均误差受三个因素影响:(1)(1)抽抽出的群数出的群数(r)(r)多少多少 (反比关系反比关系)(2)(2)群群间方差间方差()()(正比关系正比关系)2 计算方法如下:计算方法如下:为为全全及及总总体体各各群群的的平平均均数数为为全全及及平平均均数数或或:为为抽抽样样各各群群的

41、的平平均均数数为为抽抽样样各各群群的的总总平平均均数数为为全全及及总总体体各各群群的的成成数数为为全全及及总总体体的的成成数数22x22x22p2priii 1riii 1riii 1(xx)x rx (xx)r x r x(pp)p rp 或或:为为抽抽样样各各群群的的成成数数为为抽抽样样各各群群的的总总成成数数2riii 1(pp)rp r p (3)(3)抽抽样方法样方法 2x2pxpR rrR(1)R 1Rr (1)rRr (1)rR 整整群群抽抽样样都都采采用用不不重重复复抽抽样样。所所以以在在计计算算抽抽样样误误差差时时要要使使用用修修正正系系数数,当当 的的数数目目较较大大时时,

42、可可用用来来代代替替。整整群群抽抽样样的的抽抽样样平平均均误误差差计计算算公公式式为为:假如某一机器大量生产某一种零件,现每隔一小时假如某一机器大量生产某一种零件,现每隔一小时抽取抽取5 5分钟产品进行检验,用以检查产品的合格率,分钟产品进行检验,用以检查产品的合格率,检查结果如下:检查结果如下:ipp2i(pp)r合格率合格率群数群数rpipir80%20.80 1.6-0.09960.0198485%40.85 3.4-0.04960.0098490%120.90 10.8 0.0004 (太小不计太小不计)95%30.95 2.85 0.05040.0076298%30.98 2.94

43、0.08040.01939合计合计24-21.59-0.0566922p2prii 1ppr21.590.8996r24(pp)r0.056690.002362r24r0.00236224(1)(1)0.0095(0.95%)rR24288p 样本群平均合格率群间方差或例例以上抽样平均误差的公式归纳如下:以上抽样平均误差的公式归纳如下:2px2222x2p nn p 1-pn(1)1N(2)p 1-pp 1-p(3)p 1-p ,最最基基本本的的是是:若若为为:乘乘以以若若不不重重复复抽抽样样类类型型抽抽样样整整为为:若若为为群群抽抽样样:nNRr 指样本中含有的总体单位的指样本中含有的总体单

44、位的数目,通常用数目,通常用n 来表示。来表示。(一一)简单随机抽样简单随机抽样:重重复复抽抽样样222t n 22t P(1P)n 不不重重复复抽抽样样:22222Nt nNt 必要抽样数目的计算公式必要抽样数目的计算公式222N P(1P)tnNt P(1P)(二二)类型抽样类型抽样22 ;P(1-P)P(1-P)22222t ntP(1P)n :重重 复复 抽抽 样样22222222Nt nNtNt P(1P)nNt P(1P)不不重重样样:复复抽抽(三)整群抽样2222ppxxnr ;NR ;22x222xx22p222ppRt rRtRt rRt 不不:重重复复抽抽样样 等距抽样的抽

45、样数目,等距抽样的抽样数目,在有总体差异程度和比重在有总体差异程度和比重的全面资料时,可采用类的全面资料时,可采用类型抽样的公式;没有总体型抽样的公式;没有总体的全面资料时,可采用简的全面资料时,可采用简单随机抽样的公式。单随机抽样的公式。建筑工地打土方工人建筑工地打土方工人40004000人,需测定平人,需测定平均每人工作量,要求误差范围不超过均每人工作量,要求误差范围不超过0.2M0.2M3 3,并需有,并需有99.73%99.73%保证程度。根据过保证程度。根据过去资料去资料=1.5=1.5,求样本数应是多少?,求样本数应是多少?)(1344)5.1(34000)1.0(4000)5.1

46、(3n )M1.0(21 )(450)5.1(34000)2.0(4000)5.1(3tNNtn 5.13t2.04000N 2222232222222222人人则则,保保证证程程度度不不变变即即若若误误差差范范围围缩缩小小人人,解解:例例1 1)(8267.825)9.01(9.0210000)02.0(10000)9.01(9.02 P)-P(1tP)N-P(1tn )(900)02.0()9.01(9.02P)-P(1tn )2(%45.95)(%2%9010000 22222p2222p2支在不重复抽样条件下:支在重复抽样条件下:,解:NttFPNp 某金笔厂月产某金笔厂月产10000

47、10000支金笔,以前多支金笔,以前多次抽样调查一等品率为次抽样调查一等品率为90%90%,现在要求误,现在要求误差范围在差范围在2%2%之内,可靠程度达之内,可靠程度达95.45%95.45%,问必须抽取多少单位数?问必须抽取多少单位数?例例2 2第六节第六节 假设检验假设检验一、假设检验的意义一、假设检验的意义所谓所谓假设检验假设检验,就是对某一总体,就是对某一总体参数先作出假设的数值;然后搜集样参数先作出假设的数值;然后搜集样本资料,用这些样本资料确定假设数本资料,用这些样本资料确定假设数值与样本数值之间的差异;最后,进值与样本数值之间的差异;最后,进一步判断两者差异是否显著,若两者一步

48、判断两者差异是否显著,若两者差异很小,则假设的参数是可信的,差异很小,则假设的参数是可信的,作出作出“接受接受”的结论,若两者的差异的结论,若两者的差异很大,则假设的参数准确的可能性很很大,则假设的参数准确的可能性很小,作出小,作出“拒绝拒绝”的结论。的结论。某厂生产一批产品,必须检验合某厂生产一批产品,必须检验合格才能出厂,规定合格率为格才能出厂,规定合格率为95%95%,现从,现从中抽取中抽取100100件进行质量检查,发现合格件进行质量检查,发现合格率为率为93%93%,假设检验就是利用样本指标,假设检验就是利用样本指标p=93%p=93%的合格率,来判断原来假设的合格率,来判断原来假设

49、P=95%P=95%合格率是否成立。如假设成立,合格率是否成立。如假设成立,产品就能出厂,如假设不成立,这批产品就能出厂,如假设不成立,这批产品便不能出厂。产品便不能出厂。例例1 1某地区去年职工家庭年收入为某地区去年职工家庭年收入为7200072000元,本年抽样调查结果表明,职元,本年抽样调查结果表明,职工家庭年收入为工家庭年收入为7100071000元,这是否意味元,这是否意味着职工生活水平下降呢?我们还不能着职工生活水平下降呢?我们还不能下这个结论,最好通过假设检验,检下这个结论,最好通过假设检验,检验这两年职工家庭收入是否存在显著验这两年职工家庭收入是否存在显著性统计差异,才能判断该

50、地区今年职性统计差异,才能判断该地区今年职工家庭年收入是否低于去年水平。工家庭年收入是否低于去年水平。例例2 2二、假设检验的程序二、假设检验的程序 (一一)提出原假设和替代假设提出原假设和替代假设原假设原假设(又称虚无假设又称虚无假设)是接受是接受检验的假设,记作检验的假设,记作H H0 0;替代假设替代假设(又称备选假设又称备选假设)是当是当原假设被否定时的另一种可成立的原假设被否定时的另一种可成立的假设,记作假设,记作H H1 1;H H0 0与与H H1 1两者是对立的,如两者是对立的,如H H0 0真实,真实,则则H H1 1不真实;如不真实;如H H0 0不真实,则不真实,则H H

51、1 1为真为真实。实。H H0 0和和H H1 1在统计学中称为统计假在统计学中称为统计假设。设。关于总体平均数的假设有三种情关于总体平均数的假设有三种情况:况:(1)H(1)H0 0:=:=0 0;H H1 1:0 0 (2)H (2)H0 0:0 0;H H1 1:0 0以上三种类型,对第一种类型的检验,以上三种类型,对第一种类型的检验,称双边检验,因为称双边检验,因为0 0,包含,包含0 0和和0 0。而对第二、三种类型的检验,。而对第二、三种类型的检验,称单边检验。称单边检验。例例(二二)选择显著性水平选择显著性水平 当当原假设原假设H H0 0为真时,却因为样为真时,却因为样本指标的

52、差异而被否定,这种否本指标的差异而被否定,这种否定真实的原假设的概率就是显著定真实的原假设的概率就是显著性水平。用性水平。用表示。表示。例例=0.05(=0.05(即即5%)5%)或或=0.01(=0.01(即即1%)1%)在假设检验中,要分析样在假设检验中,要分析样本数值与参数假设值之间的差本数值与参数假设值之间的差异,若两者差异越小,假设值异,若两者差异越小,假设值真实的可能性则越大;反之,真实的可能性则越大;反之,假设值真实的可能性越小。因假设值真实的可能性越小。因此,要分析两者差异是否显著,此,要分析两者差异是否显著,如两者差异是显著的,就要否如两者差异是显著的,就要否定原假设,因此,

53、假设检验又定原假设,因此,假设检验又称显著性检验。称显著性检验。(三三)选定检验统计量及其分布选定检验统计量及其分布 如如下下:样样本本统统计计检检验验统统计计量量的的基基本本量量被被假假设设参参数数检检验验统统计计量量统统形形式式计计量量的的标标准准差差XX Z tSnn 检检验验总总体体平平均均值值的的统统有有计计,量量:例例(四四)计算检验统计量计算检验统计量 在在计算检验统计量时,要注意是计算检验统计量时,要注意是双边检验还是单边检验。要根据显著双边检验还是单边检验。要根据显著性水平性水平的值确定统计量的否定域、的值确定统计量的否定域、接受域及临界值。接受域及临界值。(五五)根据样本指

54、标计算的检验统计量的数根据样本指标计算的检验统计量的数值作出决策值作出决策 如如果检验统计量的数值落在否果检验统计量的数值落在否定域内定域内(包括临界值包括临界值),就说明原,就说明原假设假设H H0 0与样本描述的情况有显著差与样本描述的情况有显著差异,应该否定原假设;如果该数异,应该否定原假设;如果该数值落在接受域内,就说明原假设值落在接受域内,就说明原假设H H0 0与样本描述的情况无显著差异,与样本描述的情况无显著差异,则应接受原假设。则应接受原假设。(一)双边检验H0:=0;H1:022220ZZZZH2ZZ 在在假假设设的的双双边边检检验验中中,如如果果检检验验统统计计量量的的数数

55、值值过过大大或或过过小小,都都将将否否定定原原假假设设。否否定定域域位位于于正正态态分分布布曲曲线线两两边边,在在显显著著性性水水平平 条条件件下下,每每个个尾尾部部的的面面积积分分别别为为,临临界界值值为为和和。当当检检验验统统计计量量的的数数值值时时,就就否否定定原原假假设设;时时,认认为为差差异异不不显显著著,就就接接受受原原假假设设,见见图图:221)(2临界值Z)(2临界值Z否定域否定域接受域三、假设检验的基本方法三、假设检验的基本方法 (介绍方差已知的总体平均数的假设检验介绍方差已知的总体平均数的假设检验)%95(96.105.051002.061.66H6cm 22011的可靠程

56、度否定原假设即有因此这批产品不合格。,体平均数存在显著差异,说明样本平均数和总因为时,对应的临界值:;:解:选择检验统计量方法ZZZnXUcmH 某种产品的直径为某种产品的直径为6cm6cm时,产品为合格,时,产品为合格,现随机抽取现随机抽取100100件作为样本进行检查,得知样件作为样本进行检查,得知样本平均值为本平均值为6.1cm6.1cm,现假设标准差为,现假设标准差为0.2cm0.2cm,令,令=0.05=0.05,检验这批产品是否合格。,检验这批产品是否合格。例例以该批产品不合格。未包含在该区间内,所),即:的区间为:的就不否定原假设如果求出的区间包含:方法,614.6 06.6(1

57、002.096.11.696.195%,2nXHO(二)单边检验图:,则为右边检验,见下如,则为左边检验;在单边检验中,如0101:HH1ZZ否定域接受域否定域接受域1右边检验左边检验645.1 645.1 1.02645.1 645.105.0ZZZZ,再查得临界值,当单边检验时,取因为正态分布是双边的,时,当01 H65H65X6965Z216n640.05Z1.645ZZ6965 解:分;:分时,因为,检验统计量的数值落在否定域内,否定原假设,说明样本平均数分与总体平均数分存在显著差异,即新的教学方法提高了学生的成绩。(右边检验)根据过去学校的记录,学生的统计学根据过去学校的记录,学生的

58、统计学考试的平均分数为考试的平均分数为6565分,标准差为分,标准差为1616分。分。现在学校改革了教学方法,经抽取现在学校改革了教学方法,经抽取6464名名学生作调查,得平均分数为学生作调查,得平均分数为6969分,问平分,问平均分数有无显著提高?均分数有无显著提高?(=0.05)(=0.05)例例1 101 H1H1X0.99621Z1.140.02n360.05Z1.645Z1.645x0.99621 解:千克;:千克时,因为,所以认为抽样平均数千克与总体平均数无显著差异,可以相信该厂生产的某饮料平均重量为 千克。(左边检验)某工厂生产瓶装某工厂生产瓶装1 1千克的某饮料,标准差千克的某

59、饮料,标准差为为0.020.02千克,现随机抽取千克,现随机抽取3636瓶进行检验,得平瓶进行检验,得平均重量为均重量为0.99620.9962千克,问能否相信该厂生产的千克,问能否相信该厂生产的饮料每瓶重量为饮料每瓶重量为1 1千克。千克。(=0.05)(=0.05)例例2 2至于方差未知时总体平均至于方差未知时总体平均数的检验以及总体成数的假设数的检验以及总体成数的假设请参阅教材请参阅教材P P315315P P317317本章小结本章小结 本章主要学习抽样调查与抽样估计的方法、抽样方案设计、假设检验的基本原理。同学们可以根据这些原理和方法去开展抽样调查和对总体指标进行点估计和区间估计。本章练习本章练习本章参考书目本章参考书目 1、黄良文主编.统计学原理.北京:中国统计出版社,2000 2、袁卫主编.统计学.北京:高等教育出版社,2003 3、贾俊平等编者.统计学.北京:中国人民大学出版社,2000 4、马国庆著.管理统计.北京:科学出版社,2002 5、耿修林,谢兆茹编著.应用统计学.北京:科学出版社,2002

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!