推荐统计抽样推断

上传人:仙*** 文档编号:47440153 上传时间:2021-12-20 格式:PPT 页数:54 大小:1.25MB
收藏 版权申诉 举报 下载
推荐统计抽样推断_第1页
第1页 / 共54页
推荐统计抽样推断_第2页
第2页 / 共54页
推荐统计抽样推断_第3页
第3页 / 共54页
资源描述:

《推荐统计抽样推断》由会员分享,可在线阅读,更多相关《推荐统计抽样推断(54页珍藏版)》请在装配图网上搜索。

1、12 人们在认识过程中,往往由于某种原因人们在认识过程中,往往由于某种原因不能直接获得对现象总体的认识,而只不能直接获得对现象总体的认识,而只能通过其它途径获得对总体某些方面的能通过其它途径获得对总体某些方面的间接认识。抽样推断是间接认识总体的间接认识。抽样推断是间接认识总体的方法之一。方法之一。3一、抽样推断的概念一、抽样推断的概念q抽样推断又称为抽样调查抽样推断又称为抽样调查。它是按随机原则从总体中它是按随机原则从总体中抽取一部分单位进行调查,并以一定的把握程度从数抽取一部分单位进行调查,并以一定的把握程度从数量上推断总体指标。量上推断总体指标。二、抽样推断的特点二、抽样推断的特点q按随机

2、原则从总体中抽取一部分单位,保证总体中每按随机原则从总体中抽取一部分单位,保证总体中每一单位都有相同的机会被抽中。可保证被抽中的单位一单位都有相同的机会被抽中。可保证被抽中的单位能很好的代表总体,并且是计算抽样误差的基础。能很好的代表总体,并且是计算抽样误差的基础。q虽然调查的是一部分单位,但可以推断总体。虽然调查的是一部分单位,但可以推断总体。q抽样推断一定存在误差,但误差可以计算并加以控制。抽样推断一定存在误差,但误差可以计算并加以控制。第一节第一节 抽样推断的概念和特点抽样推断的概念和特点 4三、抽样推断的作用三、抽样推断的作用q对于无限总体,对于具有破坏性的试验,对于无限总体,对于具有

3、破坏性的试验, 必须使用抽样推断法。必须使用抽样推断法。q对于有限总体,理论上可以进行全面调查,对于有限总体,理论上可以进行全面调查,但进行抽样调查,可节省人力、物力和财力。但进行抽样调查,可节省人力、物力和财力。q对全面调查结果进行检验。对全面调查结果进行检验。q对产品进行质量控制。对产品进行质量控制。5 第二节第二节 抽样推断的相关概念抽样推断的相关概念 一、总体(又称全及总体)一、总体(又称全及总体)l 即所要调查研究的对象。即所要调查研究的对象。l 总体单位数通常用总体单位数通常用N N表示。表示。 二、样本(又称样本总体)二、样本(又称样本总体)即从总体中抽取的那一部分单位所组成的小

4、总体。即从总体中抽取的那一部分单位所组成的小总体。l组成样本的个体叫样本单位。组成样本的个体叫样本单位。l一个样本中样本单位的个数叫一个样本中样本单位的个数叫样本容量样本容量,用,用n n表示。表示。 n 30 n 30为大样本,为大样本, n n3030为小样本。为小样本。6 总体指标总体指标:反映总体特征的数值,是常数,需估计,又被称为参数。 样本指标样本指标:是反映样本特征值的指标。它随样本的不同而不同,是一个随机变量,是估计总体指标的依据。 三、总体指标与样本指标三、总体指标与样本指标 q 总体平均数:q 总体成数:q 总体方差:NXX NXX 22NNP1 样本平均数 样本方差 样本

5、成数122nxxSnnp1 nxxfxfx122ffxxS7 例:例:假设总体有假设总体有A A、B B、C C、D D、四个单、四个单位,若按随机重复抽取方法,从总体位,若按随机重复抽取方法,从总体中随机抽取两个单位组成样本,则中随机抽取两个单位组成样本,则其其样本容量为,而所有可能的样本个样本容量为,而所有可能的样本个数为数为4 42 2个。个。所有可能的样本数目:所有可能的样本数目:四、重复抽样与不重复抽样四、重复抽样与不重复抽样 从总体中抽取容量为n的样本 n重复抽样重复抽样 也叫做有放回的抽样或重置抽样。 ) 1()2)(1(nNNNNnNn不重复抽样不重复抽样 也叫做无放回抽样或非

6、重置抽样。 所有可能的样本数目:所有可能的样本数目:AA AB AC AD BA BB BC BDCA CB CC CDDA DB DC DD8第三节第三节 抽样平均误差抽样平均误差一、抽样误差的概念一、抽样误差的概念 在统计调查中,调查资料与实际情况的差异称为统计误差。在统计调查中,调查资料与实际情况的差异称为统计误差。 1. 1.登记性误差登记性误差2.2.代表性误差代表性误差 (1)(1)系统性误差:由于破坏随机原则而产生的误差系统性误差:由于破坏随机原则而产生的误差 (2) (2)随机误差随机误差( (即抽样误差即抽样误差) ) Xx (一)统计误差的种类(一)统计误差的种类(二)抽样

7、误差:(二)抽样误差:是指是指不包括登记性误差和系统性误差在内的随机误差,即:Pp 或或9二、抽样平均误差二、抽样平均误差(一)抽样平均误差的定义公式(一)抽样平均误差的定义公式n 平均数的抽样平均误差平均数的抽样平均误差所有可能的样本数2Pppn 成数的抽样平均误差成数的抽样平均误差所有可能的样本数2Xxx10 ( (二二) )、抽样平均误差的等价计算公式、抽样平均误差的等价计算公式 q 重复抽样:n不重复抽样:nx2 1.平均数的抽样平均误差平均数的抽样平均误差 Nnn12 N 很大 12NnNnx 抽样比修正系数q 重复抽样:n不重复抽样:nPPp)1( 2.成数的抽样平均误差成数的抽样

8、平均误差 NnnPP1)1( 1)1(NnNnPPp 11 对上述公式的验证对上述公式的验证 例:有甲乙丙丁四个人,年龄分别为例:有甲乙丙丁四个人,年龄分别为20、21、23、24岁,现随机抽岁,现随机抽2人调查年龄,试计算抽样平均误差。人调查年龄,试计算抽样平均误差。抽样平均误差计算表:抽样平均误差计算表:所有样本所有样本标志值标志值样本平均数样本平均数抽样误差抽样误差 抽样误差平方抽样误差平方甲,甲甲,甲20,20甲,乙甲,乙20,21甲,丙甲,丙20,23甲,丁甲,丁20,24乙,甲乙,甲21,20乙,乙乙,乙21,21乙,丙乙,丙21,23乙,丁乙,丁21,24丙,甲丙,甲23,20丙

9、,乙丙,乙23,21丙,丙丙,丙23,23丙,丁丙,丁23,24丁,甲丁,甲24,20丁,乙丁,乙24,21丁,丙丁,丙24,23丁,丁丁,丁24,24合计合计x22 x2)22( x2020.521.52220.5212222.521.5222323.52222.523.524352-2-1.5-0.50-1.5-100.5-0.5011.500.51.52042.250.2502.25100.250.25012.2500.252.2542012)(12.116202岁所有可能样本数Xxx重复抽样的抽样平均误差:重复抽样的抽样平均误差:按定义公式计算:按定义公式计算:按等价公式计算:按等价公

10、式计算:nx2 5 . 24)2224()2223()2221()2220()(222222 NXX )(12.125 .2岁岁 13 对上述公式的验证对上述公式的验证 例:有甲乙丙丁四个人,年龄分别为例:有甲乙丙丁四个人,年龄分别为20、21、23、24岁,现随机抽岁,现随机抽2人调查年龄,试计算抽样平均误差。人调查年龄,试计算抽样平均误差。抽样平均误差计算表:抽样平均误差计算表:所有样本所有样本标志值标志值样本平均数样本平均数抽样误差抽样误差 抽样误差平方抽样误差平方甲,甲甲,甲20,2020-24甲,乙甲,乙20,2120.5-1.52.25甲,丙甲,丙20,2321.5-0.50.25

11、甲,丁甲,丁20,242200乙,甲乙,甲21,2020.5-1.52.25乙,乙乙,乙21,2121-11乙,丙乙,丙21,232200乙,丁乙,丁21,2422.50.50.25丙,甲丙,甲23,2021.5-0.50.25丙,乙丙,乙23,212200丙,丙丙,丙23,232311丙,丁丙,丁23,2423.51.52.25丁,甲丁,甲24,202200丁,乙丁,乙24,2122.50.50.25丁,丙丁,丙24,2323.51.52.25丁,丁丁,丁24,242424合计合计352020 x22 x2)22( x1026414)(91.012102岁所有可能样本数Xxx不重复抽样的抽样

12、平均误差:不重复抽样的抽样平均误差:按定义公式计算:按定义公式计算:按等价公式计算:按等价公式计算:12NnNnx)(91.0142425 .2岁5 . 24)2224()2223()2221()2220()(222222 NXX 15所有样本所有样本标志值标志值样本平均数样本平均数抽样误差抽样误差 抽样误差平方抽样误差平方甲,甲甲,甲20,2020-24甲,乙甲,乙20,2120.5-1.52.25甲,丙甲,丙20,2321.5-0.50.25甲,丁甲,丁20,242200乙,甲乙,甲21,2020.5-1.52.25乙,乙乙,乙21,2121-11乙,丙乙,丙21,232200乙,丁乙,丁

13、21,2422.50.50.25丙,甲丙,甲23,2021.5-0.50.25丙,乙丙,乙23,212200丙,丙丙,丙23,232311丙,丁丙,丁23,2423.51.52.25丁,甲丁,甲24,202200丁,乙丁,乙24,2122.50.50.25丁,丙丁,丙24,2323.51.52.25丁,丁丁,丁24,242424合计合计352020 x22 x2)22( x10264)(2216352岁所有可能样本数的平均数重复抽样:样本平均数xx)(2212264岁所有可能样本数数的平均数不重复抽样:样本平均xx抽样平均误差计算表:抽样平均误差计算表:16无论是重复抽样还是不重复抽样,所有样

14、本平均数无论是重复抽样还是不重复抽样,所有样本平均数的平均数等于总体平均数,即:的平均数等于总体平均数,即: Xx 所所有有可可能能的的样样本本数数 2Xxx 即:平均数的抽样平均误差是样本平均数的标准差。即:平均数的抽样平均误差是样本平均数的标准差。同理,无论是重复抽样还是不重复抽样,所有样本同理,无论是重复抽样还是不重复抽样,所有样本成数的平均数等于总体成数,即:成数的平均数等于总体成数,即: Pp 即:成数的抽样平均误差是样本成数的标准差。即:成数的抽样平均误差是样本成数的标准差。所有可能的样本数所有可能的样本数22ppPpp简言之,抽样平均误差是样本指标的标准差。简言之,抽样平均误差是

15、样本指标的标准差。 所所有有可可能能的的样样本本数数 2xx17(三)、计算抽样平均误差时,总体方差 、或 未知时的处理方法: 用过去调查所得到的资料代替组织试验抽样,用样本资料代替用样本的资料代替2 )(PP 118(四)、影响抽样平均误差的因素(四)、影响抽样平均误差的因素 l 第一,样本单位数的多少l 第二,总体被研究标志的变异程度l 第三,抽样方法l 第四,抽样的组织形式(第六节)(第六节) 19第四节、抽样估计方法 抽样估计方法可以分为两大类:q点估计:以样本指标直接作为总体指标 的估计值。q区间估计:区间估计:以一定的把握程度估计总体指标的区间范围。20对总体指标的区间估计对总体指

16、标的区间估计 (一)对总体平均数的区间估计公式:(一)对总体平均数的区间估计公式:xxtxXtx 的概率为的概率为F(t)F(t)。xxxXx 的概率为的概率为68.27%68.27%。xxxXx 2 2 的概率为的概率为95.45%95.45%。xxxXx 3 3 的概率为的概率为99.73%99.73%。xxxXx 96. 1 96. 1 的概率为的概率为95%95%。 (二)对总体成数的区间估计公式:(二)对总体成数的区间估计公式:ppttpp 的概率为的概率为F(t)F(t)。21小小 结:结:抽样调查目的:用样本指标估计总体指标。抽样调查目的:用样本指标估计总体指标。方法:方法:点估

17、计:点估计:P pXx区间区间估计:估计:估计总体成数:估计总体成数:ppttpp 估计总体平均数:估计总体平均数:xxtxXtx nnp1 nxx fxfx或 F(t)t0.682710.951.960.954520.99733 Nn1P)-P(1 P)-P(1 Nn1 22nnnnnPPPxxx 不重复抽样重复抽样不重复抽样重复抽样22 例例1 1:对一批零件随机抽取对一批零件随机抽取100100件,测量其长度件,测量其长度, ,得样本平得样本平均长度为均长度为1010厘米,长度的标准差为厘米,长度的标准差为0.50.5厘米。试以厘米。试以95.45%95.45%的概率估计该批产品平均长度

18、的区间范围。的概率估计该批产品平均长度的区间范围。答:有答:有95.45%95.45%的概率认为该批零件的平均长度在的概率认为该批零件的平均长度在9.99.9厘米厘米至至10.110.1厘米之间。厘米之间。 2%,45.95)(,5 .0,10100,n ttFSx则解:已知 )(05.01005 .0 厘米 nx 把有关数据代入:,由 xxtxXtx 05. 02 01 05. 0210 X(厘米)即:1.10 .99 X23 对某地农户随机抽取对某地农户随机抽取200200户,调查其收入情况。得平户,调查其收入情况。得平均每户年收入为均每户年收入为1800018000元,年收入的标准差为元

19、,年收入的标准差为500500元。试以元。试以95%95%的概率估计该地农户平均年收入的区间范围。的概率估计该地农户平均年收入的区间范围。答:该地农户年平均收入在答:该地农户年平均收入在17930.6917930.69元至元至18069.3118069.31元之间,元之间,概率是概率是95%95%。 96.1%,95)(,500,18000200,n ttFSx则解:已知 )(36.35200500 元 nx 把有关数据代入:,由 xxtxXtx 36.3596. 1 01800 36.3596. 118000X(元)即:8069.311 7930.691 X练习练习24例例2 2:某进出口公

20、司出口一批茶叶,规定每包重量不低于某进出口公司出口一批茶叶,规定每包重量不低于150150克。克。现用不重复抽样方法随机抽取其中现用不重复抽样方法随机抽取其中1%1%进行检验,结果如下表:进行检验,结果如下表:试以试以99.73%99.73%的概率估计这批茶叶平均每包的重量范围,以确定是否达到重的概率估计这批茶叶平均每包的重量范围,以确定是否达到重量规格要求。量规格要求。每包重量每包重量( (克克) )包数(包)包数(包)149149以下以下149150149150150151150151151151以上以上10205020合合 计计100 xf 14852990752530301503032

21、.412.8228.876组中值组中值 x x148.5148.5149.5149.5150.5150.5151.5151.5ffxx2)( 解:解:)(3 .15010015030克fxfx77.01100761)(22ffxxS)(0876.010077.02克nx结论:结论: 以以99.73%99.73%的概率认为的概率认为该批茶叶达到了重量规格。该批茶叶达到了重量规格。把有关数据代入:,由 xxtxXtx 0876.03 50.31 0876.033 .150X(克)即:56. 051 04. 051 X25 某灯泡厂某月生产灯泡某灯泡厂某月生产灯泡400400万个,随机抽取万个,随机

22、抽取400400个进行检验,个进行检验, 得资料如下表:得资料如下表:试估计该厂全部灯泡的平均耐用时间的置信区间(以概率为试估计该厂全部灯泡的平均耐用时间的置信区间(以概率为99.73%99.73%来保证)。来保证)。耐用时间耐用时间( (小时小时) )灯泡数(个)灯泡数(个)700-800800-900900-10001000-11001100以上以上26120164846合合 计计400 xf 195001020001558008820069003724008517867873205920411895242877663175600组中值组中值 x x75085095010501150ffx

23、x2)( 解:解:)(931400372400小时fxfx7959140031756001)(22ffxxS)(461.440079592小时nx结论:结论: 以以99.73%99.73%的概率认为该的概率认为该批灯泡耐用时间在批灯泡耐用时间在917.62917.62小时至小时至944.38944.38小时之间。小时之间。把有关数据代入:,由 xxtxXtx 461.43 319 461.43931X(小时)即:38.944217.69 X练习练习26 某灯泡厂某月生产灯泡某灯泡厂某月生产灯泡400400万个,对其随机抽取万个,对其随机抽取400400个进行检验,个进行检验, 得到如下资料:得

24、到如下资料:若耐用时间在若耐用时间在800800小时以下为不合格品,试计算概率为小时以下为不合格品,试计算概率为95.45%95.45%时,时,这些产品中不合格率的可能范围。这些产品中不合格率的可能范围。耐用时间耐用时间( (小时小时) )灯泡数(个)灯泡数(个)700-800700-800800-900800-900900-1000900-10001000-11001000-110011001100以上以上262612012016416484846 6合合 计计400400解:解:例例答:答:2%,45.95)(%,5 .6 ttFp则则%46.2t%23.1400%5 .93%5 .6)1

25、( pppnPP ,即即得得到到:代代入入有有关关数数据据,由由, pppPp %96. 8.04%4 P 27 例例3 3:对一批粮食作物的种子随机抽取对一批粮食作物的种子随机抽取200200粒进行发芽粒进行发芽实验,结果有实验,结果有180180粒发芽。试以粒发芽。试以95%95%的概率估计该批种的概率估计该批种子发芽率的置信区间。子发芽率的置信区间。答:该批种子的发芽率在答:该批种子的发芽率在85.84%85.84%至至94.16%94.16%之间,之间,概率是概率是95%95%。 96.1%,95)(%,90200,nttFp则解:已知%12.2200%10%90)1 ( nPPp把有

26、关数据代入:,由 pptPtpp%12. 296. 1 %09 %12. 296. 1%90P%16.945.84%8 P 即:28 某灯泡厂为了使生产的螺丝口与卡口灯泡的比例很好地适某灯泡厂为了使生产的螺丝口与卡口灯泡的比例很好地适应用户需要,从全市所有用户中随机抽取应用户需要,从全市所有用户中随机抽取15001500盏,查得其中卡口盏,查得其中卡口灯泡占灯泡占15%15%。试以。试以95%95%的把握程度估计螺丝口灯泡的百分比区间。的把握程度估计螺丝口灯泡的百分比区间。答:答:螺丝口灯泡螺丝口灯泡的比例在的比例在83.2%83.2%至至86.8%86.8%之间,之间,概率是概率是95%95

27、%。 96.1%,95)(%,8500,51nttFp则解:已知%92.01500%15%85)1 (nPPp把有关数据代入:,由 pptPtpp%92. 096. 1 %58 %92. 096. 1%85P%8 .86%2 . 38 P 即:练习练习29例:例:某农场今年共播种小麦2000亩,随机抽取100亩,实割实测,得平均亩产量为450公斤,亩产量的标准差为50公斤。试计算:1)平均亩产量的抽样平均误差。2)概率为95%时,平均亩产量的可能范围。3)概率为95%时,2000亩小麦总产量的可能范围。50,450100,n,2000 SxN解解:已已知知 )(510050 )1公公斤斤 nx

28、 把把有有关关数数据据代代入入:,由由 xxxXx 59.84 40.24 X即即:)(8 .9,96.1%,95)()2公公斤斤则则 xxtttF 3 3)概率为)概率为95%95%时,时,20002000亩小麦总产量的可能范围是亩小麦总产量的可能范围是2000440.2,2000459.8公斤,即880400,919600公斤。即概率为95%时,小麦平均亩产量的可能范围是440.2,459.8公斤。30练习练习 对我国某城市进行居民家庭人均旅游消费支出调查,随对我国某城市进行居民家庭人均旅游消费支出调查,随机抽取机抽取400400户居民家庭,调查得知居民家庭人均年旅游消费户居民家庭,调查得

29、知居民家庭人均年旅游消费支出为支出为350350元,标准差为元,标准差为100100元,要求以元,要求以95%95%的概率保证程度,的概率保证程度,估计该市人均年旅游消费支出额。估计该市人均年旅游消费支出额。答:该市人均年旅游消费支出在答:该市人均年旅游消费支出在340.2340.2元至元至359.8359.8元之间,元之间,概率是概率是95%95%。 96. 1%,95)(,100,350400,nttFSx则解:已知 )(5400100 元nx把有关数据代入:,由 xxtxXtx 596. 1 350 596. 1350X(元)即:59.83 40.23 X31练习练习 某市电视台为了解观

30、众对某电视栏目的喜爱程度,在该某市电视台为了解观众对某电视栏目的喜爱程度,在该市随机对市随机对900900名居民进行调查,结果有名居民进行调查,结果有540540名喜欢该电视栏目,名喜欢该电视栏目,要求以要求以90%90%的概率保证程度,估计该市居民喜欢该电视栏目的概率保证程度,估计该市居民喜欢该电视栏目的比率。的比率。答:该市居民喜欢该电视栏目的比例在答:该市居民喜欢该电视栏目的比例在57.33%57.33%至至62.67%62.67%之间,之间,概率是概率是90%90%。 64.1%,90)(%,6000,9nttFp则解:已知%63.1900%40%60)1( nPPp 把有关数据代入:

31、,由 pptPtpp%63. 164. 1 %06 %63. 164. 1%60P%67.6257.33% P 即:第五节第五节 必要样本容量的确定必要样本容量的确定:表示,即),用极限误差(或允许误差为抽样为概率度,称中,称和在 tttpPtptxXtxppxxppxxtt成数的抽样极限误差平均数的抽样极限误差一、推断总体平均数时的必要样本容量一、推断总体平均数时的必要样本容量1.重复抽样时:重复抽样时:xxt由nt2222xtn 2.不重复抽样时:不重复抽样时:xxt由Nnnt12Nntx2222Ntntx2222222222 tNNtnx 二、推断总体成数时的必要样本容量二、推断总体成数

32、时的必要样本容量1.重复抽样时:重复抽样时:ppt由nPPt)1( 22)1(pPPtn 2.不重复抽样时:不重复抽样时:ppt由NnnPPt1)1(22222tNNtnx请对比)1()1(222PPtNPPNtnp 33例:例:对一批产品随机抽取对一批产品随机抽取100100件,检查发现件,检查发现9090件合格。件合格。要求:要求:1 1)试以)试以95.45%95.45%的概率估计该批产品合格率的区间范围。的概率估计该批产品合格率的区间范围。 2 2)若抽样极限误差缩小二分之一,其他条件不变,应)若抽样极限误差缩小二分之一,其他条件不变,应 至少抽取多少件产品?至少抽取多少件产品? 3

33、3)若抽样极限误差缩小三分之一呢?)若抽样极限误差缩小三分之一呢?2%,45.95)(%,90100,n )1ttFp则已知解:%6%32t%,3100%10%90)1( pppnPP 则把有关数据代入:,由 pppPp %6 %09 %6%90 P%964%8 P 即:%3%621 )2p)(400%3%10%902)1 (,2222件pPPtn%4%632 )3p)(225%4%10%902)1 (,2222件pPPtn答:有答:有95.45%95.45%的概率估计该批产品合格率在的概率估计该批产品合格率在84%84%至至96%96%之间。之间。34 某批产品的合格率估计为某批产品的合格率

34、估计为30%30%,若要求抽样极限误差不超,若要求抽样极限误差不超 过过5%5%,在,在99.73%99.73%的概率保证下,试确定重复抽样时的必要样本容量。的概率保证下,试确定重复抽样时的必要样本容量。3%,73.99)(%,5%,30 ttFpp则则由由已已知知756%5%70%303)1(2222 pPPtn%3%5%401 )(由由题题意意:p2100%3%70%303)1(2222 pPPtn练习练习若抽样误差减少若抽样误差减少40%40%,其他条件不变,抽样单位数应是多少?,其他条件不变,抽样单位数应是多少? 注意:注意:小数只入不舍。小数只入不舍。解解:1)2)35练习:练习:某

35、国营农场共饲养某国营农场共饲养20002000头牛,现准备用抽样方法研究其平头牛,现准备用抽样方法研究其平均体重。先抽取均体重。先抽取3535头牛调查,得到牛的体重标准差为头牛调查,得到牛的体重标准差为6060公斤,按公斤,按规定牛平均体重的误差不得超过规定牛平均体重的误差不得超过1212公斤,推断的概率保证程度为公斤,推断的概率保证程度为95.45%95.45%。问:采用重复抽样和不重复抽样各应抽多少头牛?。问:采用重复抽样和不重复抽样各应抽多少头牛? 2%,45.95)(,12,2000 x ttFN则则已已知知解解:重复抽样时:)(10012602222222头头 xtn 不重复抽样时:

36、)(9660212200060220002222222222头头 tNNtnx36某冷库对贮藏的一批禽蛋的变质情况进行抽样调查。根据以往的数某冷库对贮藏的一批禽蛋的变质情况进行抽样调查。根据以往的数据资料,禽蛋贮藏期变质率分别为据资料,禽蛋贮藏期变质率分别为53%53%,49%49%、48%48%。规定允许误差。规定允许误差不超过不超过5%5%,推断的概率保证程度为,推断的概率保证程度为95.45%95.45%,问至少要抽取多少只蛋,问至少要抽取多少只蛋进行检查?进行检查?练习练习即应抽取即应抽取400400只禽蛋进行调查。只禽蛋进行调查。%49, 2%,45.95)(%,5 pttFp选选则

37、则由由已已知知解解:84.399%5%51%492)1(2222 pPPtn37某工厂拟以某工厂拟以95%95%的可靠程度对生产产品的合格率进行抽样调查,希望的可靠程度对生产产品的合格率进行抽样调查,希望对合格率估计的误差不超过对合格率估计的误差不超过3%3%,最少应抽取多少件产品?,最少应抽取多少件产品?练习练习即:为以即:为以95%95%的概率保证抽样误差不超过的概率保证抽样误差不超过3%3%,应最少抽取,应最少抽取10681068件产品进行调查。件产品进行调查。%50,96.1%,95)(%,3 pttFp令令则则由由已已知知解解:11.1067%3%5096. 1)1(22222 pP

38、Ptn38 例:某灯泡厂对一批灯泡的平均使用寿命和合格品率进行检验,要求置信度为95%。且根据前几批灯泡的经验资料有:平均使用寿命的标准差为200、250、300小时,合格品率为92%、93%、95%。 要求: 推断平均寿命的抽样误差不超过50小时,推断合格率的误差不超过5%,试问应至少抽多少只灯泡。 有多个总体指标进行估计时,为了满足共同的需要,应选取最大的n值。)(1390530096.11222222只)解:xtn)(114%5%8%9296. 1)1 (22222只)pPPtn作业:作业:1、为检查某批电子元件的质量,随机抽取1%的产品,将测得结果整理成如下表:耐用时间(小时)元件数(

39、只)1200以下1200140014001600160018001800以上101255185合计100质量标准规定:元件的耐用时间在1200小时以下为不合格品。若给定可靠度为95%,试确定:该批电子元件的平均耐用时间。该批元件的合格品率。该批元件的合格品数量。2、为研究某市居民家庭收入状况,以1%比例从该市的所有住户中按照简单随机重复抽样的方法抽取515户进行调查,结果为:户均收入为8235元,每户收入的标准差为935元。要求:以99.73%的置信度估计该市的户均收入;如果允许误差减少三分之一,其它条件不变,则需要抽取多少户?40三、影响样本容量三、影响样本容量n n的因素:的因素:q(1)

40、总体各单位的变异程度q(2)允许误差的大小q(3)概率保证程度q(4)抽样方法q(5)抽样的组织形式 41第六节第六节 抽样的组织方式抽样的组织方式 抽样调查有以下几种基本的组织方式,即简单随机抽样、等距抽样、分层抽样、整群抽样。在具体的抽样调查中,可根据调查对象的特点,单独使用其中一种方式,也可以多种方式结合使用。 一、简单随机抽样一、简单随机抽样 q简单随机抽样也叫纯随机抽样。它对总体中的所有单位不进行任何分组、排队,而是直接从总体中完全随机地抽取样本单位。42二、分层抽样二、分层抽样q分层抽样也叫类型抽样。它是先将总体各单位按某一标志划分为几个组,然后在各组中按随机原则或其他方式抽取样本

41、单位。q适用于总体单位在被研究标志上有明显差异的情况。q分层抽样的方法又分两种:等比例抽样和不等比例抽样。43(一)等比例抽样q推断总体平均数时:样本平均数nnxxkiii 1平均组内方差nnkiii 122 重复抽样的抽样平均误差:不重复抽样的抽样平均误差:nx2 12NnNnx (二)不等比例抽样(略)q推断总体成数时:44例:某地区对居民在一年内用于某类消费的支出进行例:某地区对居民在一年内用于某类消费的支出进行了等比例分层抽样,调查结果如下表了等比例分层抽样,调查结果如下表调查户数调查户数平均支出(元)平均支出(元)方差方差城镇城镇403502209农村农村802602916要求以要求

42、以95.45%的概率估计该地区平均每户支出的区间。的概率估计该地区平均每户支出的区间。解:样本平均数)(290804080260403501元元 nnxxkiiiinix2i 平均组内方差33.26808040802916402209122 nnkiii 抽样平均误差:(元元)726.412033.26802 nx (元元)452.9726.42 xxt 平均每户支出额的区间为290-9.45, 290+9.45,即概率为95.45%时,该地区平均每户支出额在280.55至299.45元之间。练习:某企业对职工用于某类消费的支出进行了等比例分层抽练习:某企业对职工用于某类消费的支出进行了等比例

43、分层抽样,调查结果如下表样,调查结果如下表职工人数(人)职工人数(人)调查人数(人)调查人数(人)平均支出(元)平均支出(元)标准差(元)标准差(元)青年职工青年职工240012023060中老年职工中老年职工16008014047要求以要求以95.45%的概率估计该企业职工平均支出和总支出的区间。的概率估计该企业职工平均支出和总支出的区间。inixi 解:样本平均数)(19480120801401202301元元 nnxxkiii平均组内方差6 .30438012080471206022122 nnkiii 重复抽样时:(元元)9.32006.30432 nx (元元)8.79.32 xxt

44、 把把有有关关数数据据代代入入:,由由 xxxXx 01.82 86.21 X即:即该企业职工用于此类消费的平均支出区间为即该企业职工用于此类消费的平均支出区间为 186.2, 201.8 元,概率为元,概率为95.45%95.45%。当概率为当概率为95.45%95.45%时,该企业职工在此类消费上的总支出区间为时,该企业职工在此类消费上的总支出区间为4000186.2,4000201.8元,即元,即744800,807200元。元。47三、等距抽样三、等距抽样(机械抽样或系统抽样)q等距抽样是先将总体单位按某一标志排列,然后按相等的距离来抽取样本单位的组织形式。q排列的标志可以与调查标志无

45、关,也可以与调查标志有关。q在抽取样本单位时,要避免抽样间隔和现象本身的周期性节奏相重合引起的系统性影响。48四、整群抽样四、整群抽样q是将总体划分为若干群,然后以群为单位按简单随机抽样或等距抽样方式抽取部分群,对抽中群中的所有单位一一调查的组织方式。q整群抽样抽取的是群,简化了抽样工作程序。对于大规模的调查,若总体单位多且分布区域广,难以或不宜编制抽样框,可采用整群抽样。q其缺点是样本在总体中太集中,分布不均匀,与其他几种抽样方式比较,误差较大,代表性较差。49q推断总体平均数时:样本平均数rxxrii 1总体群间方差 RXXiB 22 抽样平均误差: RrrBx12 q推断总体成数时:样本

46、群间方差 122 rxxSiB若r比较小,用trttSBB代替分布表用时应查代替)1(2250例:某商场有某种饮料例:某商场有某种饮料500箱、每箱箱、每箱6瓶,现随机抽取瓶,现随机抽取10箱检查每瓶的含菌量,测得这箱检查每瓶的含菌量,测得这10箱的平均每瓶含菌箱的平均每瓶含菌量分别为:量分别为:90、80、65、85、75、70、50、70、60、65个。要求推断这批饮料的平均含菌数的区间(概率个。要求推断这批饮料的平均含菌数的区间(概率为为95%)解:样本平均数)(711065608090个个 rxxi样本群间方差 33.143110716571807190122222 rxxSiB抽样平

47、均误差(个个)75.35001011033.14312 RrrBx ,262. 2t9%95 t分分布布表表,得得的的,查查自自由由度度为为由由概概率率把把有有关关数数据据代代入入:,由由 xxtxXtx 9.497 2.516 X即即:即概率为95%时,这批饮料平均含菌量的区间为62.51,79.49个。51五、多阶段抽样五、多阶段抽样 又称为多级抽样,它是将抽取样本单位的过程划分又称为多级抽样,它是将抽取样本单位的过程划分为几个阶段,然后逐阶段抽取样本单位的抽样组织方式。为几个阶段,然后逐阶段抽取样本单位的抽样组织方式。 当总体单位很多且分布广泛,几乎不可能从总体当总体单位很多且分布广泛,

48、几乎不可能从总体中直接抽取总体单位时,常采用多阶段抽样。中直接抽取总体单位时,常采用多阶段抽样。 如:我国农产量调查就是采用多阶段抽样调查,即如:我国农产量调查就是采用多阶段抽样调查,即先从省中抽县,然后从中选的县抽乡,乡中抽村,再由先从省中抽县,然后从中选的县抽乡,乡中抽村,再由中选的村中抽地块,最后从中选的地块中抽取小面积的中选的村中抽地块,最后从中选的地块中抽取小面积的样本单位。样本单位。52 例,要进行全国城市居民家庭平均收入的例,要进行全国城市居民家庭平均收入的调查:调查:u先将城市作为抽样单位进行第一阶段抽样。先将城市作为抽样单位进行第一阶段抽样。u以街道为抽样单位,在抽出的城市中

49、作第二阶段以街道为抽样单位,在抽出的城市中作第二阶段抽样。抽样。u在抽出的街道里,以家庭为抽样单位作第三阶段在抽出的街道里,以家庭为抽样单位作第三阶段抽样,即以家庭为抽样单位,从已选出的街道中抽样,即以家庭为抽样单位,从已选出的街道中抽取家庭样本。抽取家庭样本。 城市城市街道街道家庭家庭53. . 一般在初级阶段抽样时多用分层抽样和等距抽样,一般在初级阶段抽样时多用分层抽样和等距抽样,在次级阶段抽样时多用等距抽样和简单随机抽样。同时,在次级阶段抽样时多用等距抽样和简单随机抽样。同时,还可根据各阶段不同特点,采用不同的抽样比。如方差还可根据各阶段不同特点,采用不同的抽样比。如方差大的阶段,抽样比

50、大一些,方差小的阶段,抽样比小一大的阶段,抽样比大一些,方差小的阶段,抽样比小一些。而且多阶抽样在简化抽样工作同时,抽样单位的分些。而且多阶抽样在简化抽样工作同时,抽样单位的分布较广,具有较强的代表性。布较广,具有较强的代表性。54思考:q先将总体各单位按某一标志排列,再依固定顺序和间隔来抽取样本单位数的抽样组织形式,被称为( )。q先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样组织形式,被称为( )。q先将总体各单位划分为若干群,再以群为单位从中按随机原则抽取一些群,对抽中群的所有单位进行全面调查,这种抽样组织形式,被称为( )。q某工厂产品是连续性生产,为检查产品质量,在24小时中每隔30分钟,取下一分钟的产品进行全部检查,这是( )。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!