用样本的频率分布估计总体的分布1

上传人:沈*** 文档编号:172119889 上传时间:2022-12-01 格式:PPT 页数:37 大小:732.03KB
收藏 版权申诉 举报 下载
用样本的频率分布估计总体的分布1_第1页
第1页 / 共37页
用样本的频率分布估计总体的分布1_第2页
第2页 / 共37页
用样本的频率分布估计总体的分布1_第3页
第3页 / 共37页
资源描述:

《用样本的频率分布估计总体的分布1》由会员分享,可在线阅读,更多相关《用样本的频率分布估计总体的分布1(37页珍藏版)》请在装配图网上搜索。

1、2.2 2.2 用样本估计总体用样本估计总体.2.1.2.1用样本的频率分布估计总体分布用样本的频率分布估计总体分布一、复习一、复习1.1.随机抽样有哪几种基本的抽样方法随机抽样有哪几种基本的抽样方法?2.2.统计的基本思想。统计的基本思想。简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样.通过从总体中抽取一个通过从总体中抽取一个样本样本,根据样根据样本的情况去估计总体的相应情况本的情况去估计总体的相应情况.1.1.频数:频数:在总体在总体(或样本)中,某个个体或样本)中,某个个体出现的次数叫做这个个体的频数。出现的次数叫做这个个体的频数。2.2.频率:频率:某个个体的频数与总

2、体某个个体的频数与总体(或样本或样本)中所含个体的数量的比叫做这个个)中所含个体的数量的比叫做这个个体的频率。体的频率。3.3.性质:性质:在总体在总体(或样本)中,各个个体或样本)中,各个个体的频率之和等于的频率之和等于1 1。二、基本概念及其性质(频数和频率)二、基本概念及其性质(频数和频率)4.4.所有数据(或数据组)的频数的所有数据(或数据组)的频数的分布变化规律叫做分布变化规律叫做样本的频率分布样本的频率分布。5.5.频率分布的表示形式有:频率分布的表示形式有:样本频率分布表样本频率分布表样本频率分布图样本频率分布图 样本频率分布样本频率分布条形图条形图 样本频率分布样本频率分布直方

3、图直方图样本频率分布折线图样本频率分布折线图知识探究(一):频率分布表知识探究(一):频率分布表【问题问题】某市政府为了节约生活用水,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准即确定一个居民月用水量标准a a,用水量,用水量不超过不超过a a的部分按平价收费,超出的部分按平价收费,超出a a的部的部分按议价收费分按议价收费.通过抽样调查,获得通过抽样调查,获得100100位居民位居民20072007年的年的月均用水量如下表(单位:月均用水量如下表(单位:t t):):3.1 2.5 2.0 2.0 1.5 1.0

4、 1.6 1.8 1.9 1.63.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 3.4 2.6 2.2 2.2 1.5 1.2 0.20.2 0.4 0.3 0.4 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4

5、 2.3 1.8 1.4 3.5 1.9 0.8 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.34.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.03.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.

6、42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2思考思考1 1:上述:上述100100个数据中的最大值和最个数据中的最大值和最小值分别是什么?由此说明样本数据的小值分别是什么?由此说明样本数据的变化范围是什么?变化范围是什么?思考思考2 2:样本数据中的最大值和最小值:样本数据中的最大值和最小值的差称为的差称为极差极差.如果将上述如

7、果将上述100100个数据个数据按组距为按组距为0.50.5进行分组,那么这些数据进行分组,那么这些数据共分为多少组?共分为多少组?0.20.24.34.3(4.3-0.24.3-0.2)0.5=8.20.5=8.2思考思考3 3:以组距为:以组距为0.50.5进行分组,上述进行分组,上述100100个数据共分为个数据共分为9 9组,各组数据的取值范围组,各组数据的取值范围可以如何设定?可以如何设定?思考思考4 4:如何统计上述:如何统计上述100100个数据在各组个数据在各组中的频数?如何计算样本数据在各组中中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出的频率?你能将这

8、些数据用表格反映出来吗?来吗?00,0.50.5),),0.50.5,1 1),),11,1.51.5),),44,4.5.4.5.分分 组组 频数累计频数累计 频数频数 频率频率 00,0.50.5)4 0.044 0.04 0.5 0.5,1 1)正正 8 0.088 0.08 1 1,1.51.5)正正 正正 正正 15 0.1515 0.15 1.5 1.5,2 2)正正 正正 正正 正正 22 0.2222 0.22 2 2,2.5)2.5)正正 正正 正正 正正 正正 25 0.2525 0.25 2.5 2.5,3 3)正正 正正 14 0.1414 0.14 3 3,3.53.

9、5)正正 一一 6 0.066 0.06 3.5 3.5,4 4)4 0.044 0.04 4 4,4.5 2 0.024.5 2 0.02 合计合计 100 1.00100 1.00 思考思考5 5:上表称为样本数据的频率分布表,:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了用水量标准提供参考依据,这里体现了一种什么统计思想?一种什么统计思想?用样本的频率分布估计总体分布用样本的频率分布估计总体分布.思考思考6 6:如果市政府希望:如果市

10、政府希望85%85%左右的居民每左右的居民每月的用水量不超过标准,根据上述频率分月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即布表,你对制定居民月用水量标准(即a a的的取值)有何建议?取值)有何建议?88%88%的居民月用水量在的居民月用水量在3t 3t以下,可建议以下,可建议取取a=3.a=3.思考思考7 7:对样本数据进行分组,组距的确定没:对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况我们了解数据的分布情况.数据分组的组数与数据分组的组数与样本容量有关,一般样本容量越大,所分组样

11、本容量有关,一般样本容量越大,所分组数越多数越多.按统计原理,若样本的容量为按统计原理,若样本的容量为n n,分,分组数一般在(组数一般在(1+3.3lg1+3.3lgn n)附近选取)附近选取.当样本容当样本容量不超过量不超过100100时,按照数据的多少,常分成时,按照数据的多少,常分成5 51212组组.若以若以0.10.1或或1.51.5为组距对上述为组距对上述100100个个样本数据分组合适吗?样本数据分组合适吗?思考思考8 8:一般地,列出一组样本数据的频率分:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?布表可以分哪几个步骤进行?第一步,求极差第一步,求极差.(极差(

12、极差=样本数据中最大值与最小值的差)样本数据中最大值与最小值的差)第二步,决定组距与组数第二步,决定组距与组数.(设(设k=k=极差极差组距,若组距,若k k为整数,则组为整数,则组数数=k=k,否则,组数,否则,组数=k+1=k+1)第三步,确定分点,将数据分组第三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格第四步,统计频数,计算频率,制成表格.(频数(频数=样本数据落在各小组内的个数,样本数据落在各小组内的个数,频率频率=频数频数样本容量)样本容量)上图称为频率分布直方图,其中横轴上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率表示月均用水量,纵轴表示频率/组

13、距组距.月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:组距宽度:组距高度:高度:频率频率组距组距知识探究(二):频率分布直方图知识探究(二):频率分布直方图 思考思考2 2:频率分布直方图中各小长方形的:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和面积表示什么?各小长方形的面积之和为多少?为多少?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O各小长方形的面积各小长方形的面积=频率频率各小长方形的面积之和各小长

14、方形的面积之和=1=1频率分布直方图特点:频率分布直方图特点:非常直观地表明非常直观地表明了样本数据的分布情况,使我们能够看了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来但原始数据不能在图中表示出来.月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10

15、.5 1 1.5 2 2.5 3 3.5 4 4.5 O(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.图形说明问题:图形说明问题:一般地,频率分布直方图的作图步骤一般地,频率分布直方图的作图步骤 第一步第一步,画平面直角坐标系,画平面直角坐标系.第二步第二步,在横轴上均匀标出各组分点,在横轴上均匀标出各组分点,在纵轴上标出单位长度在纵轴上标出单位长度.第三步第三步,以组距为宽,各组的频

16、率与,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的组距的商为高,分别画出各组对应的小长方形小长方形.频率分布直方图作法的讨论 为了更加细致地分析样本的频率分布以估计总体的分布,组数是不是越多越好?影响组数与组距的因素 因素1:样本容量的大小;因素2:原始数据的精细程度;当样本容量不超过100时,常分成5-12组。这是由统计经验获得的。理论迁移理论迁移 例例 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下:4242,3838,2929,3636,4141,4343,5454,4343,3434,444

17、4,4040,5959,3939,4242,4444,5050,3737,4444,4545,2929,4848,4545,5353,4848,3737,2828,4646,5050,3737,4444,4242,3939,5151,5252,6262,4747,5959,4646,4545,6767,5353,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例岁的知识分子所占的比

18、例约是多少约是多少.(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组.分分 组组 频数频数 频率频率 2727,3232)3 0.063 0.06 32 32,3737)3 0.063 0.06 37 37,4242)9 0.189 0.18 42 42,4747)16 0.3216 0.32 47 47,5252)7 0.147 0.14 52 52,5757)5 0.105 0.10 57 57,6262)4 0.084 0.08 62 62,6767)3 0.063 0.06 合合 计计 50 1.0050 1.00样本频率分布表:

19、样本频率分布表:(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7,故年龄在故年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.0

20、28频率/组距0.0320.036例2:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?频率分布直方图如下:频率分布直方图如下:月均用水量/t频率频率组距组距0.50.5 1 1.522.5 33.5 44.5连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线

21、图线图0.40.30.20.1知识探究(三):频率分布折线图知识探究(三):频率分布折线图 总体密度曲线频率组距月均用水量/tab (图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线频率分布折线图就会无限接近一条光滑曲线总体密总体密度曲线度曲线总体密度曲线总体密度曲线 用样本分布直方图去估计相应的总体分布时,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,一般样本容量越大,频率分布直方图频率分布直方图就会无限接就会无限接近近总体密度曲线总体密

22、度曲线,就越精确地反映了总体的分布,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值规律,即越精确地反映了总体在各个范围内取值百分比。百分比。总体密度曲线反映了总体在各个范围内取值总体密度曲线反映了总体在各个范围内取值的百分比的百分比,精确地反映了总体的分布规律。是研究精确地反映了总体的分布规律。是研究总体分布的工具总体分布的工具.总体密度曲线茎 叶 图 某赛季甲、乙两名篮球运动员每场比赛得分某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:的原始记录如下:(1)甲运动员得分甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分乙

23、运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39注:注:中间中间的数字表示得分的的数字表示得分的十十位数字。位数字。旁边旁边的数字分别表示两个人得分的的数字分别表示两个人得分的个位个位数。数。甲甲乙乙012345846336838912554161679490茎叶图茎叶图 当样本数据当样本数据较少较少时,用茎叶图表时,用茎叶图表示数据的效果较好,它不但可以示数据的效果较好,它不但可以保留保留所有的信息,而且所有的信息,而且 可以随时可以随时记录记录,给数据的记录和表示都方,给数据的记录和表示都方便。便。练习:练习:某中学高一(某中学高一(2)班甲,乙两)

24、班甲,乙两名同学自高中以来每场数学考试成名同学自高中以来每场数学考试成绩情况如下:绩情况如下:甲的得分:甲的得分:95,81,75,91,86,89,71,65,76,88,94乙的得分:乙的得分:83,86,93,99,88,96,98,98,79,85,97画出两人数学成绩茎叶图,请根据画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较。茎叶图对两人的成绩进行比较。小 结 图形图形 优点优点 缺点缺点频率分频率分布直方布直方图图1 1)易表示大量数据)易表示大量数据2 2)直观地表明分布)直观地表明分布的情况的情况丢失一些信丢失一些信息息茎叶图茎叶图1 1)无信息损失)无信息损失2

25、2)随时方便记录)随时方便记录只能表示容只能表示容量较小的数量较小的数据据课堂小结课堂小结表示样本分布的方法:表示样本分布的方法:(1)频率分布表)频率分布表(2)频率分布图(包括直方图和条形图)频率分布图(包括直方图和条形图)(3)频率分布折线图)频率分布折线图(4)茎叶图)茎叶图1.1.频率分布表频率分布表 表示样本的分布的方法:表示样本的分布的方法:分组分组个数累计个数累计频数频数频率频率频率/组距产品尺寸(mm)2.频率分布直方图频率分布直方图样本频率分布中,样本频率分布中,当样本容量无限增当样本容量无限增大,组距无限缩小大,组距无限缩小样本频率分布直方图样本频率分布直方图接近接近于一

26、条光滑曲线于一条光滑曲线总体总体密度曲线密度曲线,反映了总体分,反映了总体分布。布。3.频率分布折线图频率分布折线图 1.1.总体分布指的是总体取值的频率分布规律,总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。的频率分布去估计总体的分布。2.2.总体的分布分两种情况:当总体中的个体总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。频率分布表或频率分布直方图。小结

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!