2.2用样本估计总体(一)PPT课件

上传人:仙*** 文档编号:165100607 上传时间:2022-10-26 格式:PPT 页数:91 大小:1.69MB
收藏 版权申诉 举报 下载
2.2用样本估计总体(一)PPT课件_第1页
第1页 / 共91页
2.2用样本估计总体(一)PPT课件_第2页
第2页 / 共91页
2.2用样本估计总体(一)PPT课件_第3页
第3页 / 共91页
资源描述:

《2.2用样本估计总体(一)PPT课件》由会员分享,可在线阅读,更多相关《2.2用样本估计总体(一)PPT课件(91页珍藏版)》请在装配图网上搜索。

1、分层抽样系统抽样随机数法抓阄抽签简单随机抽样抽样方法)(复习回顾复习回顾1.抽样方法有哪些?类别类别共同点共同点各自特点各自特点相互联系相互联系适用范围适用范围 简单随机简单随机 抽样抽样 系统系统 抽样抽样 分层抽样分层抽样2.三三种抽样方式比较种抽样方式比较1.不放不放回抽样回抽样2.抽样过抽样过程中程中,每每个个体个个体被抽取被抽取的机会的机会均等均等从总体中从总体中逐个抽取逐个抽取将总体均分为将总体均分为几部分几部分,按简单按简单随机抽样抽取随机抽样抽取第一个样本,第一个样本,然后按相同的然后按相同的间隔抽取其他间隔抽取其他样本样本将总体分成将总体分成几层,分层几层,分层进行抽取进行抽

2、取 抽取第一抽取第一个样本时个样本时采用简单采用简单随机抽样随机抽样 各层抽样时,各层抽样时,采用简单随采用简单随机抽样或系机抽样或系统抽样统抽样总体中的个总体中的个体数较少体数较少总体中的个体总体中的个体数较多数较多 (间隔相同的间隔相同的时间或距离时间或距离)总体由差异总体由差异明显的几部明显的几部分组成分组成练习:在练习:在下列问题中,各采用什么抽样下列问题中,各采用什么抽样方法抽取样本较合适?方法抽取样本较合适?1、从、从20台电脑中抽取台电脑中抽取4台进行质量检测;台进行质量检测;2、从、从2004名同学中,抽取一个容量为名同学中,抽取一个容量为20的样本的样本3、某中学有、某中学有

3、180名教工,其中业务人员名教工,其中业务人员136名,名,管理人员管理人员20名,后勤人员名,后勤人员24名,从中抽取一个名,从中抽取一个容量为容量为15的样本。的样本。简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样 如何从样本数据中提取基本信如何从样本数据中提取基本信息来估计总体的情况呢?息来估计总体的情况呢?抽样是统计的第一步,抽样是统计的第一步,接下来就要对样本进行分析。接下来就要对样本进行分析。2.2 2.2 用样本估计总体用样本估计总体一、用样本的频率分布估计总体的分布一、用样本的频率分布估计总体的分布二、用样本的数字特征估计总体的特征二、用样本的数字特征估计总体的特征平

4、均数、中位数、众数、平均数、中位数、众数、极差、方差、标准差极差、方差、标准差频率分布表、频率分布直方图、频率分布表、频率分布直方图、频率折线图、茎叶图频率折线图、茎叶图采用抽样调查的方采用抽样调查的方式获得样本数据式获得样本数据分析样本数据来估分析样本数据来估计全市居民用水量的计全市居民用水量的分布情况分布情况我国是世界上严重缺水我国是世界上严重缺水的国家之一,城市缺水的国家之一,城市缺水问题较为突出,某市政问题较为突出,某市政府为了节约生活用水,府为了节约生活用水,计划在本市试行居民生计划在本市试行居民生活用水定额管理,即确活用水定额管理,即确定一个居民月用水量标定一个居民月用水量标准准a

5、 a,用水量不超过,用水量不超过a a的的部分按平价收费,超出部分按平价收费,超出a a的部分按议价收费。的部分按议价收费。如果希望大部分居民的如果希望大部分居民的日常生活不受影响,那日常生活不受影响,那么标准么标准a a定为多少比较定为多少比较合理呢合理呢?探究探究:你认为,为了较为你认为,为了较为合理地确定出这个合理地确定出这个标准,需要做哪些标准,需要做哪些工作?工作?下表给出下表给出100100位居民的月均用水量表位居民的月均用水量表 分析数据的一种分析数据的一种基本方法基本方法是用图将它们画出来,或者是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两用紧凑的表格改

6、变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式供解释数据的新方式讨论:如何分讨论:如何分析数据?析数据?根据这些数据根据这些数据你能得出用水你能得出用水量其他信息吗量其他信息吗?为此我们要对这些数据进行整理与分析为此我们要对这些数据进行整理与分析初中我们曾经学过频数分布图和频数分初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布表,这使我们能够清楚地知道数据分布在各个小组的个数。下面将要学

7、习的布在各个小组的个数。下面将要学习的频率分布图和频率分布表,则是从各个频率分布图和频率分布表,则是从各个小组数据在样本容量中所占比例大小的小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。它可以角度,来表示数据分布的规律。它可以使我们看到整个样本数据的频率分布情使我们看到整个样本数据的频率分布情况。况。一一频率分布的概念:频率分布的概念:频率分布频率分布是指一个样本数据在各个小范围是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方内所占比例的大小。一般用频率分布直方图反映样本的频率分布图反映样本的频率分布 一、频率分布直方图一、频率分布直方图第一步第一步:求极差求极

8、差:(数据组中最大值与最小值的差距数据组中最大值与最小值的差距)最大值最大值=4.3 =4.3 最小值最小值=0.2 =0.2 所以极差所以极差=4.3-0.2=4.1=4.3-0.2=4.1第二步第二步:决定组距与组数决定组距与组数:(注意取整)(注意取整)当样本容量不超过当样本容量不超过100100时时,按照数据的多少按照数据的多少,常常分成分成512512组组.为方便组距的选择应力求为方便组距的选择应力求“取整取整”.本题如果组距为本题如果组距为0.5(t).0.5(t).则则 4.18.20.5极差组数=组距第三步第三步:将数据分组:将数据分组:(给出组的界限给出组的界限)所以将数据分

9、成所以将数据分成9 9组较合适组较合适.0,0.5),0.5,1),1,1.5),4,4.5)共共9组组.第四步第四步:列频率分布表列频率分布表.分组分组频数频数频率频率频率频率/组距组距0-0.5)40.5-1)8 1-1.5)15 1.5-2)22 2-2.5)25 2.5-3)15 3-3.5)5 3.5-4)4 4-4.5)2合计合计100组距组距=0.5=0.5 0.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.05 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将

10、上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O 为了直观反映样本数据在各组中的为了直观反映样本数据在各组

11、中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O 为了直观反映样本数据在各组中的为了直

12、观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O 为了直观反映样本

13、数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5

14、O 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3

15、3.5 4 4.5 O00.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5频率频率/组距组距 月均用水量月均用水量/t/t (组距组距=0.5)=0.5)0.080.160.30.440.50.30.10.080.04小长方形的面小长方形的面积积=?=?小长方形的面小长方形的面积总和积总和=?=?月均用水月均用水量居量居民人数最民人数最多的多的在哪个区间在哪个区间?请大家阅读第请大家阅读第6868页页,直方图有直方图有哪些优点和缺哪些优点和缺点点?第五步第五步:画出频率分布直方图画出频率分布直方图.同样一组数据同样一组数据,如果组距不同如果组距不同,横

16、轴、纵轴的单位横轴、纵轴的单位不同不同,得到的图的形状也会不同得到的图的形状也会不同.不同的形状给人以不不同的形状给人以不同的印象同的印象,这种印象有时会影响我们对总体的判断这种印象有时会影响我们对总体的判断.分分别以别以1 1和和0.10.1为组距重新作图为组距重新作图,然后谈谈你对图的印象然后谈谈你对图的印象.频率分布直方图的特征:频率分布直方图的特征:1.频频率分布直率分布直方图频率分布表更直观方图频率分布表更直观地地反映了样本的分布规律反映了样本的分布规律.2.从从频率分布直方图得不出原始的数频率分布直方图得不出原始的数据内容,把数据表示成直方图后,据内容,把数据表示成直方图后,原有的

17、具体数据信息就被抹掉了。原有的具体数据信息就被抹掉了。如如果当地政府希望使果当地政府希望使85%85%以上的居民每以上的居民每月的用水量不超出标准,根据频率分布表月的用水量不超出标准,根据频率分布表2-22-2和频率分布直方图和频率分布直方图2.2-12.2-1,你能对制定月用水量标准提出建议吗你能对制定月用水量标准提出建议吗?88%88%的居民月用水量在的居民月用水量在3t 3t以下,以下,可建议取可建议取a=3.a=3.小结小结:画频率分布直方图的步骤画频率分布直方图的步骤:第一步第一步:求极差求极差:(数据组中最大值与最小值的差距数据组中最大值与最小值的差距)第二步第二步:决定组距与组数

18、决定组距与组数:(强调取整)(强调取整)第三步第三步:将数据分组将数据分组 (给出组的界限给出组的界限)第四步第四步:列频率分布表列频率分布表.(包括分组、频数、频率(包括分组、频数、频率、频、频率率/组距组距)第五步第五步:画频率分布直方图画频率分布直方图(在频率分布表的基础上(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率绘制,横坐标为样本数据尺寸,纵坐标为频率/组距组距.)组距组距:指每个小组的两个端点的距离指每个小组的两个端点的距离组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时,按数据多少常分按数据多少常分5-12组。组。注意注意第几组频数(1

19、)第几组频率样本容量(2)纵坐标为纵坐标为:频率组距练习:练习:例例 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下:4242,3838,2929,3636,4141,4343,5454,4343,3434,4444,4040,5959,3939,4242,4444,5050,3737,4444,4545,2929,4848,4545,5353,4848,3737,2828,4646,5050,3737,4444,4242,3939,5151,5252,6262,4747,5959,4646,4545,6767

20、,5353,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例岁的知识分子所占的比例约是多少约是多少.(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组.分分 组组 频数频数 频率频率 2727,3232)3 0.063 0.06 32 32,3737)3 0.063 0.06 37 37,4242)9 0.189 0.18 4

21、2 42,4747)16 0.3216 0.32 47 47,5252)7 0.147 0.14 52 52,5757)5 0.105 0.10 57 57,6262)4 0.084 0.08 62 62,6767)3 0.063 0.06 合合 计计 50 1.0050 1.00样本频率分布表:样本频率分布表:(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O(3 3

22、)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7,故年龄在故年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.课堂练习课堂练习2(2006年全国卷年全国卷II)一个社会调查机构就某地居民一个社会调查机构就某地居民的月收入调查了的月收入调查了10 000人,并根据所得数据画了样人,并根据所得数据画了样本的频率分布直方图本的频率分布直方图(如下图如下图).为了分析居民的收入为了分析居民的收入与年龄、学历、职业等方面的关系,要从这与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出人中再用分层抽样方法抽

23、出100人作进一步调查,人作进一步调查,则在则在2500,3000(元元)月收入段应抽出月收入段应抽出_人人.0.00010.00020.00030.00040.0005月收入月收入(元元)频率频率/组距组距251000 1500 2000 2500 3000 3500 4000频率组距课堂练习课堂练习0.30.14.34.54.74.95.1视力视力频率频率/组距组距A.0.27,78B.0.27,83C.2.7,78D.2.7,83A频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5

24、连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图线图频率分布折线图频率分布折线图 由于样本是随机的,不同的样本的由于样本是随机的,不同的样本的得到的频率分布折线图不同,即使对于得到的频率分布折线图不同,即使对于同一样本,不同的分组情况得到的频率同一样本,不同的分组情况得到的频率分布折线图也不同,频率分布折线图是分布折线图也不同,频率分布折线图是随着随着样本的容量样本的容量和和分组情况分组情况的变化而变的变化而变化的。化的。利用样本频分布对总体分布进行相应估计利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩

25、小,)当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲那么频率折线图就会无限接近于一条光滑曲线线总体密度曲线总体密度曲线。(2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1)上例的样本容量为)上例的样本容量为100,如果增至,如果增至1000,其频率分布直方图的情况会有什么变化?假如增其频率分布直方图的情况会有什么变化?假如增至至10000呢?呢?总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间(a,b)内取值的百分比)。内取值的百分比)。用样本分

26、布直方图去估计相应的总体分布时,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,一般样本容量越大,频率分布直方图频率分布直方图就会无限接就会无限接近近总体密度曲线总体密度曲线,就越精确地反映了总体的分布,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值规律,即越精确地反映了总体在各个范围内取值百分比。百分比。总体密度曲线反映了总体在各个范围内取值的总体密度曲线反映了总体在各个范围内取值的百分比百分比,精确地反映了总体的分布规律。是研究总精确地反映了总体的分布规律。是研究总体分布的工具体分布的工具.总体密度曲线总体密度曲线并非所有的总体都存在密度曲线,如一些离散型总

27、体并非所有的总体都存在密度曲线,如一些离散型总体不能由样本折线图得到准确的总体密度曲线不能由样本折线图得到准确的总体密度曲线随堂训练随堂训练6.6.如图是总体密度曲线,下列说法正确的是如图是总体密度曲线,下列说法正确的是()()(A A)组距越大,频率分布折线图越接近于它)组距越大,频率分布折线图越接近于它(B B)样本容量越小,频率分布折线图越接近于它)样本容量越小,频率分布折线图越接近于它(C C)阴影部分的面积代表总体在)阴影部分的面积代表总体在(a,b)(a,b)内取值的百分比内取值的百分比(D D)阴影部分的平均高度代表总体在()阴影部分的平均高度代表总体在(a,b)a,b)内取值的

28、百分比内取值的百分比c茎叶图茎叶图 某赛季甲、乙两名篮球运动员每场比赛某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:得分的原始记录如下:甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39乙运动员得分:乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39甲甲乙乙0 12345 2 55 41 6 1 6 7 9 4 90 8 4 6 3 3 6 8 3 8 9 1 叶叶 茎茎 叶叶 当数据是两位有效数字时,用中间的数字表示十位数,即当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示

29、个位数,即第二个有效数字,第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。因此通常把这样的图叫做茎叶图。1.茎叶图茎叶图:2.画茎叶图的步骤画茎叶图的步骤:1.将每个数据分为茎将每个数据分为茎(高位高位)和叶和叶(低位低位)两部分两部分,在此例中在此例中,茎为十茎为十位上的数字位上的数字,叶为个位上的数字叶为个位上的数字;2.将最小茎和最大茎之间的数按大小次序排成一列将最小茎和最大茎之间的数按大小次序排成一列,写在左写在左(右右)侧侧;3.将各个

30、数据的叶按大小次序将各个数据的叶按大小次序写在其茎右写在其茎右(左左)侧侧.茎叶0813 4 523 6 833 8 94513.茎茎叶叶图优缺点:图优缺点:从统计图上没有原始数据信息的损失,所有从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;茎叶图中的数数据信息都可以从茎叶图中得到;茎叶图中的数据可以随时记录,随时添加据可以随时记录,随时添加,方便记录方便记录与表示与表示 茎叶图只便于表示两位或一位有效数字的数据,茎叶图只便于表示两位或一位有效数字的数据,对位数多的数据不太容易操作;茎叶图只便于记录两对位数多的数据不太容易操作;茎叶图只便于记录两组数据,两组以上的数据虽然

31、能够记录但是没有表示组数据,两组以上的数据虽然能够记录但是没有表示两组记录那么直观、清晰两组记录那么直观、清晰茎叶图对重复出现的数据要重复记录,不能遗漏优点:优点:缺点:缺点:甲、乙两个小组各甲、乙两个小组各10名学生的英语口语测试成绩如名学生的英语口语测试成绩如下:下:甲组甲组 76 90 84 86 81 87 86 82 85 83乙组乙组 82 84 85 89 79 80 91 89 79 74用茎叶图表示两小组的成绩,并判断哪个小组用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些的成绩更整齐一些甲甲乙乙7894 9 90 2 4 5 9 91 6 7 6 6 5 4 3 2

32、 1 0甲组成绩较集中,甲组成绩较集中,所以甲组成绩更所以甲组成绩更稳定一些稳定一些 小小 结结 图形图形 优点优点 缺点缺点频率分布频率分布 1)易表示)易表示大量数据大量数据 丢失一些丢失一些直方图直方图 2)直观直观地表明分布地地表明分布地 情况情况 信息信息 1)无信息损失无信息损失 只能处理样本只能处理样本 茎叶图茎叶图 2)随时记录方便记录和表示)随时记录方便记录和表示 容量较小数据容量较小数据几种表示频率分布的方法的优点与不足几种表示频率分布的方法的优点与不足1.频率分布表频率分布表在数量表示上比较确切,但不够直在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方

33、便。观、形象,分析数据分布的总体态势不太方便。2.频率分布直方图频率分布直方图能够很容易地表示大量数据,能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式。但是从直方在分布表中看不清楚的数据模式。但是从直方图本身得不出原始的数据内容。图本身得不出原始的数据内容。3.频率分布折线图频率分布折线图的优点是它反映了数据的变化的优点是它反映了数据的变化趋势。如果样本容量不断增大,分组的组距不断趋势。如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线。缩小,那么折线图就趋向于总体分布的密度曲线

34、。4.用用茎叶图茎叶图刻画数据有两个优点:一是所有的信刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况。但当样记录和表示,能够展示数据的分布情况。但当样本数据较多或数据位数较多时,茎叶图就显得不本数据较多或数据位数较多时,茎叶图就显得不太方便了。太方便了。4.4.(20102010龙岩高一检测)如图是某赛季甲、乙两名篮球运龙岩高一检测)如图是某赛季甲、乙两名篮球运动员参加的每场比赛得分的茎叶图,则甲、乙两人这几场比动员参加的每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是赛得分的

35、中位数之和是()()(A A)65 65 (B B)64 64 (C C)63 63 (D D)6262用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征中位数中位数:将一组数据按大小依次排列,把处在:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数)叫做这组数据的中位数.众数众数:在一组数据中,出现次数最多的数据叫:在一组数据中,出现次数最多的数据叫做这组数据的众数做这组数据的众数 平均数平均数:一组数据的算术平均数一组数据的算术平均数,即即 )(121nxxxnX三三 众数、

36、中位数、平均数的概念众数、中位数、平均数的概念 问题问题1:众数、中位数、平均数这三个数众数、中位数、平均数这三个数一般都会来自于同一个总体或样本,它们一般都会来自于同一个总体或样本,它们能表明总体或样本的什么性质?能表明总体或样本的什么性质?平均数平均数:反映所有数据的平均水平反映所有数据的平均水平 众数众数:反映的往往是局部较集中的数据信息反映的往往是局部较集中的数据信息 中位数中位数:是位置型数,反映处于中间部位的是位置型数,反映处于中间部位的 数据信息数据信息 三种数字特征的优缺点三种数字特征的优缺点特征数特征数优优 点点缺缺 点点众数众数体现了样本数据的最大体现了样本数据的最大集中点

37、集中点无法客观反映总体无法客观反映总体特征特征中位数中位数不受少数极端值的影响不受少数极端值的影响 不受少数极端值的不受少数极端值的影响有时也是缺点影响有时也是缺点平均数平均数与每一个数据有关,更与每一个数据有关,更能反映全体的信息能反映全体的信息.受少数极端值的影受少数极端值的影响较大,使其在估响较大,使其在估计总体时的可靠性计总体时的可靠性降低降低.月均用水量月均用水量/t频率频率/组距组距o4.543.532.521.510.50.500.400.300.200.10思考思考1:如何从频率分布直方图中估计:如何从频率分布直方图中估计众数众数?2.25 众数在样本数据的频率分布直方图中,众

38、数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。就是最高矩形的中点的横坐标。思考思考2:如何从频率分布直方图中估计:如何从频率分布直方图中估计中位数中位数?0.020.040.060.140.250.220.150.080.04月均用水量月均用水量/t频率频率/组距组距o4.543.532.521.510.50.500.400.300.200.10前四个小矩形的面积前四个小矩形的面积和和=0.492.02后四个小矩形的后四个小矩形的面积和面积和=0.26分析:分析:在样本数据中,有在样本数据中,有50%50%的个体小于或等于中位数,也有的个体小于或等于中位数,也有50%50%的个体

39、大的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。的面积应该相等。总结:总结:在频率分布直方图中,把频率分布直方图划分左右两在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与个面积相等的分界线与x轴交点的横坐标称为中位数。轴交点的横坐标称为中位数。注注:图中的数据是小矩形的面积即频率图中的数据是小矩形的面积即频率上图中,设中位数为上图中,设中位数为x,则,则 02.25.05.0)2(22.015.008.004.0 xx 思考思考3 3:如何从频率分布直方图中估计:如何

40、从频率分布直方图中估计平均数平均数?注注:图中的数据是小矩形的面积即频率图中的数据是小矩形的面积即频率0.020.040.060.140.250.220.150.080.04月均用水量月均用水量/t频率频率/组距组距o4.543.532.521.510.50.500.400.300.200.10.0.250.751.251.752.25.2.753.253.754.25 平均数等于频率分布直方图中每个小矩形平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。的面积乘以小矩形底边中点的横坐标之和。2.02在频率分布直方图中如何估计在频率分布直方图中如何估计众数众数?月均用水

41、量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5众数:频率分布直方图众数:频率分布直方图中中最高最高小长方形底边中小长方形底边中点的点的横坐标横坐标.左图中,众数为左图中,众数为_.2.25在频率分布直方图中如何估计在频率分布直方图中如何估计中位数中位数?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5中位数中位数:在频率分布直方图中,:在频率分布直方图中,把频率分布直方图划分左右两个把频率分布直方图划分左右两个面积相等的分界线与面积相等的分界线与x轴交点的轴

42、交点的横坐标横坐标。左图中左图中,中位数为,中位数为_.2.02在频率分布直方图中如何估计在频率分布直方图中如何估计平均数平均数?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5 平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”,等于频率分布直方图中,等于频率分布直方图中每个小矩形的面积乘以小矩形底边每个小矩形的面积乘以小矩形底边中点的横坐标之和中点的横坐标之和.左图中左图中,平均数为,平均数为_.2.02方差与标准差方差与标准差1.频率分布折线图频率分布折线图:月均用水量月均用水量/t频率频率组距组距0.10

43、0.200.300.400.500.511.5 22.533.544.5连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图线图复习提问:2.总体总体密度曲线密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间(a,b)内取值的百分比)。内取值的百分比)。3.茎茎叶叶图优缺点:图优缺点:从统计图上没有原始数据信息的损失,所有从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;茎叶图中的数数据信息都可以从茎叶图中得到;茎叶图中的数据可以随

44、时记录,随时添加据可以随时记录,随时添加,方便记录方便记录与表示与表示 茎叶图只便于表示两位或一位有效数字的数据,茎叶图只便于表示两位或一位有效数字的数据,对位数多的数据不太容易操作;茎叶图只便于记录两对位数多的数据不太容易操作;茎叶图只便于记录两组数据,两组以上的数据虽然能够记录但是没有表示组数据,两组以上的数据虽然能够记录但是没有表示两组记录那么直观、清晰两组记录那么直观、清晰茎叶图对重复出现的数据要重复记录,不能遗漏优点:优点:缺点:缺点:在频率分布直方图中如何估计在频率分布直方图中如何估计众数众数?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.51

45、1.5 22.533.544.5众数:频率分布直方图众数:频率分布直方图中中最高最高小长方形底边中小长方形底边中点的点的横坐标横坐标.左图中,众数为左图中,众数为_.2.25在频率分布直方图中如何估计在频率分布直方图中如何估计中位数中位数?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5中位数中位数:在频率分布直方图中,:在频率分布直方图中,把频率分布直方图划分左右两个把频率分布直方图划分左右两个面积相等的分界线与面积相等的分界线与x轴交点的轴交点的横坐标横坐标。左图中左图中,中位数为,中位数为_.2.02在频率分布直方图

46、中如何估计在频率分布直方图中如何估计平均数平均数?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5 平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”,等于频率分布直方图中,等于频率分布直方图中每个小矩形的面积乘以小矩形底边每个小矩形的面积乘以小矩形底边中点的横坐标之和中点的横坐标之和.左图中左图中,平均数为,平均数为_.2.02 引言引言:样本的众数、中位数和平均数常用来表样本的众数、中位数和平均数常用来表示样本数据的示样本数据的“中心值中心值”,其中众数和中位数容,其中众数和中位数容易计算,不受少数几个极端值

47、的影响,但只能表易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息达样本数据中的少量信息.平均数代表了数据更多平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大数据对平均数的影响也越大.当样本数据质量比较当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度统计

48、数字刻画样本数据的离散程度.情境一情境一:某农场种植了甲、乙两种玉米苗,从中各某农场种植了甲、乙两种玉米苗,从中各抽取了抽取了1010株,分别测得它们的株高如下:株,分别测得它们的株高如下:(单位单位cm)cm)甲:甲:31 32 35 37 33 30 32 31 30 29乙:乙:53 16 54 13 66 16 13 11 16 62思考:思考:哪种玉米苗长得齐?哪种玉米苗长得齐?x=32乙x=32甲甲甲37(最大值)(最大值)29(最小值(最小值)8乙乙66(最大值)(最大值)11(最小值)(最小值)55极极 差差 甲甲:31 32 35 37 33 30 32 31 30 29 乙

49、乙:53 16 54 13 66 16 13 11 16 62甲甲32372937321166乙乙情景二情景二:在一次射击选拔赛中,甲、乙两在一次射击选拔赛中,甲、乙两名运动员各射击名运动员各射击1010次,每次命中的环数次,每次命中的环数如下:如下:甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7 甲、乙两人本次射击的平均成绩分甲、乙两人本次射击的平均成绩分别为多少环?别为多少环?77乙甲,xx思考:思考:甲、乙两人射击的平均成绩相等,观甲、乙两人射击的平均成绩相等,观

50、察两人成绩的频率分布条形图,你能说明其察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?水平差异在那里吗?环数环数甲的成绩比较分散,极差较大,乙的甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定成绩相对集中,比较稳定.极差:极差:一组数据的最大值与最小值的差一组数据的最大值与最小值的差极差越大,数据越分散,越不稳极差越大,数据越分散,越不稳定定极差越小,数据越集中,越稳定极差越小,数据越集中,越稳定极差体现了数据的离散极差体现了数据的离散程度程度.为了对玉米生长的高度差异以及两为了对玉米生长的高度差异以及两人射击水平的稳定程度等做个合理的人射击水平的稳定程度等做个合理的评价评价,我

51、们用一个新的概念来研究,我们用一个新的概念来研究,方差和标准差方差和标准差.有没有一种可能两组数据极差有没有一种可能两组数据极差相同但是稳定性差别很大呢?相同但是稳定性差别很大呢?甲的环数极差甲的环数极差=10-4=6 乙的环数极差乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度它们在一定程度上表明了样本数据的分散程度,与平均数一与平均数一起起,可以给我们许多关于样本数据的信息可以给我们许多关于样本数据的信息.显然显然,极差对极端值非极差对极端值非常敏感常敏感,注意到这一点注意到这一点,我们可以得到一种我们可以得到一种“去掉一个最高分去掉一个最高分,去去掉一个最低分掉一个最低

52、分”的统计策略的统计策略.考察样本数据的考察样本数据的分散程度分散程度的大小,最常用的统计量是的大小,最常用的统计量是标准差标准差标准差是样本数据到平均数的一种标准差是样本数据到平均数的一种平均距离平均距离,一般用,一般用s表示表示所谓所谓“平均距离平均距离”,其含义可作如下理解:,其含义可作如下理解:x。xxxxxin的距离是到表示这组数据的平均数假设样本数据是,.,21).,2,1(nixxi:xxxx,n是平均距离的到样本数据于是”“,21.21nxxxxxxn 由于上式含有绝对值,运算不太方便,因此,通常改用由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算如下公式来计算标

53、准差标准差.)()()(122221xxxxxxnsn 222212)()()(1xxxxxxnsn方差方差:对于样本数据对于样本数据x x1 1,x x2 2,x xn n,设想通过,设想通过各数据到其平均数的平均距离来反映样各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离本数据的分散程度,那么这个平均距离如何计算?如何计算?12|nxxxxxxn-+-+-L标准差的概念:标准差的概念:计算标准差的公式:计算标准差的公式:222121()()()nsxxxxxxn设一组样本数据设一组样本数据 x1,x2,xn ,其平,其平均数为均数为 ,则,则x 标准差是样本数据到平均数

54、的一种标准差是样本数据到平均数的一种平平均距离均距离,一般用,一般用s表示。表示。标准差的平方标准差的平方s2方差方差2222121()()()nsxxxxxxn在刻画样本数据分散程度上,方差在刻画样本数据分散程度上,方差s2与与标准差标准差s是一样的。但是在解决实际问是一样的。但是在解决实际问题时,一般多采用标准差题时,一般多采用标准差s。对标准差的理解对标准差的理解 (1)标准差是用来描述样本数据的离散程)标准差是用来描述样本数据的离散程度的,它反映了各个样本数据聚集于样本平度的,它反映了各个样本数据聚集于样本平均数周围的程度。标准差越小,表明各个样均数周围的程度。标准差越小,表明各个样本

55、数据在样本平均数的周围越集中;反之,本数据在样本平均数的周围越集中;反之,标准差越大,表明各个样本数据在样本平均标准差越大,表明各个样本数据在样本平均数的两边越分散。数的两边越分散。(2)在实际应用中,标准差常被理解为)在实际应用中,标准差常被理解为稳定性。稳定性。标标准差的取值范围是什么?标准差为准差的取值范围是什么?标准差为0的样本数据有什么特点?的样本数据有什么特点?标标准差是非负的。标准差为准差是非负的。标准差为0意味着所意味着所有的样本数据都相等的特性,且与样本平均有的样本数据都相等的特性,且与样本平均数也相等。数也相等。知识迁移知识迁移 s s甲甲=2=2,s s乙乙=1.095.

56、=1.095.计算甲、乙两名运动员的射击成绩的计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性标准差,比较其射击水平的稳定性.甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(甲)(甲)环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(乙)(乙)随堂随堂练习

57、练习:A一、选择题(每题一、选择题(每题4 4分,共分,共1616分)分)1.1.下列说法错误的是下列说法错误的是()()(A)(A)在统计里在统计里,把所需考察对象的全体叫作总体把所需考察对象的全体叫作总体(B)(B)一组数据的平均数一定大于这组数据中的每个数据一组数据的平均数一定大于这组数据中的每个数据(C)(C)平均数、众数与中位数从不同的角度描述了一组数据的集平均数、众数与中位数从不同的角度描述了一组数据的集中趋势中趋势(D)(D)一组数据的方差越大一组数据的方差越大,说明这组数据的波动越大说明这组数据的波动越大【解析解析】选选B.B.平均数一定不大于这组数据中的最大值平均数一定不大于这组数据中的最大值.能力提升能力提升2.2.(20102010济南高一检测)甲、乙两位同济南高一检测)甲、乙两位同学都参加了由学校举办的篮球比赛,他们学都参加了由学校举办的篮球比赛,他们都参加了全部的都参加了全部的7 7场比赛,平均得分均为场比赛,平均得分均为1616分,标准差分别为分,标准差分别为5.095.09和和3.723.72,则甲、,则甲、乙两同学在这次篮球比赛活动中,发挥得乙两同学在这次篮球比赛活动中,发挥得更稳定的是更稳定的是()()(A)(A)甲甲 (B)(B)乙乙(C)(C)甲、甲、乙相同乙相同 (D)(D)不能确定不能确定B

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!