高中数学2.2.2-用样本的数字特征估计总体的数字特征精品公开课课件

上传人:文**** 文档编号:209563086 上传时间:2023-05-14 格式:PPTX 页数:38 大小:542.40KB
收藏 版权申诉 举报 下载
高中数学2.2.2-用样本的数字特征估计总体的数字特征精品公开课课件_第1页
第1页 / 共38页
高中数学2.2.2-用样本的数字特征估计总体的数字特征精品公开课课件_第2页
第2页 / 共38页
高中数学2.2.2-用样本的数字特征估计总体的数字特征精品公开课课件_第3页
第3页 / 共38页
资源描述:

《高中数学2.2.2-用样本的数字特征估计总体的数字特征精品公开课课件》由会员分享,可在线阅读,更多相关《高中数学2.2.2-用样本的数字特征估计总体的数字特征精品公开课课件(38页珍藏版)》请在装配图网上搜索。

1、(一)众数、中位数、平均数2.2.2 2.2.2 用样本的数字特征估计用样本的数字特征估计总体的数字特征总体的数字特征一一 众数、中位数、平均数的概念众数、中位数、平均数的概念中位数中位数:将一组数据按大小依次排列,把处在:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数)叫做这组数据的中位数.众数众数:在一组数据中,出现次数最多的数据叫:在一组数据中,出现次数最多的数据叫做这组数据的众数做这组数据的众数 平均数平均数:一组数据的算术平均数一组数据的算术平均数,即即 关于它们,史上最关于它们,史上

2、最全的解释说明全的解释说明一、相同点一、相同点平均数、中位数和众数这三个统计量的相同之处主要表平均数、中位数和众数这三个统计量的相同之处主要表现在:都是来描述数据集中趋势的统计量;都可用来反现在:都是来描述数据集中趋势的统计量;都可用来反映数据的一般水平;都可用来作为一组数据的代表映数据的一般水平;都可用来作为一组数据的代表.二、不同点二、不同点1 1、定义不同、定义不同平均数:一组数据的总和除以这组数据个数所得到的商平均数:一组数据的总和除以这组数据个数所得到的商叫这组数据的平均数叫这组数据的平均数.中位数:将一组数据按大小顺序排列中位数:将一组数据按大小顺序排列,处在最中间位置的处在最中间

3、位置的一个数叫做这组数据的中位数一个数叫做这组数据的中位数 .众数:在一组数据中出现次数最多的数叫做这组数据的众数:在一组数据中出现次数最多的数叫做这组数据的众数众数.2 2、求法不同、求法不同平均数:用所有数据相加的总和除以数据的个数平均数:用所有数据相加的总和除以数据的个数,需要需要计算才得求出计算才得求出.中位数:将数据按照从小到大或从大到小的顺序排列中位数:将数据按照从小到大或从大到小的顺序排列,如果数据个数是奇数如果数据个数是奇数,则处于最中间位置的数就是这组则处于最中间位置的数就是这组数据的中位数;如果数据的个数是偶数数据的中位数;如果数据的个数是偶数,则中间两个数则中间两个数据的

4、平均数是这组数据的中位数据的平均数是这组数据的中位数.它的求出不需或只需它的求出不需或只需简单的计算简单的计算.众数:一组数据中出现次数最多的那个数众数:一组数据中出现次数最多的那个数,不必计算就不必计算就可求出可求出.3 3、个数不同:在一组数据中、个数不同:在一组数据中,平均数和中位数都具有惟平均数和中位数都具有惟一性一性,但众数有时不具有惟一性但众数有时不具有惟一性.在一组数据中在一组数据中,可能不止可能不止一个众数一个众数,也可能没有众数也可能没有众数.4 4、呈现不同:、呈现不同:平均数:是一个平均数:是一个“虚拟虚拟”的数的数,是通过计算得到的是通过计算得到的,它不它不是数据中的原

5、始数据是数据中的原始数据.中位数:是一个不完全中位数:是一个不完全“虚拟虚拟”的数的数.当一组数据有奇数当一组数据有奇数个时个时,它就是该组数据排序后最中间的那个数据它就是该组数据排序后最中间的那个数据,是这组是这组数据中真实存在的一个数据;但在数据个数为偶数的情数据中真实存在的一个数据;但在数据个数为偶数的情况下况下,中位数是最中间两个数据的平均数中位数是最中间两个数据的平均数,它不一定与这它不一定与这组数据中的某个数据相等组数据中的某个数据相等,此时的中位数是虚拟的数此时的中位数是虚拟的数.众众 数:是一组数据中的原数据数:是一组数据中的原数据 ,它是真实存在的它是真实存在的.5 5、代表

6、不同、代表不同:平均数:反映了一组数据的平均大小平均数:反映了一组数据的平均大小,常用来一代表数据常用来一代表数据的总体的总体“平均水平平均水平”.中位数:像一条分界线中位数:像一条分界线,将数据分成前半部分和后半部分将数据分成前半部分和后半部分,因此用来代表一组数据的因此用来代表一组数据的“中等水平中等水平”.众数:反映了出现次数最多的数据众数:反映了出现次数最多的数据,用来代表一组数据的用来代表一组数据的“多数水平多数水平”.这三个统计量虽反映有所不同这三个统计量虽反映有所不同,但都可表示数据的集中趋但都可表示数据的集中趋势势,都可作为数据一般水平的代表都可作为数据一般水平的代表.6 6、

7、特点不同、特点不同平均数:与每一个数据都有关平均数:与每一个数据都有关,其中任何数据的变动都其中任何数据的变动都会相应引起平均数的变动会相应引起平均数的变动.主要缺点是易受极端值的影主要缺点是易受极端值的影响响,这里的极端值是指偏大或偏小数这里的极端值是指偏大或偏小数,当出现偏大数时当出现偏大数时,平均数将会被抬高平均数将会被抬高,当出现偏小数时当出现偏小数时,平均数会降低平均数会降低.中位数:与数据的排列位置有关中位数:与数据的排列位置有关,某些数据的变动对它某些数据的变动对它没有影响;它是一组数据中间位置上的代表值没有影响;它是一组数据中间位置上的代表值,不受数不受数据极端值的影响据极端值

8、的影响.众数:与数据出现的次数有关众数:与数据出现的次数有关,着眼于对各数据出现的着眼于对各数据出现的频率的考察频率的考察,其大小只与这组数据中的部分数据有关其大小只与这组数据中的部分数据有关,不不受极端值的影响受极端值的影响,其缺点是具有不惟一性其缺点是具有不惟一性,一组数据中可一组数据中可能会有一个众数能会有一个众数,也可能会有多个或没有也可能会有多个或没有 .7 7、作用不同、作用不同平均数:最常用的数据代表值平均数:最常用的数据代表值,比较可靠和稳定比较可靠和稳定,因为它与每因为它与每一个数据都有关一个数据都有关,反映出来的信息最充分。平均数既可以描反映出来的信息最充分。平均数既可以描

9、述一组数据本身的整体平均情况述一组数据本身的整体平均情况,也可用来作为不同组数据也可用来作为不同组数据比较的一个标准比较的一个标准.因此因此,它在生活中应用最广泛它在生活中应用最广泛,如我们经常如我们经常所说的平均成绩、平均身高等所说的平均成绩、平均身高等.中位数:作为一组数据的代表中位数:作为一组数据的代表,可靠性比较差可靠性比较差,因为它只利用因为它只利用了部分数据了部分数据.但当一组数据的个别数据偏大或偏小时但当一组数据的个别数据偏大或偏小时,用中位用中位数来描述该组数据的集中趋势就比较合适数来描述该组数据的集中趋势就比较合适.众数:作为一组数据的代表众数:作为一组数据的代表,可靠性也比

10、较差可靠性也比较差,因为它也只利因为它也只利用了部分数据用了部分数据.在一组数据中在一组数据中,如果个别数据有很大的变动如果个别数据有很大的变动,且某个数据出现的次数最多且某个数据出现的次数最多,此时用该数据(即众数)表示此时用该数据(即众数)表示这组数据的这组数据的“集中趋势集中趋势”就比较适合就比较适合.问题问题1:众数、中位数、平均数这三个数众数、中位数、平均数这三个数一般都会来自于同一个总体或样本,它们一般都会来自于同一个总体或样本,它们能表明总体或样本的什么性质?能表明总体或样本的什么性质?平均数平均数:反映所有数据的平均水平反映所有数据的平均水平 众数众数:反映的往往是局部较集中的

11、数据信息反映的往往是局部较集中的数据信息 中位数中位数:是位置型数,反映处于中间部位的是位置型数,反映处于中间部位的数据信息数据信息 1、求下列各组数据的、求下列各组数据的众数众数(1)、1,2,3,3,3,5,5,8,8,8,9,9众数是:3和8(2)、1,2,3,3,3,5,5,8,8,9,9众数是:32、求下列各组数据的、求下列各组数据的中位数中位数(1)、1,2,3,3,3,4,6,8,8,8,9,9(2)1,2,3,3,3,4,8,8,8,9,9中位数是:5中位数是:4 3、在一次中学生田径运动会上,参加男子跳高的、在一次中学生田径运动会上,参加男子跳高的17名名运动员的成绩如下表所

12、示:运动员的成绩如下表所示:成绩成绩(米米)150160165170175180185190人数人数23234111分别求这些运动员成绩的众数,中位数与平均数分别求这些运动员成绩的众数,中位数与平均数。解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现的次数最多,次,出现的次数最多,即这组数据的众数是即这组数据的众数是1.75上面表里的上面表里的17个数据可看成是按从小到大的顺序排列个数据可看成是按从小到大的顺序排列的,其中第的,其中第9个数据个数据1.70是最中间的一个数据,即这组数是最中间的一个数据,即这组数据的中位数是据的中位数是1.70;答:答:17名运动员成绩的众数、

13、中位数、平均数依次是名运动员成绩的众数、中位数、平均数依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)。(米)。这组数据的平均数是这组数据的平均数是 二、众数、中位数、平均数与频率众数、中位数、平均数与频率分布直方图的关系分布直方图的关系频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)众数在样本数据的频率分布直方图中,众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。就是最高矩形的中点的横坐标。如何在频率分布直方图中估计众数如何在频率分布直方图中估计众数可将众数看作直方图中面积最大长方形

14、的可将众数看作直方图中面积最大长方形的“中心中心”0.52.521.5143.534.5频率频率组距组距0.040.080.150.220.250.140.060.040.02前四个小矩形的面积和前四个小矩形的面积和=0.49后四个小矩形的面积和后四个小矩形的面积和=0.262.02如何在频率分布直方图中估计中位数如何在频率分布直方图中估计中位数分组分组0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3)3,3.5)3.5,4)4,4.5合计合计频率频率0.040.080.150.220.250.140.060.040.021在样本中中位数的左右各有在样本中中位数的左右各有

15、50%的样本数,的样本数,条形面积各为条形面积各为0.5,所以反映在直方图中位数所以反映在直方图中位数左右的面积相等左右的面积相等.中位数中位数可将中位数看作整个直方图面积的可将中位数看作整个直方图面积的“中心中心”思考讨论以下问题:思考讨论以下问题:1、2.02这个中位数的估计值,与样本的中这个中位数的估计值,与样本的中位数值位数值2.0不一样,你能解释其中原因吗?不一样,你能解释其中原因吗?答:答:2.02这个中位数的估计值这个中位数的估计值,与样本的中与样本的中位数值位数值2.0不一样,这是因为样本数据的频不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形率分布直方图,只是

16、直观地表明分布的形状,但是状,但是从直方图本身得不出原始的数据从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。内容,直方图已经损失一些样本信息。所所以由频率分布直方图得到的中位数估计值以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致往往与样本的实际中位数值不一致.如何在频率分布直方图中估计平均数如何在频率分布直方图中估计平均数=2.02平均数的平均数的估计值等估计值等于频率分于频率分布直方图布直方图中每个小中每个小矩形的面矩形的面积乘以小积乘以小矩形底边矩形底边中点的横中点的横坐标之和。坐标之和。可将平均数看作整个可将平均数看作整个直方图面积的直方图面积的“重心

17、重心”思考讨论以下问题:思考讨论以下问题:2、样本中位数不受少数极端值的影响,这样本中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点。你能举例说的不敏感有时也会成为缺点。你能举例说明吗?明吗?答:优点:对极端数据不敏感的方法能够答:优点:对极端数据不敏感的方法能够有效地预防错误数据的影响。有效地预防错误数据的影响。对极端值不敏感有利的例子对极端值不敏感有利的例子:例如当样本数据质例如当样本数据质量比较差,即存在一些错误数据(如数据录入错量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,用抗极端数据强的中位

18、数误、测量错误等)时,用抗极端数据强的中位数表示数据的中心值更准确。表示数据的中心值更准确。缺点:(缺点:(1)出现错误的数据也不知道;)出现错误的数据也不知道;(2)对极端值不敏感有弊的例子:对极端值不敏感有弊的例子:某人具某人具有初级计算机专业技术水平,想找一份收有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个公司计算入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平很可能所选择公司的初级计算机专业技术水平人员的收入很

19、低,其原因是中位数对极小的数人员的收入很低,其原因是中位数对极小的数据不敏感。据不敏感。这里更好的方法是同时用平均工资这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业中位数较大的公司就业.例例1、下表是七位评委给某参赛选手的打分,总分为、下表是七位评委给某参赛选手的打分,总分为10分,分,你认为如何计算这位选手的最后得分才较为合理?你认为如何计算这位选手的最后得分才较为合理?评委 1号2号3号4号5号6号7号打分 9.69.39.39.69.99.39.4提问:提问:1、电视里评委是怎样给选手打分的?、电视里评委

20、是怎样给选手打分的?2、为什么这么做?直接取中位数和众数的值不好么?、为什么这么做?直接取中位数和众数的值不好么?三、众数、中位数、平均数的简单应用众数、中位数、平均数的简单应用特征数特征数 众数众数中位数中位数平均数平均数去掉一个最高分和去掉一个最高分和最低分后的平均分最低分后的平均分去掉两个最高分去掉两个最高分和最低分后的平和最低分后的平均分均分特征值特征值 9394949942944例例2某工厂人员及工资构成如下:某工厂人员及工资构成如下:人员人员经理经理管理人员管理人员高级技工高级技工工人工人学徒学徒合计合计周工资周工资2200 250220200100人数人数16510123合计合计

21、2200 1500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?平吗?为什么?分析分析:众数为:众数为200,中位数为,中位数为220,平均数为,平均数为300。因平均数为因平均数为300,由表格中所列出的数据可见,只有,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。均数不能客观真实地

22、反映该工厂的工资水平。课堂练习:课堂练习:1、假设你是一名交通部门的工作人员。你打算向市长报告国、假设你是一名交通部门的工作人员。你打算向市长报告国家对本市家对本市26条公路项目投资的平均资金数额,其中一条新公条公路项目投资的平均资金数额,其中一条新公路的建设投资为路的建设投资为2200万元人民币,另外万元人民币,另外25个项目的投资在个项目的投资在20万到万到100万中位数是万中位数是25万,平均数是万,平均数是100万,众数是万,众数是20万元。万元。你会选择哪一种数字特征来表示每一个项目的国家投资?你你会选择哪一种数字特征来表示每一个项目的国家投资?你选择这种数字特征的缺点是什么?选择这

23、种数字特征的缺点是什么?选择平均数更好:因为,此时的众数选择平均数更好:因为,此时的众数20万比中位数万比中位数25万还小,万还小,所以众数代表的是局部的数。中位数代表的虽然是大多数公路所以众数代表的是局部的数。中位数代表的虽然是大多数公路投资的数额,但由于其不受极端值的影响,不能代表全体,因投资的数额,但由于其不受极端值的影响,不能代表全体,因而此时成了它的缺点。选择平均数较好,能比较好的代表整体而此时成了它的缺点。选择平均数较好,能比较好的代表整体水平,但缺点是仍不能显示出具体的数字特征水平,但缺点是仍不能显示出具体的数字特征(二)情境一情境一;甲.乙两名射击队员,在进行的十次射击中成绩分

24、别是:甲:10;9;8;10;8;8;10;10;9.5;7.5乙:9;9;8,5;9;9;9.5;9.5;8.5;8.5;9.5试问二人谁发挥的水平较稳定?分析:甲的平均成绩是9环.乙的平均成绩也是9环.一一.实例引入实例引入情境二情境二:某农场种植了甲、乙两种玉米苗,从中各抽取某农场种植了甲、乙两种玉米苗,从中各抽取了了1010株,分别测得它们的株高如下:株,分别测得它们的株高如下:(单位单位cm)cm)甲:甲:31 32 35 37 33 30 32 31 30 29 乙:乙:53 16 54 13 66 16 13 11 16 62问问:哪种玉米苗长得高?哪种玉米苗长得高?哪种玉米苗长

25、得齐?哪种玉米苗长得齐?怎怎么么办办呢呢?甲甲37(最大值)(最大值)29(最小值)(最小值)8乙乙66(最大值)(最大值)11(最小值)(最小值)55极极 差差 甲甲:31 32 35 37 33 30 32 31 30 29 乙乙:53 16 54 13 66 16 13 11 16 62甲甲32372937321166乙乙极差:极差:一组数据的最大值与最小值的差一组数据的最大值与最小值的差极差越大,数据越分散,越不稳定极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差越小,数据越集中,越稳定极差体现了数据的极差体现了数据的离散程度离散程度离散程度离散程度 为了对两人射击水平的

26、稳定程度为了对两人射击水平的稳定程度,玉米生长的玉米生长的高度差异以及钢筋质量优劣做个合理的评价高度差异以及钢筋质量优劣做个合理的评价,这这里我们引入了一个新的概念里我们引入了一个新的概念,方差和标准差方差和标准差.设一组样本数据设一组样本数据 ,其平均数为,其平均数为 ,则,则称称s2为这个样本的为这个样本的方差方差,称为这个样本的称为这个样本的标准差标准差,分别称为样本方差、样本标准差,分别称为样本方差、样本标准差它的算术平方根它的算术平方根x1,x2,xn样本中各数据与样本平均数的差的平方和的样本中各数据与样本平均数的差的平方和的平均数叫做平均数叫做样本方差;样本方差;样本方差的算术平方

27、样本方差的算术平方根叫做根叫做样本标准差样本标准差。样本方差和样本标准差。样本方差和样本标准差都是衡量一个样本都是衡量一个样本波动大小波动大小的量,样本方差的量,样本方差或样本标准差越大,样本数据的波动就越大。或样本标准差越大,样本数据的波动就越大。例例1.计算数据计算数据89,93,88,91,94,90,88,87的的方差和标准差。(标准差结果精确到方差和标准差。(标准差结果精确到0.1)解:解:所以这组数据的方差为所以这组数据的方差为5.5,标准差为,标准差为2.3.见课本见课本76-77页页练习:若甲、乙两队比赛情况如下练习:若甲、乙两队比赛情况如下,下列说法哪些下列说法哪些说法是不正

28、确的:说法是不正确的:甲甲乙乙平均失球数平均失球数平均失球个数的标准差平均失球个数的标准差1.52.11.10.41、平均来说,甲的技术比乙的技术好;、平均来说,甲的技术比乙的技术好;2、乙比甲技术更稳定;、乙比甲技术更稳定;3、甲队有时表现差,有时表现好;、甲队有时表现差,有时表现好;4、乙队很少不失球。、乙队很少不失球。全对全对例例2:甲、乙两种水稻试验品种连续:甲、乙两种水稻试验品种连续5年的平均单位面积产量年的平均单位面积产量如下(单位:如下(单位:t/hm),试根据这组数据估计哪一种水稻品种),试根据这组数据估计哪一种水稻品种的产量比较稳定的产量比较稳定品种品种第一年第一年第二年第二

29、年第三年第三年第四年第四年第五年第五年甲甲989910110102乙乙941031089798解:1 1、在一次歌手大奖赛上,七位评委为歌手打出的分、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:数如下:9.49.4,8.48.4,9.49.4,9.99.9,9.69.6,9.49.4,9.79.7,去,去掉一个最高分和一个最低分后,所剩数据的平均值和掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为方差分别为_;2 2、已知数据、已知数据 的的方差为方差为2 2,则求数据,则求数据 的方差。的方差。9.5,0.016 三三.当堂反馈当堂反馈思考一下:如果数据如果数据的平均数为的平均数为 ,方差为方差为(1 1)新数据)新数据的平均数为的平均数为,方差仍为,方差仍为 (2 2)新数据)新数据的平均数为的平均数为,方差为,方差为 (3 3)新数据)新数据的平均数为的平均数为 ,方差为方差为 ,则,则方差的运算性质:方差的运算性质:

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!