222用样本的数字特征估计总体的数字特征12

上传人:痛*** 文档编号:201481097 上传时间:2023-04-19 格式:PPT 页数:24 大小:318.01KB
收藏 版权申诉 举报 下载
222用样本的数字特征估计总体的数字特征12_第1页
第1页 / 共24页
222用样本的数字特征估计总体的数字特征12_第2页
第2页 / 共24页
222用样本的数字特征估计总体的数字特征12_第3页
第3页 / 共24页
资源描述:

《222用样本的数字特征估计总体的数字特征12》由会员分享,可在线阅读,更多相关《222用样本的数字特征估计总体的数字特征12(24页珍藏版)》请在装配图网上搜索。

1、1.众数、中位数、平均数2.2.2 用样本的数字特征估计总用样本的数字特征估计总体的数字特征体的数字特征广州一中广州一中 数学高二备课组数学高二备课组2008年年9月月19日日一一 众数、中位数、平均数的概念众数、中位数、平均数的概念 中位数中位数:将一组数据按大小依次排列,:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位两个数据的平均数)叫做这组数据的中位数数 众数众数:在一组数据中,出现次数最多:在一组数据中,出现次数最多的数据叫做这组数据的众数的数据叫做这组数据的众数 众数、中位数、平均数都是描述一组

2、众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛度不同,其中以平均数的应用最为广泛.平均数:一组数据的算术平均数,即 x=练习练习:在一次中学生田径运动会上,在一次中学生田径运动会上,参加男子跳高的参加男子跳高的17名运动员的成绩如下名运动员的成绩如下表所示:表所示:成成绩绩(单单位:位:米米)150160165170175180185190人数人数23234111分别求这些运动员成绩的众数,中位数与分别求这些运动员成绩的众数,中位数与平均数平均数 平均数平均数:一组数据的算术平均数一组数据的算术平均数,

3、即即 x=解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现的次,出现的次数最多,即这组数据的众数是次数最多,即这组数据的众数是1.75上面表里的上面表里的17个数据可看成是按从小到大的个数据可看成是按从小到大的顺序排列的,其中第顺序排列的,其中第9个数据个数据1.70是最中间的一是最中间的一个数据,即这组数据的中位数是个数据,即这组数据的中位数是1.70;这组数据的平均数是这组数据的平均数是答:答:17名运动员成绩的众数、中位数、平均数名运动员成绩的众数、中位数、平均数依次是依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)(米).二二、众数、中位数、平均数

4、众数、中位数、平均数与频率分布直方图的关系与频率分布直方图的关系 1、众数在样本数据的频率分布直方图众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。中,就是最高矩形的中点的横坐标。频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量月平均用水量(t)例如,在上一节调查的例如,在上一节调查的100位居民位居民的月均用水量的问题中,如图所示:的月均用水量的问题中,如图所示:从这些样本数据的频从这些样本数据的频率分布直方图可以看率分布直方图可以看出,月均用水量的众出,月均用水量的众数是数是2.25t.2、在样本中,有在样

5、本中,有50的个体小于或等于的个体小于或等于中位数,也有中位数,也有50的个体大于或等于中位的个体大于或等于中位数数,因此,在频率分布直方图中,中位数左,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可边和右边的直方图的面积应该相等,由此可以估计中位数的值。以估计中位数的值。频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量月平均用水量(t)下图中用虚线代表居民下图中用虚线代表居民月均用水量的中位数近似值,月均用水量的中位数近似值,此数据值为此数据值为2.02t.0.040.080.150.220.25

6、0.140.060.020.04说明说明:2.02这个中位数的估计值这个中位数的估计值,与样本与样本的中位数值的中位数值2.0不一样不一样,这是因为样本数这是因为样本数据的频率分布直方图据的频率分布直方图,只是直观地表明只是直观地表明分布的形状分布的形状,但是从直方图本身得不出但是从直方图本身得不出原始的数据内容原始的数据内容,所以由频率分布直方所以由频率分布直方图得到的中位数近似值往往与样本的图得到的中位数近似值往往与样本的实际中位数值不一致实际中位数值不一致.3、平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”.是直方图的平衡点是直方图的平衡点.等于频率分布图中每个小矩形的面积

7、乘以等于频率分布图中每个小矩形的面积乘以小矩形底边中点的横坐标之和小矩形底边中点的横坐标之和频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量月平均用水量(t)下图中用虚线代表居民下图中用虚线代表居民月均用水量的平均数的估计值,月均用水量的平均数的估计值,此数据值为此数据值为2.02t.平均数等于频率分布图中每个小矩形的面平均数等于频率分布图中每个小矩形的面积乘以小矩形底边中点的横坐标之和积乘以小矩形底边中点的横坐标之和0.040.080.150.220.250.140.060.020.04三三 三种数字特征的优缺点三种数字特

8、征的优缺点 1、众数体现了样本数据的最大集中、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无点,但它对其它数据信息的忽视使得无法客观地反映总体特征法客观地反映总体特征.如上例中众数是如上例中众数是2.25t,它告诉我们它告诉我们,月均用水量为月均用水量为2.25t的的居民数比月均用水量为其它数值的居民居民数比月均用水量为其它数值的居民数多数多,但它并没有告诉我们多多少但它并没有告诉我们多多少.2、中位数是样本数据所占频率、中位数是样本数据所占频率的等分线,它不受少数几个极端值的的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它影响,这在某些情况下是优点,但它对极端

9、值的不敏感有时也会成为缺点。对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量如上例中假设有某一用户月均用水量为为10t,那么它所占频率为,那么它所占频率为0.01,几乎几乎不影响中位数不影响中位数,但显然这一极端值是不但显然这一极端值是不能忽视的。能忽视的。3、由于平均数与每一个样本的、由于平均数与每一个样本的数据有关,所以任何一个样本数据的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因数、中位数都不具有的性质。也正因如此如此,与众数、中位数比较起来,平,与众数、中位数比较起来,平均数可以反映出

10、更多的关于样本数据均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时端值的影响较大,使平均数在估计时可靠性降低。可靠性降低。四四 众数、中位数、平均数的众数、中位数、平均数的简单应用简单应用例例 某工厂人员及工资构成如下:某工厂人员及工资构成如下:人员人员经理经理 管理人员管理人员 高级技工高级技工 工人工人学徒学徒 合计合计周工资周工资2200 250220200100人数人数16510123合计合计2200 150011002000 1006900(1)指出这个问题中周工资的众数、中)指出这个问题中周工资的众数、

11、中位数、平均数位数、平均数(2)这个问题中,工资的平均数能客观)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?地反映该厂的工资水平吗?为什么?分析分析:众数为:众数为200,中位数为,中位数为220,平均数为,平均数为300。因平均数为因平均数为300,由表格中所列出,由表格中所列出的数据可见,只有经理在平均数以上,的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资数不能客观真实地反映该工厂的工资水平。水平。平均数向我们提供了样本数据的重要信息,但是平均有时也会使我们作出对总体的片面判断因为这个平均

12、数掩盖了一些极端的情况,而这些极端情况显然是不能忽略的因此,只有平均数这个特征还难以概括样本数据的实际状态如:有两位射击运动员在一次射击测试中如:有两位射击运动员在一次射击测试中各射靶各射靶1010次,每次命中的环数如下:次,每次命中的环数如下:甲:甲:乙:乙:如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩如果看两人本次射击的平均成绩,由于由于 两人射击两人射击 的平均成绩是一样的的平均成绩是一样的.那么两个人的水平就没那么两个人的水平就没有什么差异吗有什么差异吗?45678910环数环数频率频率0.10.20.3(甲甲)456

13、789 100.10.20.30.4环数环数频率频率(乙乙)甲的成绩甲的成绩分布比较分布比较分散分散乙的成绩乙的成绩分布比较分布比较集中集中因此因此,我们还需要从另外的角度来考察这两组数据我们还需要从另外的角度来考察这两组数据.例例如如:在作统计图在作统计图,表时提到过的极差表时提到过的极差.甲的环数极差甲的环数极差=10-4=6 乙的环数极差乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度它们在一定程度上表明了样本数据的分散程度,与与平均数一起平均数一起,可以给我们许多关于样本数据的信息可以给我们许多关于样本数据的信息.显显然然,极差对极端值非常敏感极差对极端值非常敏感,注

14、意到这一点注意到这一点,我们可以得到一种我们可以得到一种“去掉一个最高分去掉一个最高分,去掉一个最低分去掉一个最低分”的统计策略的统计策略.考察样本数据的分散程度的大小,最常用的考察样本数据的分散程度的大小,最常用的统计量是标准差统计量是标准差标准差是样本平均数的一种平均距离,一般标准差是样本平均数的一种平均距离,一般用用s表示表示所谓所谓“平均距离平均距离”,其含义可作如下理解:,其含义可作如下理解:由于上式含有绝对值,运算不太方便,因此,由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差通常改用如下公式来计算标准差显然显然,标准差(方差)越大标准差(方差)越大,则数据的离

15、散程度越大则数据的离散程度越大;标标准差(方差)越小准差(方差)越小,数据的离散程度越小数据的离散程度越小.a考虑一个容量为考虑一个容量为2的样本的样本:一个样本中的个体与平均数之间的距离关系可用一个样本中的个体与平均数之间的距离关系可用下图表示下图表示:可算出甲可算出甲,乙两人的的成绩的标准差乙两人的的成绩的标准差由由 可以知道可以知道,甲的成绩离散程度大甲的成绩离散程度大,乙的成乙的成绩离散程度小绩离散程度小.由此可以估计由此可以估计,乙比甲的射击成绩稳定乙比甲的射击成绩稳定.上面两组数据的离散程度与标准差之间的关系可用图上面两组数据的离散程度与标准差之间的关系可用图直观地表示出来直观地表示出来.456789102.极差、标准差、方差小结小结 用样本的数字特征估计总体的用样本的数字特征估计总体的数字特征数字特征1.众数、中位数、平均数

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!