第三讲平均数标准差和变异系数

上传人:沈*** 文档编号:171478127 上传时间:2022-11-27 格式:PPT 页数:41 大小:209.50KB
收藏 版权申诉 举报 下载
第三讲平均数标准差和变异系数_第1页
第1页 / 共41页
第三讲平均数标准差和变异系数_第2页
第2页 / 共41页
第三讲平均数标准差和变异系数_第3页
第3页 / 共41页
资源描述:

《第三讲平均数标准差和变异系数》由会员分享,可在线阅读,更多相关《第三讲平均数标准差和变异系数(41页珍藏版)》请在装配图网上搜索。

1、上章内容回顾上章内容回顾n试验资料的整理:检查和核对;制作次数分布表和分布图(柱形图、折线图、条形图,饼图)n试验资料搜集常用的方法:调查和试验n试验资料均具有集中性和离散性两种基本特征,平均数是反映集中性的特征数,变异数是反映离散型的特征数第三章第三章 平均数、标准平均数、标准差和变异系数差和变异系数平均数(mean)用于反映资料的集中性,即观测值以某一数值为中心而分布的性质。标准差(standard deviation)与变异系数(variation coefficient)反映资料的离散性,即观测值分散变异的性质。第一节第一节 平均数平均数一、平均数的意义和种类二、算术平均数的计算方法三

2、、算术平均数的重要特性四、算术平均数的作用五、总体平均数一、平均数的意义和种类一、平均数的意义和种类 平均数(average)是数据的代表值,表示资料中观察值的中心位置,并且可作为资料的代表而与另一组资料相比较,借以明确二者之间相差的情况。平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置。平均数主要包括有:x0 1 2 3 4 5 6 7 8 9 10平均数平均数=5平均数平均数=6 1 2 3 4 5 6 7 141、算术平均数、算术平均数2、中位数、中位数 中位数中位数:将资料内所有观察值从大到小排序,居中间位置的观察将资料内所有观察值从大到小排序,居中间位置的

3、观察值称为中数值称为中数(median),计作,计作Md。当观测值的个数是偶数时,则以中间。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时,两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的代表性优于算术平均数。中位数的计算方法因资料是否分组而有所不同。对于未分组资料,中位数的计算方法因资料是否分组而有所不同。对于未分组资料,先将各观测值由小到大依次排列,找到中间的先将各观测值由小到大依次排列,找到中间的1个数(个数(n为奇数)或为奇数)或2个个数(数(n为偶数),之后求平均即可。为偶数),之后求平

4、均即可。0 1 2 3 4 5 6 7 8 9 10 12 14 0 1 2 3 4 5 6 7 8 9 10中位数中位数=5中位数中位数=5众数众数:资料中最常见的一数,或次数最多一组的中点值,称资料中最常见的一数,或次数最多一组的中点值,称为众数为众数(mode),记为,记为M0。如棉花纤维检验时所用的主体长度即。如棉花纤维检验时所用的主体长度即为众数。为众数。3、众数、众数众数可能不存在众数可能不存在可能有多个众数可能有多个众数多用于属性数据多用于属性数据0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 众数众数=9没有众数没有众数其计算公式如下:其计算公式如下:nn

5、nnxxxxxxxxG1)(3213214、几何平均数、几何平均数 为了计算方便,可将各观测值取对数后相加为了计算方便,可将各观测值取对数后相加除以除以n,得,得lgG,再求,再求lgG的反对数,即得的反对数,即得G值,值,即:即:)lglg(lg1lg211nxxxnG 调和平均数调和平均数:(harmonic mean)各观测)各观测值倒数的值倒数的 算术平均数算术平均数 的倒数,称为调和平均的倒数,称为调和平均数,记为数,记为H。即。即 (4.6)xnxxxnnH1111111)(1215、调和平均数、调和平均数对于同一资料:对于同一资料:算术平均数算术平均数几何平均数几何平均数调和平均

6、数调和平均数 上述五种平均数,最常用的是算术平均数。上述五种平均数,最常用的是算术平均数。算术平均数可根据样本大小及分组情况而算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。采用直接法或加权法计算。(一一)直接法直接法主要用于未经分组资料平均数的计算。主要用于未经分组资料平均数的计算。二、算术平均数的计算方法二、算术平均数的计算方法 设某一资料包含设某一资料包含n个观测值:个观测值:x1、x2、xn,则样本平均数可通过下式计算:则样本平均数可通过下式计算:nxnxxxxniin121nxx(4.1)简写:简写:【例【例1】某植保站测得某植保站测得10只某类害虫的体重分别为只某类害虫

7、的体重分别为500、520、535、560、585、600、480、510、505、490(mg),求其平均数。),求其平均数。.5(mg)528105285nxx由于由于 x=500+520+535+560+585 +600+480+510+505+490 =5285,n=10得:得:即即 10只害虫的平均体重为只害虫的平均体重为528.5 mg。(二)加权法(二)加权法ffxfxffffxfxfxfxkiikiiikkk11212211(4.2)式中式中:xi-第第i 组的组中值组的组中值;fi-第第i组的次数组的次数;k-分组数分组数 第第i组的次数组的次数 fi 是权衡第是权衡第i组组

8、中值组组中值 xi 在资料中所占在资料中所占比重大小的数量,因此将比重大小的数量,因此将 fi 称为是称为是 xi 的的“权权”,加权,加权法也由此而得名。法也由此而得名。对于样本含量对于样本含量 n30 以上且已分组的资料,可以以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数,计算在次数分布表的基础上采用加权法计算平均数,计算公式为:公式为:【例【例2】从从A、B两小区分别抽取两小区分别抽取4个和个和5个小麦麦穗,个小麦麦穗,测得其样本如下,用两种方法计算其平均值,并比较计测得其样本如下,用两种方法计算其平均值,并比较计算结果。算结果。小区 每穗小穗数 平均数(x)xf A

9、13 14 15 17 14.75 59 B 16 16 17 18 18 17.00 85 144 144 144/9=16 144/9=16【例【例3】140行水稻产量(行水稻产量(P38),用两种方法求其),用两种方法求其平均数,并比较计算结果。平均数,并比较计算结果。(1)直接法:)直接法:)(48.15714022047140159.215177gnxx分 组 数 列 组 中 值(x)次 数(f)fx 6 7.5 8 2.5 7 5 2 1 5 0 8 2.5 9 7.5 9 0 7 6 3 0 9 7.5 11 2.5 1 0 5 7 7 3 5 11 2.5 1 2 7.5 1

10、2 0 1 4 1 6 8 0 1 2 7.5 1 4 2.5 1 3 5 1 7 2 2 9 5 1 4 2.5 1 5 7.5 1 5 0 2 0 3 0 0 0 1 5 7.5 1 7 2.5 1 6 5 2 4 3 9 6 0 1 7 2.5 1 8 7.5 1 8 0 2 1 3 7 8 0 1 8 7.5 2 0 2.5 1 9 5 1 3 2 5 3 5 2 0 2.5 2 1 7.5 2 1 0 9 1 8 9 0 2 1 7.5 2 3 2.5 2 2 5 3 6 7 5 2 3 2.5 2 4 7.5 2 4 0 2 4 8 0 2 4 7.5 2 6 2.5 2 5 5

11、1 2 5 5 1 4 0 2 2 0 6 5 2 2 0 6 5 /1 4 0 =1 5 7.6 1 1、算术平均数的计算与每一个数(值)都有、算术平均数的计算与每一个数(值)都有关。关。2、如果、如果 是是n1个值的平均数个值的平均数,是是n2个值个值的平均数,那么全部的平均数,那么全部n1n2个值的算术平均数是个值的算术平均数是 (加权平均数)(加权平均数)1x2x212211nnxnxnx三、算术平均数的重要特性三、算术平均数的重要特性3、样本各观测值与平均数之差的和为零,样本各观测值与平均数之差的和为零,即离均差之和等于零。即离均差之和等于零。或简写成或简写成0)(1xxnii0)(

12、xx4、样本各观测值与平均数之差的平方和为最小,、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。即离均差平方和为最小。2121)()(niiniixxx(常数(常数 )x22)()(xxx或简写为:或简写为:5、若、若A为任意常数,为任意常数,甲村 乙村 面积 单产 面积 单产 山地 100 100 900 160 丘陵 500 400 600 500 平地 400 500 500 600 6、平均数是有单位的数值,与原资料单位相同。、平均数是有单位的数值,与原资料单位相同。注意:注意:必须性状同质时,必须性状同质时,才有代表性才有代表性。x S AY SAY S AY SAY

13、 山地 100 100 10000 900 160 144000 丘陵 500 400 200000 600 500 300000 平地 400 500 200000 500 600 300000 1000 410000 2000 744000 x 410000/1000=410 744000/2000=372 平均数是描述观测资料的重要特征数,平均数是描述观测资料的重要特征数,它的作用主要有以下两点:它的作用主要有以下两点:1.指出数据资料的中心位置,标志着资料所指出数据资料的中心位置,标志着资料所代表性状的数量水平和质量水平。代表性状的数量水平和质量水平。2.可以作为样本或资料的代表数据与

14、其他资可以作为样本或资料的代表数据与其他资料进行比较。料进行比较。四、算术平均数的作用四、算术平均数的作用对于总体而言,通常用对于总体而言,通常用表示总体平均数,有限总体的平均表示总体平均数,有限总体的平均数为:数为:(4.3)式中,N 表示总体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时,则称此当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。统计量为该总体参数的无偏估计量。统计学中常用样本平均数(统计学中常用样本平均数()作为总体平均数()作为总体平均数()的估)的估计量,并已证明样本平均数是总体平均数计量,并已证明样本平均数是总体平均数的

15、无偏估计量。的无偏估计量。NxNii1x五、总体平均数五、总体平均数第二节第二节 变异数变异数 平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。每个样本有一批观察值,除以平均数作为样本的集中性表现外,还应该考虑样本内各个观察值的变异情况,才能通过样本的观察数据更好地描述样本,乃至描述样本所代表的总体,为此必须有度量变异的统计数。常用的描述变异程度指标有:n1、极差(range)n2、方差(variance)n3、标准差(standard deviation)n4、变异系数(variation coefficient)一、极差一、极差n极差(range),又称全距,记作,

16、是资料中最大观察值与最小观察值的差数。n极差虽可以对资料的变异有所说明,但它只是两个极端数据决定的,没有充分利用资料的全部信息,而且易于受到资料中不正常的极端值的影响。所以用它来代表整个样本的变异度是有缺陷的。二、方差二、方差n为了正确反映资料的变异度,较合理的方法是根据样本全部观察值来度量资料的变异度。这时要选定一个数值作为共同比较的标准。平均数既作为样本的代表值,则以平均数作为比较的标准较为合理,但同时应该考虑各样本观察值偏离平均数的情况,为此这里给出一个各观察值偏离平均数的度量方法。为为 了了 准准 确确 地地 表示样本内各个观测值的变异程度表示样本内各个观测值的变异程度,人们人们 首首

17、 先会考虑到以平均数为标准,求出各个观测先会考虑到以平均数为标准,求出各个观测值与平均数的离差,值与平均数的离差,(),称为离均差。,称为离均差。虽然离均差能表示一个观测值偏离平均数的性质虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负和程度,但因为离均差有正、有负,离均差之和,离均差之和 为为零,即零,即()=0,因,因 而而 不不 能能 用离均差之和用离均差之和()来来 表表 示示 资料中所有观测值的总偏离程度。资料中所有观测值的总偏离程度。xx xx xx 为了解决离均差有正为了解决离均差有正、有负,离均差之和为零的、有负,离均差之和为零的问问 题,可先求题,可先

18、求 离离 均均 差的绝差的绝 对对 值值 并并 将将 各各 离离 均均 差差 绝绝对对 值值 之之 和和 除以除以 观观 测测 值值 个个 数数n 求求 得得 平平 均均 绝绝 对对 离差,离差,即即|x x|/n。虽然平均绝对离差可以表示资料中各观。虽然平均绝对离差可以表示资料中各观测值的变异程度测值的变异程度,但由于平均绝对离差包含绝对值符,但由于平均绝对离差包含绝对值符号号,使用很不方便,在统计学中未被采用。,使用很不方便,在统计学中未被采用。我们还可以采用将离均差平方的办法来解决我们还可以采用将离均差平方的办法来解决离均差有正、有负,且离均差之和为零的问题。离均差有正、有负,且离均差之

19、和为零的问题。先将各先将各 个离个离 均差平方,即均差平方,即()2,再求,再求 离均差平方和离均差平方和,即即 ,简称平方和,记,简称平方和,记为为SS;由由 于于 离差平方和离差平方和 常常 随随 样样 本本 大大 小小 而而 改改 变变,为,为 了了 消消 除除 样样 本大小本大小 的的 影影 响响,用平用平方和方和 除除 以以 样样 本本 大大 小,小,即即 ,求出离,求出离均差平方和的平均数均差平方和的平均数;xx2)(xxnxx/)(2 为了使所得的统计量是相应总体参数的无为了使所得的统计量是相应总体参数的无 偏偏估计量,统计学证明,在求离均差平方和的平均估计量,统计学证明,在求离

20、均差平方和的平均数时,分母不用样本含量数时,分母不用样本含量n,而用自由度,而用自由度 n-1,于是,我们于是,我们 采采 用统计量用统计量 表示资料的表示资料的变异程度。变异程度。统计量统计量 称为均方(称为均方(mean square,缩写为缩写为MS),又称又称样本方差样本方差,记为,记为S2,即,即 S2=(4.7))1/()(2nxx)1/()(2nxx)1/()(2nxx 相应的总体参数叫相应的总体参数叫 总体方差总体方差,记,记为为2。对于有限总体而言,。对于有限总体而言,2的计算的计算公式为:公式为:(4.8)Nx/)(22n标准差为方差的正平方根值,用以表示资料的变异度,其单

21、位与观察值的度量单位相同。从样本资料计算标准差的公式为:同样,样本标准差是总体标准差的估计值。总体标准差用表示:1)(2nyys Ny2)(由于由于 样本方差样本方差 带有原观测单位的带有原观测单位的 平方单位,在仅表示一平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常需要与个资料中各观测值的变异程度而不作其它分析时,常需要与平均数配合使用,这平均数配合使用,这 时应时应 将平方单位还原,即应求出样本方将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差差的平方根。统计学上把样本方差 S2 的平方根叫做样本标准的平方根叫做样本标准差,记为差,记为S,即:,即:1)(2

22、nxxS三、标准差三、标准差由于由于)2()(222xxxxxx222xnxxx222)()(2nxnnxxnxx22)(12)(2nxSnx所以(所以(4.9)式可改写为:)式可改写为:(4.10)相应的总体参数叫总体标准差,记为相应的总体参数叫总体标准差,记为。对。对于有限总体而言,于有限总体而言,的计算公式为:的计算公式为:(4.11)在统计学中,常用样本标准差在统计学中,常用样本标准差S估计总体标估计总体标准差准差。Nx/)(2四、变异系数四、变异系数 标准差和观察值的单位相同,表示一个样本的变异度。若比较两个样本的变异度,则因单位不同或均数不同,不能用标准差进行直接比较。这时可计算样

23、本的标准差对均数的百分数,称为变异系数(coefficient of variation)。%100 xSCV【例【例7】已知某甲品种猪平均体重为已知某甲品种猪平均体重为 190kg,标准差为标准差为10.5kg,而乙品种猪平均体重为,而乙品种猪平均体重为196kg,标准差为标准差为8.5kg,试问两个品种的猪,那一个体,试问两个品种的猪,那一个体重变异程度大。重变异程度大。由于,甲品种猪体重的变异系数:由于,甲品种猪体重的变异系数:乙品种猪体重的变异系数:乙品种猪体重的变异系数:所以,甲品种猪体重的变异程度大于乙品所以,甲品种猪体重的变异程度大于乙品种种猪猪。%53.5%1001905.10VC%34.4%1001965.8VC注意:变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。课后作业,教材23页:习题2.2;习题2.3;习题2.4;习题2.9

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!