第二章试验资料的整理与特征数的计

上传人:沈*** 文档编号:168235113 上传时间:2022-11-08 格式:PPT 页数:69 大小:1.18MB
收藏 版权申诉 举报 下载
第二章试验资料的整理与特征数的计_第1页
第1页 / 共69页
第二章试验资料的整理与特征数的计_第2页
第2页 / 共69页
第二章试验资料的整理与特征数的计_第3页
第3页 / 共69页
资源描述:

《第二章试验资料的整理与特征数的计》由会员分享,可在线阅读,更多相关《第二章试验资料的整理与特征数的计(69页珍藏版)》请在装配图网上搜索。

1、试验资料的整理特征数的计算与第二章目的要求:熟悉不同类型资料的整理和相关统计图表的制法。掌握常用几种平均数和变异数的基本概念及计算方法。第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理对试验资料进行分类是统计归纳的基础。对试验资料进行分类是统计归纳的基础。试试验验资资料料类类型型数量性状资料数量性状资料质量性状资料属性性状资料质量性状资料属性性状资料计数资料非连续变量资料计数资料非连续变量资料计量资料连续变量资料计量资料连续变量资料第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理调 查试 验资料搜集的方法资料搜集的方法一、调查

2、一、调查 调查调查是对已经存在的事情的资料按某种方案进行收集的方法。资料的调查又可以分为两种:普查和抽样调查。1、普查普查 是对研究对象的全部个体逐一进行调查的方法。普查一般要求在一定的时间或范围进行,要求准确和全面。2、抽样调查、抽样调查 二、试验二、试验 试验试验是对已有的或没有的事物加以处理的方法。常见的试验设计方法有:对比设计、随机区组设计、平衡不完全区组设计、裂区设计、拉丁方设计、正交设计、正交旋转设计等等。试验设计须遵循的三大原则是:随机、重复和局随机、重复和局部控制部控制。第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理三、试验资料的整理(一)原

3、始资料的检查与核对(一)原始资料的检查与核对调查试验原始数据核对检查订正三、试验资料的整理(二)次数分布(二)次数分布三、试验资料的整理计量资料的整理计量资料一般采用组距式分组法。全距组数组距组限归组制表1 次数分布表 组限 组中值 次数 频率 累积频率 Frequency Percent Cumulative Percent 35 37.5 3 0.0200 0.0200 40 42.5 4 0.0267 0.0467 45 47.5 17 0.1133 0.1600 50 52.5 28 0.1867 0.3467 55 57.5 40 0.2666 0.6133 60 62.5 25 0

4、.1667 0.7800 65 67.5 17 0.1133 0.8973 70 72.5 6 0.0400 0.9333 75 77.5 7 0.0467 0.9800 80 82.5 2 0.0133 0.9933 85 87.5 1 0.0067 1.0000表2-6 150尾鲢鱼体长的次数分布表表2-4150尾鲢鱼体长(cm)56 49 62 78 41 47 65 45 58 55 59 65 69 62 7352 52 60 51 62 78 66 45 58 58 60 57 52 51 4856 46 58 70 72 76 77 56 66 58 58 55 53 50 65

5、63 57 65 85 59 58 54 62 48 63 46 61 62 57 3858 52 54 55 66 52 48 56 75 72 57 37 46 76 5663 75 65 48 52 55 54 62 71 48 62 58 46 57 3854 53 65 42 83 66 48 53 58 46 46 26 36 76 5560 54 58 49 52 56 82 63 65 54 75 65 86 46 7770 69 40 56 58 61 54 53 52 43 52 64 58 58 5478 52 56 61 59 54 59 64 68 51 59 68

6、63 52 63(1)求全距,又称极差(range):R=Xmax-Xmin =85-37 =48(cm)(2)确定组数和组距(class boundary)组数是根据样本观测数的多少及组距的大小来确定的,同时考虑到对资料要求的精确度以及进一步计算是否方便。组数组距多小统计数精确,计算不方便少大统计数不精确,计算方便组数的确定组距的确定即每组内的上下限范围。一般取整数。组距全距/组数48104.8(3)确定组限(class limit)和组中值(class midvalue)是指每个组变量值的起止界限。上限下限是两个组限的中间值。它可作为各组的代表值,最好取整数或与观察值位数一致。组中值下限上

7、限 2组距2下限组距2上限表2-4150尾鲢鱼体长(cm)56 49 62 78 41 47 65 45 58 55 59 65 69 62 7352 52 60 51 62 78 66 45 58 58 60 57 52 51 4856 46 58 70 72 76 77 56 66 58 58 55 53 50 6563 57 65 85 59 58 54 62 48 63 46 61 62 57 3858 52 54 55 66 52 48 56 75 72 57 37 46 76 5663 75 65 48 52 55 54 62 71 48 62 58 46 57 3854 53 6

8、5 42 83 66 48 53 58 46 46 26 36 76 5560 54 58 49 52 56 82 63 65 54 75 65 86 46 7770 69 40 56 58 61 54 53 52 43 52 64 58 58 5478 52 56 61 59 54 59 64 68 51 59 68 63 52 63(4)分组分组确定好组数和各组上下限后,可按原始资料中各观确定好组数和各组上下限后,可按原始资料中各观测值的次序,将各个数值归于各组,计算各组的观测值的次序,将各个数值归于各组,计算各组的观测数次数、频率、累积频率,制成一个次数分布表。测数次数、频率、累积频率,

9、制成一个次数分布表。计数的方法计数的方法卡片法卡片法唱票法唱票法画画“正正”字字画画“”组限 组中值 次数 频率 累积频率 Frequency Percent Cumulative Percent 35 37.5 3 0.0200 0.0200 40 42.5 4 0.0267 0.0467 45 47.5 17 0.1133 0.1600 50 52.5 28 0.1867 0.3467 55 57.5 40 0.2666 0.6133 60 62.5 25 0.1667 0.7800 65 67.5 17 0.1133 0.8973 70 72.5 6 0.0400 0.9333 75 7

10、7.5 7 0.0467 0.9800 80 82.5 2 0.0133 0.9933 85 87.5 1 0.0067 1.0000表2-6 150尾鲢鱼体长的次数分布表三、试验资料的整理计数资料的整理计数资料基本上采用单项式分组法进行整理。特点:用样本变量自然值进行分组,每组用一个或几个变量值来表示。15 17 12 14 13 14 12 11 14 13 16 14 14 13 17 15 14 14 16 1414 15 15 14 14 14 11 13 12 1413 14 13 15 14 13 15 14 13 1415 16 16 14 13 14 15 13 15 131

11、5 15 15 14 14 16 14 15 17 1316 14 16 15 13 14 14 14 14 1612 13 12 14 12 15 16 15 16 1413 15 17 14 13 14 12 17 14 15表2-1 100只来亨鸡每月的产蛋数1117来亨鸡每月产蛋数变动范围:分为7组统计各组次数计算频率和累积频率制表每月产蛋数 次数 频率 累积频率 Frequency Percent Cumulative Percent 11 2 0.02 0.02 12 7 0.07 0.09 13 19 0.19 0.28 14 35 0.35 0.63 15 21 0.21 0.

12、84 16 11 0.11 0.95 17 5 0.05 1.00表2-2 100只来亨鸡每月产蛋数次数分布表1 自然值进行分组,最大值17,最小值11。2 数据主要集中在14,向两侧分布逐渐减少。表2-3 小麦品种300个麦穗穗粒数的次数分布表每穗粒数 次数 频率 累积频率 Frequency Percent Cumulative Percent 18-22 3 0.0100 0.0100 23-27 18 0.0600 0.0700 28-32 38 0.1267 0.1967 33-37 51 0.1700 0.3667 38-42 68 0.2267 0.5934 43-47 53 0

13、.1766 0.7700 48-52 41 0.1367 0.9067 53-57 22 0.0733 0.9800 58-62 6 0.0200 1.0000 三、试验资料的整理2 次数分布图和频率分布图次数分布图和频率分布图 作次数(频率)分布时,资料分组方法同次数分布表,将分组作横坐标,次数(频率)作纵坐标,将各组及其次数(频率)用柱形、线段、点等形状表示在坐标系中,即绘成资料分布图。特点:直观、形象包括:条形图、直方图、多边形图、饼图和散点图0 05 510101515202025253030353540401111121213131414151516161717图2.1 月产蛋数次数

14、分布柱形图0 00.050.050.10.10.150.150.20.20.250.250.30.30.350.350.40.41111121213131414151516161717图2.2 月产蛋数频率分布柱形图1条形图(条形图(bar chart),又称柱形图又称柱形图 1111121213131414151516161717图1 来亨鸡月产蛋次数分布图图2.3 鲢鱼体长次数分布图35 40 45 50 55 60 65 70 75 80 85 90 0 05 51010151520202525303035354040454537.537.542.542.547.547.552.552.

15、557.557.562.562.567.567.572.572.577.577.582.582.587.587.5图2.3 鲢鱼体长次数分布图 1 2 3 4 5 64321 1 2 3 4 5 64321 1 2 3 4 5 64321a.正向直线关系b.负向直线关系c.曲线关系:表号 标题(1)标题简明扼要,列于图的下方;(2)纵、横两轴应有刻度,注明单位;(3)横轴由左至右,纵轴由下而上,数值由小到大;图 形长宽比例约5:4或6:5;(4)图中需用不同颜色或线条代表不同事物时,应有图 例说明。试验资料的整理特征数的计算与第二章第二节 试验资料特征数的计算是变量在趋势上有着向某一中心聚集,

16、或者说是变量在趋势上有着向某一中心聚集,或者说 以某一数值为中心而分布的性质。以某一数值为中心而分布的性质。是变量有着离中分散变异的性质。是变量有着离中分散变异的性质。变量的分布具有两种明显的基本特征:变量的分布具有两种明显的基本特征:。用某些数值更简单、明了地表示资料的特征,这些用某些数值更简单、明了地表示资料的特征,这些数值称为特征数。数值称为特征数。反应资料反应资料集中性集中性的特征数是的特征数是平均数平均数;反应资料反应资料离散性离散性的特征数是的特征数是变异数变异数。一、平均数一、平均数 平均数平均数 平均数是统计学中最常用的统计量,是计量资料的代表值,表示资料中观测数的中心位置,并

17、且可作为资料的代表与另一组相比较,以确定二者的差异情况。一、平均数(一)平均数的种类(一)平均数的种类一、平均数1.算术平均数算术平均数 (arithmetic mean)(1)定义:总体或样本资料中所有观测数的总和除以观定义:总体或样本资料中所有观测数的总和除以观测数的个数所得的商,简称平均数、均数或均值。测数的个数所得的商,简称平均数、均数或均值。总体:总体:x1+x2+x3+xNNN1Niix1样本:样本:x1+x2+x3+xnnn1niix1x适用范围:主要用于对称或者近拟对称的数据资料。适用范围:主要用于对称或者近拟对称的数据资料。一、平均数(2)算术平均数的计算方法)算术平均数的计

18、算方法例:随机抽取20株小麦测量它们的株高(cm)分别为:82 79 85 84 86 84 83 82 83 8384 81 80 81 82 81 82 82 82 80 求小麦的平均株高。xn20(82+79+80)82.3(cm)ix例:设a为80(cm)则有:82 79 85 84 86 84 83 82 83 83 2 1 5 4 6 4 3 2 3 384 81 80 81 82 81 82 82 82 80 4 1 0 1 2 1 2 2 2 0 x20(21+5+0)82.3(cm)+80 x例:例:x20182.3(cm)(79 1+802+86 1)ffxfxffffxf

19、xfxfxkiikiiikkk11212211ixifk 若为若为,则用每组组中值乘以该组次数之和再除,则用每组组中值乘以该组次数之和再除以总次数来计算:以总次数来计算:(x-x)=0(x-x)2 (x-a)2(3)算术平均数的重要性质)算术平均数的重要性质一、平均数2.中位数中位数(median)资料中所有观测数依大小顺序排列,居于中间位置资料中所有观测数依大小顺序排列,居于中间位置的观测数称为中位数或中数(的观测数称为中位数或中数(Md)。)。如数据:3,5,4,6,2,8,9,如数据:2,2,4,5,3,5,8,4,中位数为中位数为5。中数为(中数为(4+4)/24。适用范围:主要用于呈

20、偏态分布的数据资料。适用范围:主要用于呈偏态分布的数据资料。一、平均数3.众数众数(mode)资料中出现次数最多的那个观测值或次数最多一组的资料中出现次数最多的那个观测值或次数最多一组的组中值或中点值。组中值或中点值。M0注意:注意:(1)对于某些数据而言,如均匀分布,并不存在众数;)对于某些数据而言,如均匀分布,并不存在众数;(2)对于某些数据存在两个或两个以下的众数;)对于某些数据存在两个或两个以下的众数;(3)主要用来描述频率分布。)主要用来描述频率分布。一、平均数4.几何平均数几何平均数(geometric mean)资料中有资料中有n个观测数,其乘积开个观测数,其乘积开n次方所得数值

21、。次方所得数值。G适用范围:几何均数适用于变量适用范围:几何均数适用于变量x为对数正态分布为对数正态分布,经对数转换后呈正态分布的资料。经对数转换后呈正态分布的资料。G=nnxxxx*.*321一、平均数5.调和平均数调和平均数(harmonic mean)资料中各观测值倒数的算术平均数的倒数。资料中各观测值倒数的算术平均数的倒数。H适用范围:主要用于反映生物不同阶段的平均增长适用范围:主要用于反映生物不同阶段的平均增长 率或不同规模的平均规模。率或不同规模的平均规模。xn11H=1一、平均数(二)各个集中趋势度量指标之间的关系及评价(二)各个集中趋势度量指标之间的关系及评价1、关系在完全对称

22、分布情况下,odMMX在微偏态分布情况下,XMMdo3在一组数据中,XGH一、平均数2、评价作为集中趋势的度量指标,最好应满足以下几个条件:具有严格的定义有算法。利用全部观察值。容易计算。受抽样变动影响不大。适用于代数方法处理。二、变异数二、变异数二、变异数11.10 x9.9dM二、变异数变异数的种类变异数的种类二、变异数 是数据分布的两端变异的最大范围,即样本变量最大值和最小值之差,用R表示。它是资料中各观测值变异程度大小的最简便的统计量。例:150尾鲢鱼体长 R=85-37=48(cm)R=maxx1,x2,xn-minx1,x2,xn =x1,x2,xnmax-x1,x2,xnmin二

23、、变异数离均差之和为零。(x-x)=0!二、变异数(二)方差(二)方差(Variance)(x-x)2 n-1S 2=2=(x-)2 N样本总体 由于对每个离均差都取了平方,将实际的离散程度夸大或缩小,且方差的单位也是原数据单位的平方,为克服此缺陷,应将平方单位还原,即求出。二、变异数(x-x)2 n(x-x)2 n-1自由度(degree of freedom)nnii2222Sn/n/22aii 在统计上,在n个离均差中,只有n-1个变量可以变动,最后一个变量由于受到 这个条件的限制,不能够自由活动。0i二、变异数(x-x)2 n-1均方(mean square,MS)方差(varianc

24、e)离均差平方和简称平方和(sum of square),记为SS。自由度(degree of freedom)二、变异数(三)标准差(三)标准差(standard deviation,Sd)S =(x-x)2 n-1=(x-)2 N样本总体二、变异数(三)标准差(三)标准差(standard deviation,Sd)(x-x)2 n-1S =S =x 2 x)2 (nn-1 f x2 f x)2(n-n-1S=二、变异数x=411x2=18841X=6X2=76 表2-8 9名男子前臂长(cm)标准差计算 前臂长 x2 x=x-45 x2 45 2025 0 0 42 1764 -3 9

25、44 1936 -1 1 41 1681 -4 16 47 2209 2 4 50 2500 5 25 47 2209 2 4 46 2116 1 1 49 2401 4 16二、变异数18841-411*41199-1S=3.0(cm)76 -6*699-1S=3.0(cm)二、变异数(三)标准差(三)标准差(standard deviation,Sd)特性标准差的大小,受多个观测数影响,如果观测数与观测数间差异较大,则离均差也大,因而标准差也大,反之则小。1各观测数加上或减去一个常数,其标准差不变;2各观测数乘以或除以一个常数a,其标准差扩大或缩小a倍。二、变异数(三)标准差(三)标准差(

26、standard deviation,Sd)3正态分布sx1x2sx3s68.27%95.46%99.73%二、变异数定义:样本的标准差除以样本平均数,所得到的比值就是变异系数。CV=s/x 100%特点:是样本变量的,不带单位。可以比较相对变异程度的大小。二、变异数(四)变异系数(四)变异系数(coefficient of variability,CV)用途1比较度量衡单位不同单位不同的多组资料的变异度。例:某地20岁男子100人,其身高均数为166.06cm,标准差为4.95cm;其体重均数为53.72kg,标准差为4.96kg。比较身高与体重的变异情况。身高:CV2.98%体重:CV9.23%该地该地20岁男子体重的岁男子体重的变异大于身高的变异变异大于身高的变异。二、变异数(四)变异系数(四)变异系数(coefficient of variability,CV)用途2比较均数相差悬殊均数相差悬殊的多组资料的变异度 表 某地不同年龄组男子身高(CM)的变异程度年龄组 人数 均数 标准差 变异系数3-3.5岁 100 96.1 3.1 0.03230-35岁 100 170.2 5.0 0.03集中性离散性平均数平均数变异数变异数算术平均数算术平均数中位数中位数众数众数几何平均数几何平均数极差极差方差方差标准差标准差变异系数变异系数调和平均数调和平均数

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!