第二章试验资料的整理与特征数的计算修

收藏

编号:168427282    类型:共享资源    大小:2.75MB    格式:PPT    上传时间:2022-11-09
10
积分
关 键 词:
第二 试验 资料 整理 特征 计算
资源描述:
第一节 试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理第二节 试验资料特征数的计算一、平均数二、变异数第一节 试验资料的搜集与整理一、试验资料的类型一、试验资料的类型二、试验资料的搜集三、试验资料的整理对试验资料进行分类是统计归纳的基础对试验资料进行分类是统计归纳的基础试试验验资资料料类类型型数量性状资料数量性状资料质量性状资料属性性状资料质量性状资料属性性状资料计数资料非连续变量资料计数资料非连续变量资料计量资料连续变量资料计量资料连续变量资料一、数量性状资料一、数量性状资料株数频率红花26626.6%紫花49449.4%白花24024.0%总计1000100.0%第一节 试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集二、试验资料的搜集三、试验资料的整理试试 验验一、调查一、调查 调查调查是对已经存在的事情的资料按某种方案进行收集的方法。资料的调查又可以分为两种:普查和抽样调查。1、普查普查 是对研究对象的全部个体逐一进行调查的方法。普查一般要求在一定的时间或范围进行,要求准确和全面。2、抽样调查、抽样调查 是根据一定的原则从研究对象中抽取一部分具有代表性的个体进行调查的方法。通过抽样将获得的样本资料进行统计处理,然后利用样本的特征数对总体进行推断。随机抽样必须满足随机抽样必须满足2个条件:一是总体中每个个体被抽中的个条件:一是总体中每个个体被抽中的机会是均等的;二是总体中任意一个个体是相互独立的,是否机会是均等的;二是总体中任意一个个体是相互独立的,是否被抽中不受其他个体的影响。被抽中不受其他个体的影响。生物学研究中,进行普查的情况较少,多数情况下还是进生物学研究中,进行普查的情况较少,多数情况下还是进行抽样调查。行抽样调查。二、试验二、试验 试验试验是对已有的或没有的事物加以处理的方法。是对已有的或没有的事物加以处理的方法。常见的试验设计方法有:对比设计、随机区组常见的试验设计方法有:对比设计、随机区组设计、平衡不完全区组设计、裂区设计、拉丁方设设计、平衡不完全区组设计、裂区设计、拉丁方设计、正交设计、正交旋转设计等等。计、正交设计、正交旋转设计等等。试验设计须遵循的三大原则是:试验设计须遵循的三大原则是:随机、重复和随机、重复和局部控制。局部控制。第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理三、试验资料的整理三、试验资料的整理(一)原始资料的检查与核对(一)原始资料的检查与核对原始数据核对检查订正(二)次数(频数)分布表(二)次数(频数)分布表:总横标目(或空白)总横标目(或空白)纵标目纵标目1纵标目纵标目2横标目横标目1横标目横标目2数字资料数字资料表号表号 标题标题1 计数资料的整理计数资料基本上采用单项式分组法进行整理。特点:用样本变量自然值进行分组,每组用一个或几个变量值来表示。15 17 12 14 13 14 12 11 14 13 16 14 14 13 17 15 14 14 16 1414 15 15 14 14 14 11 13 12 1413 14 13 15 14 13 15 14 13 1415 16 16 14 13 14 15 13 15 1315 15 15 14 14 16 14 15 17 1316 14 16 15 13 14 14 14 14 1612 13 12 14 12 15 16 15 16 1413 15 17 14 13 14 12 17 14 15表2-1 100只来亨鸡每月的产蛋数1117来亨鸡每月产蛋数变动范围:分为7组统计各组次数计算频率和累积频率制表每月产蛋数 次数 频率 累积频率 Frequency Percent Cumulative Percent 11 2 0.02 0.02 12 7 0.07 0.09 13 19 0.19 0.28 14 35 0.35 0.63 15 21 0.21 0.84 16 11 0.11 0.95 17 5 0.05 1.00表2-2 100只来亨鸡每月产蛋数次数分布表累累积频率积频率:按某种标志对数据进行分组后,分布在各组内的数据个数称为频数或次数,各组频数与全部频数之和的比值称为频率或比重。为了统计分析的需要,观察某一数值以下或某一数值以上的频率之和,叫做累积频率,或叫做对频率的累计。从变量值小的一方向变量值大的一方累加,称为向上累积,反之为向下累积。频率的最终累积值为100%。每月产蛋数 次数 频率 累积频率 Frequency Percent Cumulative Percent 11 2 0.02 0.02 12 7 0.07 0.09 13 19 0.19 0.28 14 35 0.35 0.63 15 21 0.21 0.84 16 11 0.11 0.95 17 5 0.05 1.00表2-2 100只来亨鸡每月产蛋数次数分布表1 自然值进行分组,最大值17,最小值11。2 数据主要集中在14,向两侧分布逐渐减少。表2-3 小麦品种300个麦穗穗粒数的次数分布表每穗粒数 次数 频率 累积频率 Frequency Percent Cumulative Percent 18-22 3 0.0100 0.0100 23-27 18 0.0600 0.0700 28-32 38 0.1267 0.1967 33-37 51 0.1700 0.3667 38-42 68 0.2267 0.5934 43-47 53 0.1766 0.7700 48-52 41 0.1367 0.9067 53-57 22 0.0733 0.9800 58-62 6 0.0200 1.0000 2、计量资料的整理计量资料一般采用组距式分组法。全距组数组距组限归组制表表2-4150尾鲢鱼体长(cm)56 49 62 78 41 47 65 45 58 55 59 65 69 62 7352 52 60 51 62 78 66 45 58 58 60 57 52 51 4856 46 58 70 72 76 77 56 66 58 58 55 53 50 6563 57 65 85 59 58 54 62 48 63 46 61 62 57 3858 52 54 55 66 52 48 56 75 72 57 37 46 76 5663 75 65 48 52 55 54 62 71 48 62 58 46 57 3854 53 65 42 83 66 48 53 58 46 46 56 46 76 5560 54 58 49 52 56 82 63 65 54 75 65 86 46 7770 69 40 56 58 61 54 53 52 43 52 64 58 58 5478 52 56 61 59 54 59 64 68 51 59 68 63 52 63(1)求全距,求全距,又称极差又称极差 (range):R=Xmax-Xmin =85-37 =48(cm)(2)确定组数和组距(确定组数和组距(class boundary)组数是根据样本观测数的多少及组距的大小来组数是根据样本观测数的多少及组距的大小来确定的,同时考虑到对资料要求的精确度以及进一确定的,同时考虑到对资料要求的精确度以及进一步计算是否方便。步计算是否方便。组数组距多小统计数精确,计算不方便少大统计数不精确,计算方便组数的确定组距的确定即每组内的上下限范围。组距全距/组数48104.8(3)确定组限(class limit)和组中值(class midvalue)是指每个组变量值的起止界限。上限下限是两个组限的中间值。组中值下限上限 2组距2下限组距2上限表2-4150尾鲢鱼体长(cm)56 49 62 78 41 47 65 45 58 55 59 65 69 62 7352 52 60 51 62 78 66 45 58 58 60 57 52 51 4856 46 58 70 72 76 77 56 66 58 58 55 53 50 6563 57 65 85 59 58 54 62 48 63 46 61 62 57 3858 52 54 55 66 52 48 56 75 72 57 37 46 76 5663 75 65 48 52 55 54 62 71 48 62 58 46 57 3854 53 65 42 83 66 48 53 58 46 46 56 46 76 5560 54 58 49 52 56 82 63 65 54 75 65 86 46 7770 69 40 56 58 61 54 53 52 43 52 64 58 58 5478 52 56 61 59 54 59 64 68 51 59 68 63 52 63(4)分组分组确定好组数和各组上下限后,可按原始资料中各观确定好组数和各组上下限后,可按原始资料中各观测值的次序,将各个数值归于各组,计算各组的观测值的次序,将各个数值归于各组,计算各组的观测数次数、频率、累积频率,制成一个次数分布表。测数次数、频率、累积频率,制成一个次数分布表。计数的方法计数的方法卡片法卡片法唱票法唱票法画画“正正”字字画画“”组限 组中值 次数 频率 累积频率 Frequency Percent Cumulative Percent 35 37.5 3 0.0200 0.0200 40 42.5 4 0.0267 0.0467 45 47.5 17 0.1133 0.1600 50 52.5 28 0.1867 0.3467 55 57.5 40 0.2666 0.6133 60 62.5 25 0.1667 0.7800 65 67.5 17 0.1133 0.8973 70 72.5 6 0.0400 0.9333 75 77.5 7 0.0467 0.9800 80 82.5 2 0.0133 0.9933 85 87.5 1 0.0067 1.0000表2-6 150尾鲢鱼体长的次数分布表(三)次数(频数)分布图(三)次数(频数)分布图定义:定义:把次数分布资料画成统计图形。把次数分布资料画成统计图形。特点:特点:直观、形象直观、形象包括:包括:条形图、直方图、多边形图、饼图和散点图条形图、直方图、多边形图、饼图和散点图(1)标题简明扼要,列于图的下方;(2)纵、横两轴应有刻度,注明单位;(3)横轴由左至右,纵轴由下而上,数值由小到大;图 形长宽比例约5:4或6:5;(4)图中需用不同颜色或线条代表不同事物时,应有图 例说明。图2.1 月产蛋数次数分布柱形图图2.2 月产蛋数频率分布柱形图1条形图(条形图(bar chart),又称柱形图又称柱形图 横坐标横坐标:变量的自然值变量的自然值 纵坐标纵坐标:次数次数图1 来亨鸡月产蛋次数分布图 图2.3 鲢鱼体长次数分布图35 40 45 50 55 60 65 70 75 80 85 90三、试验资料的整理图2.3 鲢鱼体长次数分布图35 40 45 50 55 60 65 70 75 80 85 90横坐标横坐标:各组组限各组组限纵坐标纵坐标:次数次数图2.3 鲢鱼体长次数分布图横坐标横坐标:各组组中值各组组中值纵坐标纵坐标:次数次数 1 2 3 4 5 64321 1 2 3 4 5 64321 1 2 3 4 5 64321a.正向直线关系b.负向直线关系c.曲线关系4035302520151050 图2.1 月产蛋数次数分布图10 11 12 13 14 15 16 17 第二节 试验资料特征数的计算是变量在趋势上有着向某一中心聚集,或者说是变量在趋势上有着向某一中心聚集,或者说 以某一数值为中心而分布的性质。以某一数值为中心而分布的性质。是变量有着离中分散变异的性质。是变量有着离中分散变异的性质。变量的分布具有两种明显的基本特征:变量的分布具有两种明显的基本特征:。集中性离散性平均数平均数变异数变异数算术平均数算术平均数中位数中位数众数众数几何平均数几何平均数极差极差方差方差标准差标准差变异系数变异系数调和平均数调和平均数一、平均数一、平均数 平均数平均数 是统计学中最常用的统计量,是计是统计学中最常用的统计量,是计量资料的代表值,表示资料中观测数的中心位置,量资料的代表值,表示资料中观测数的中心位置,并且可作为资料的代表与另一组相比较,以确定并且可作为资料的代表与另一组相比较,以确定二者的差异情况。二者的差异情况。(一)平均数的种类(一)平均数的种类1.算术平均数算术平均数 (arithmetic mean)定义:总体或样本资料中所有观测数的总和除以观测数定义:总体或样本资料中所有观测数的总和除以观测数 的个数所得的商,简称平均数、均数或均值。的个数所得的商,简称平均数、均数或均值。x1+x2+x3+xNN总体:总体:N1Nixi1样本:样本:x1+x2+x3+xnnx xn1nixi12.中位数中位数(median)资料中所有观测数依大小顺序排列,居于中间位置资料中所有观测数依大小顺序排列,居于中间位置的观测数称为中位数或中数。的观测数称为中位数或中数。Md2/)1(nx2)12/(2/nndxxM3.众数众数(mode)资料中出现次数最多的那个观测值或次数最多一组的资料中出现次数最多的那个观测值或次数最多一组的组中值组中值(中点值中点值)。M0注意:注意:(1)对于某些数据而言,如均匀分布,并不存在众数;)对于某些数据而言,如均匀分布,并不存在众数;(2)对于某些数据存在两个或两个以上的众数;)对于某些数据存在两个或两个以上的众数;(3)主要用来描述频率分布。)主要用来描述频率分布。4.几何平均数几何平均数(geometric mean)资料中有资料中有n个观测数,其乘积开个观测数,其乘积开n次方所得数值。次方所得数值。G适用范围:几何均数适用于变量适用范围:几何均数适用于变量X为对数正态分布,为对数正态分布,经对数转换后呈正态分布的资料。经对数转换后呈正态分布的资料。G=nxnxxx*.3*2*1(二)算术平均数的计算方法(二)算术平均数的计算方法例:随机抽取20株小麦测量它们的株高(cm)分别为:82 79 85 84 86 84 83 82 83 8384 81 80 81 82 81 82 82 82 80 求小麦的平均株高。xn20(82+79+80)82.3(cm)ix例:设a为80(cm)则有:82 79 85 84 86 84 83 82 83 83 2 1 5 4 6 4 3 2 3 384 81 80 81 82 81 82 82 82 80 4 1 0 1 2 1 2 2 2 0 x20(21+5+0)82.3(cm)+80 x例:例:1x2082.3(cm)(79 1+802+86 1)株高x次数ffx791798021608132438264928332498432528518586186ffxfxffffxfxfxfxkiikiiikkk11212211ixifk 若为若为,则用每组组中值乘以该组次数之和再除,则用每组组中值乘以该组次数之和再除以总次数来计算:以总次数来计算:组别组中值(x)次数(f)fx101534520256150303526910404530135050552413206065852070753225合计1004520)(2.451004520kgffxx)(89.738270012007251500750kgffxx(x-x)=0(x-x)2 (x-a)2(三)算术平均数的重要性质(三)算术平均数的重要性质(四)算术平均数的作用(四)算术平均数的作用(1)指出一组数据资料内变量的中心位置,标志着资 料所代表性状的数量水平和质量水平。(2)作为样本或资料的代表数与其他资料进行比较。二、变异数二、变异数变异数的种类变异数的种类 是数据分布的两端变异的最大范围,即样本变量是数据分布的两端变异的最大范围,即样本变量值最大值和最小值之差,用值最大值和最小值之差,用R表示。它是资料中各观测值表示。它是资料中各观测值变异程度大小的最简便的统计量。变异程度大小的最简便的统计量。例:例:150尾鲢鱼体长尾鲢鱼体长 R=85-37=48(cm)R=maxx1,x2,xn-minx1,x2,xn =x1,x2,xnmax-x1,x2,xnmin当资料很多而又要迅速对资料的变异程度作出判断时,当资料很多而又要迅速对资料的变异程度作出判断时,可以利用极差。可以利用极差。用途如何准确地表示样本内各个观测值的变异程度平均数可以求出各个观测值与平均数的离差,即离均差。离均差可以反映出一个观测值偏离平均数的性质和程度。离均差之和为离均差之和为零零。(x-x)=0?平方和(SS)平方和的平均数(x-x)2 (x-x)2 n(x-x)2 n(x-x)2 n-1其统计其统计意义是样本内独立而能自由变动的的观测值个数。意义是样本内独立而能自由变动的的观测值个数。(x-x)2 n-1均方(mean square,MS)方差(variance)(二)方差(二)方差(Variance)(x-x)2 n-1s 2=2=(x-)2 N样本总体 样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常需要与平均数配合使用,这时应将平方单位还原,即求出。为了便于比较,用离均差平方和除以样本容量n,得到平均的平方和,简称方差(三)标准差(三)标准差(standard deviation,Sd)s =(x-x)2 n-1=(x-)2 N样本总体(三)标准差(三)标准差(standard deviation,Sd)P20(x-x)2 n-1s =s =x 2 x)2 (nn-1x=411x2=18841X=6X2=76 表2-8 9名男子前臂长(cm)标准差计算 前臂长 x2 x=x-45 x2 45 2025 0 0 42 1764 -3 9 44 1936 -1 1 41 1681 -4 16 47 2209 2 4 50 2500 5 25 47 2209 2 4 46 2116 1 1 49 2401 4 1618841-411*41199-1S=3.0(cm)76 -6*699-1S=3.0(cm)(三)标准差(三)标准差(standard deviation,Sd)f x2 f x)2(n-n-1S=对于分组的资料对于分组的资料,应采用加权的公式进行应采用加权的公式进行:例:例:株高x次数ffxfx27917962418021601280081324319683826492403448332492066784325221168851857225861867396 1355241646)2(20-20-1S=1.7502(cm)总和总和 20 1646 135524(三)标准差(三)标准差(standard deviation,Sd)特性标准差的大小,受多个观测数影响,如果观测数与观测数间差异较大,则离均差也大,因而标准差也大,反之则小。1各观测数加上或减去一个常数,其标准差不变;2各观测数乘以或除以一个常数a,其标准差扩大或缩小a倍。3正态分布sx1x2sx3s68.27%95.46%99.73%(观测值个数/观测值总个数)定义:样本的标准差除以样本平均数,所得到的比值就是变异系数。CV=s/x 100%特点:是样本变量的,不带单位。可以比较相对变异程度的大小。(四)变异系数(四)变异系数(coefficient of variability,CV)中粳“农垦57”大田,穗粒数65.0,标准差18.9丰产田,穗粒数44.6,标准差18.3大田,CV=18.9/65=29.08%丰产田,CV=18.3/44.6=41.03%大田中粳穗粒数的整齐度优于丰产田问:哪种栽植田水稻穗粒数变异程度较大?问:哪种栽植田水稻穗粒数变异程度较大?(四)变异系数(四)变异系数(coefficient of variability,CV)用途1比较单位不同单位不同的多组资料的变异度。例:某地20岁男子100人,其身高均数为166.06cm,标准差为4.95cm;其体重均数为53.72kg,标准差为4.96kg。比较身高与体重的变异情况。身高:CV2.98%体重:CV9.23%该地该地20岁男子体重的变岁男子体重的变异大于身高的变异异大于身高的变异。(四)变异系数(四)变异系数(coefficient of variability,CV)用途2比较均数相差悬殊均数相差悬殊的多组资料的变异度 表 某地不同年龄组男子身高(CM)的变异程度年龄组 人数 均数 标准差 变异系数3-3.5岁 100 96.1 3.1 0.03230-35岁 100 170.2 5.0 0.03练习题 试分别计算出以下两个玉米品种的10个果穗长度(cm)的标准差及变异系数,并解释所得结果。郑单21:19、21、20、20、18、19、22、21、21、19浚单22:16、21、24、15、26、18、20、19、22、19 一、某地 100 例 30 40 岁健康男子血清总胆固醇(mol L-1)测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 1、根据所给资料编制次数分布表 2、绘制直方图和多边形图,并简述其分布特征。二、某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重(kg),结果分别如下:单养 50 绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,48,50,51,46,41,34,44,46;混养 50 绳重量数据:51,48,58,42,55,48,48,54,39,58,50,54,53,44,45,50,51,57,43,67,48,44,58,57,46,57,50,48,41,62,51,58,48,53,47,57,51,53,48,64,52,59,55,57,48,69,52,54,53,50。试从平均数、极差、标准差、变异系数几个指标来评估单养与混养的效果,并给出分析结论。
展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
提示  装配图网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:第二章试验资料的整理与特征数的计算修
链接地址:https://www.zhuangpeitu.com/article/168427282.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!