统计数据的搜集和整理.ppt

上传人:za****8 文档编号:14177335 上传时间:2020-07-09 格式:PPT 页数:42 大小:658.01KB
收藏 版权申诉 举报 下载
统计数据的搜集和整理.ppt_第1页
第1页 / 共42页
统计数据的搜集和整理.ppt_第2页
第2页 / 共42页
统计数据的搜集和整理.ppt_第3页
第3页 / 共42页
资源描述:

《统计数据的搜集和整理.ppt》由会员分享,可在线阅读,更多相关《统计数据的搜集和整理.ppt(42页珍藏版)》请在装配图网上搜索。

1、2.1总体和样本 2.2数据类型及频数(率)分布 2.3样本的几个特征数,2. 统计数据的搜集和整理,2.1.1统计数据的不齐性 1.数据的变异性 生物科学研究中的数据千差万别,各不相同,即存在着变异。 变异是生物试验数据的共同特点和基本特征。,2.1 总体和样本,数据(data ):在生物科学试验或调查过程中,对研究对象的某些特征或性状进行观察记载得到的数字资料。,2.1.1统计数据的不齐性,2.数据的趋中性: 同一种生物品种同一性状的观测数据在其平均数两侧集中分布,距平均数越近,分布的越多,距平均数越远,分布的越少。,2.1.2变数和变量,1.变数(variable) 凡是其观测值具有变异

2、的特征或性状称为变数。 例如,研究对象是农作物,株高、粒重、穗长、穗粒数、产量都是变数 表示方法:用X表示,多个变数则用X、Y、Z、等表示,2.变量(Variate) 变数的每一个具体值或观测值。 表示方法:对n个个体就其X变数进行观测,可得到n个变量或观测值,可用X1、X2、 Xn表示。 Xi :X变数的某个变量或观测值,i代表1到n中的任何一个。,2.1.3、总体和样本,1.总体(Population) 整个研究对象中每一个个体某一变数观测值的集合。 总体中的每一个数据或个体叫总体单位 总体中的个体数叫总体单位数(总体容量),用N表示 总体根据总体单位数目可分为无限总体和有限总体,2.1.

3、3总体和样本,2.样本(sample) 总体中的一部分,样本中包含的个体数目称为样本含量(sample size),2.1.4抽样,1.抽样(sampling) 从总体中获得样本的过程。 目的:是希望通过对样本的研究,推断其总体 方法:随机抽样(random sampling),例如,抽签、拈阄等,2.1.4抽样,从一有限总体中抽样,可分为: 放回式抽样(sampling with replacement):从总体中抽出一个样本,记下它的特征后,放回总体中,再做第二次抽样。 非放回式抽样(sampling without replacement):从总体中抽出个体后,不再放回。,2.2数据类型

4、及频数(率)分布,2.2.1连续型数据和离散性数据 2.2.2频数(率)表和图的编绘,2.2.1连续型数据和离散性数据,1.连续型数据(continuous data) 与某种标准做比较所得到的数据,又称为度量数据(measurement data) 变量的方法(measurement data),2.离散型数据(discrete data): 由记录不同类别个体的数目所得到的数据,又称为计数数据(count data) 属性的方法(method of attribute),2.2.2频数(率)表和图的编绘,在判断数据的类型后,就要进一步研究数据的变化规律。描述数据变化规律的最简单方法是将这些

5、数据列成频数表或绘成频数图,根据频数分布进行研究。,1.单项式分组,单项式分组:适用于变异范围不大的离散型数据和质量性状的分组。 单项式分组是一个单独的数值 分组只需要计算频数,编制频数分布表 组成各组的数值就是该组的组值,表:100株豫麦9号主茎结实小穗数频数分布,表 某玉米杂交组合F2代两对性状的分离,2.组限式分组,组限式分组:将连续型数据或变异范围较大的离散型数据,按照一定的数值距离,进行分组的方法 (1)计算全距 全距(极差),用R表示。 等于资料中的最大值于最小值的差,例1,(2)确定组数和组距,1).确定组数:分组的公式:组数13.3lgn (n:样本单位数) 组数的范围:630

6、之间,一般应在15组左右,视样本单位数而定 组数多少也可根据样本单位数n,查表确定。,2)确定组距: 组距全距组数 也可用标准差的1/21/3作为组距 由于分组阶段,不知道可以通过R(全距)加以计算,组数13.3lgn 13.3lg1007.6 8 组距全距组数42 85.25cm 利用一个与其接近且方便的值,组距定为5cm,(3)确定组限,组限是各组的界限,即每组的两个极端数,一个组的最大值为组上限,最小值为组下限。 组限应从最低一组定起 最低一组的组下限要小于资料中的最小值 最低一组的组下限加上1/2组距后接近资料中的最小值 最高一组的组上限要大于资料中的最大值 最高一组的组上限减去1/2

7、组距后接近资料中的最大值。,(4) 计算频数,计算各组频数可用划记法,可用“正”字划记,便于计算。,(5)编制频数分布表,各组次数计算出后,将各组的组限、组中值、次数以及相对次数一起归入表格,即为频数分布表。 组中值组上限组下限/2 各组的频率()各组的频数100/总频数,表 100株小麦株高频数(率)表,3.三种最常用的频数图,(1) 直方图(histogram) 频数(率)直方图 横轴:各组的组界 纵轴:频数(率) 以每一组的组界为一个边,相应的频数(率)为另一个边,作矩形,(2)多边形图,多边形图(polygon) 横轴:组中值 纵轴:频数(率) 在坐标平面内,标出相应的点,以中值为横坐

8、标,以该中值对应的频数(率)为纵坐标,用线段连接各点,(3) 累积频数图(cumulative frequency graph),根据频数(率)表制成累积频数表 横轴:组中值 纵轴:累积频数(率),4.研究频数(率)分布的意义,根据编绘的频数(率)图,可以明显地看出数据的三个重要特征。 数据的集中情况 直观地看出数据的变异情况 数据是集中在平均数附近,还是分散在平均数两侧 图形的形状 此外,还可以显示一些不规则的情况。此时,需要认真研究,尽可能找出原因。,2.3样本的几个特征数,2.3.1平均数(mean) 1.算术平均数 资料中各观测值的总和除以观测值个数所得的商。 总体:,样本:,2.加权

9、算术平均数,适用于已分组的数据 总体:,组值。频数,N总频数,k组数, 和相乘,样本:,3.几何平均数,几何平均数G是n个数值积的n次方根。几何平均数主要用来计算平均增长率。 (1)几何平均数的计算,此外,如果数据的变异成倍性关系,则几何平均数更适合于说明数据的典型水平。,(2)平均增长率的计算,此外,平均数还有: 调和平均数H:是各观测值的算术平均数的倒数,主要用于计算平均速度。 中位数:排列在中间位置的数值。 众数Mo:是资料中出现次数最多的数值。 中位数和众数是地位平均数,不受极端观测值的影响,计算简便,又可用于开口的次数分布。但其数理基础不够健全,又不能利用全部数据提供的信息,所以应用

10、范围比较狭窄。,2.3.2变异数,1.极差 极差(全距),用R表示。 等于资料中的最大值于最小值的差,n10时适用,例如,有五个数:96.4、96.6、97.2、97.4、97.8(ml) R=97.896.41.4ml 极差表达变异的方法最简单,但也最容易受远离数群的一个数的影响。 而且也很难解释一个个别的数与平均数之间的关系。,2.标准差,(1)方差:离均差平方和的平均数 方差的定义公式,总体,样本,当n 30时,可用n代替n-1(自由度,df/v),自由度的统计意义是样本内独立而能自由变动的观测值个数,(2)标准差:方差的算术平方根。 定义公式: 总体,样本,离差平方和(sum of s

11、quare of deviations),(3)标准差的计算,不分组数据(非频数资料)标准差的计算,计算公式为: 总体,样本,例:从两个小区分别随机抽取10株小麦,测其单穗粒数,结果如下表,计算标准差。,解:将表中数据代入公式,得:,s1 1.63 s2 2.91,分组数据标准差的计算,由于分组数据(频数资料)一般都是大样本,所以总体和样本标准差的计算公式完全一样,为:,其中,f=频数,x=组值,N=总频数,k=组数,3.变异系数,(1)变异系数(coefficient of variability,CV):是标准差与平均数的比值,用百分数表示。,(2) 引进变异系数的必要性: 标准差可用来度量样本的变异程度,但也有一定的局限性。 受度量单位制约,不同性状的变异程度不能用标准差进行比较 同一性状的变异程度要受到平均数大小的制约。,例,现有小麦品种A和B,它们株高的平均数和标准差分别为:A=120/5.0,B=70+/4.0。比较A和B的变异程度? 解:把以上数据代入下面公式,得:,CVA=0.042和CVB =0.057 虽然B品种的标准差小于A品种的标准差,但其变异系数却大于A,说明B不如A整齐。,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!