平均数、变异数、t检验

上传人:xt****7 文档编号:189593707 上传时间:2023-02-23 格式:PPT 页数:85 大小:1.83MB
收藏 版权申诉 举报 下载
平均数、变异数、t检验_第1页
第1页 / 共85页
平均数、变异数、t检验_第2页
第2页 / 共85页
平均数、变异数、t检验_第3页
第3页 / 共85页
资源描述:

《平均数、变异数、t检验》由会员分享,可在线阅读,更多相关《平均数、变异数、t检验(85页珍藏版)》请在装配图网上搜索。

1、第二章平均数与变异数第一节第一节 总体与样本总体与样本第二节第二节 平均数平均数第三节第三节 变异数变异数第四节第四节 可疑数值取舍可疑数值取舍第五节第五节 数据标准化数据标准化第六节第六节 数据转化数据转化第七节第七节 t t检验检验第一节第一节 总体与样本总体与样本总体具有共同性质的个体所组成的集团 无限总体 总体有无穷多个个体构成 有限总体-总体由有限个个体构成参数-由总体的全部观察值而算得的总体特征数第二章第一节第一节 总体与样本总体与样本样本-从总体中抽取若干个个体的集合 统计数-测定样本中的各个体而得的样本特征数,如平均数等。统计数是总体相应参数的估计值。第二节第二节 平均数平均数

2、 算术平均数算术平均数 中位数中位数 几何平均数几何平均数 第二章一、算术平均数一、算术平均数 Mean1 1 定义定义 各单项测定值的总和除以测定值的个数,所得的商。2 2 计算方法计算方法(1)如样本较小,即资料包含的观察值个数不多,可直接计算平均数。第二节第二节 平均数平均数 nynyyyyyniin1321 例例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其平均数。一、算术平均数一、算术平均数 2 2 计算方法计算方法(2)若样本较大,且已进行了分组,可采用加权法计算算术平均数,即用组中点值代表该

3、组出现的观测值以计算平均数,其公式为 第二节第二节 平均数平均数 nfyfyfyiii 二、中位数二、中位数(Median)1 定义定义 将资料内所有观察值从大到小排序,居中间位置的观察值称为中数,计作Md。2 计算方法计算方法 将观察值排序,如观察值个数为奇数,则以中间的观察值为中位数;如观察值个数为偶数,则以中间二个观察值的算术平均数为中位数。第二节第二节 平均数平均数 例例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其中位数。第二节第二节 平均数平均数三三 几何平均数几何平均数 (Geometric

4、 mean Geomean)1 1 定义定义 如有n个观察值,其相乘积开n次方,即为几何平均数,用G代表。2 2 计算方法计算方法 nnnnyyyyyyyyG/1321321)(例例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其几何平均数。比较甲、乙两个小组(各比较甲、乙两个小组(各5 5人)某门课成绩人)某门课成绩的优劣。的优劣。甲班:甲班:5050、5050、5050、8080、2020 乙班:乙班:100100、0 0、5050、8080、2020第二章 比较甲、乙两个小组(各比较甲、乙两个小组(各

5、5 5人)某门课成绩人)某门课成绩的优劣。的优劣。甲班:甲班:100100、0 0、5050、8080、2020 乙班:乙班:100100、0 0、5050、7070、3030第二章 比较甲、乙两个小组(分别为比较甲、乙两个小组(分别为5 5、7 7人)某人)某门课成绩的优劣。门课成绩的优劣。甲班:甲班:100100、0 0、5050、8080、2020 乙班:乙班:100100、0 0、5050、8080、2020、7070、3030第二章第三节第三节 变异数变异数 变异程度指标变异程度指标 偏差偏差 极差极差 方差方差 标准差标准差 标准误标准误 变异系数变异系数 第二章第三节第三节 变异

6、数变异数一、偏差一、偏差 (Deviation)定义:测定值与平均值之差。特点:有单位,有正负,个数与样本个数相等 xxdi第三节第三节 变异数变异数二、极差二、极差 (RangeRange)极差,又称全距,记作R,是资料中最大观察值与最小观察值的差数。R=ymax-ymin 特点:有单位,一个值(表述较偏差简单)例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其极差。第三节第三节 变异数变异数三、方差三、方差 离差平方和每一个观察值均有一个偏离平均数的度量指标离均差,但各个离均差的总和为0,不能用来度量变

7、异,那么可将各个离均差平方后加起来,求得离均差平方和(简称平方和)SS(sum of squares of deviations from mean),定义如下:样本样本 总体总体2)(yySSi2)(iySS第三节第三节 变异数变异数由于各个样本所包含的观察值数目不同,为便于比较起见,用观察值数目来除平方和,得到平均平方和,简称均方或方差(variance)。样本均方(mean square)用s2表示,定义为:1)(nyysni122 第三节第三节 变异数变异数 它是总体方差()的无偏估计值;此处除数为自由度(n-1)而不用n,其中,N为有限总体所含个体数。均方和方差这两个名称常常通用,但

8、习惯上称样本的s2为均方,总体的 为方差 2NyNi122)(2第三节第三节 变异数变异数自由度自由度 Degree of freedom自由度记作df,它的统计意义是指样本内独立而能自由变动的离均差个数。例如一样本为(3,4,5,6,7),平均数为5,前个离差为-2,-1,0和1,则第5个离均差为前4个离均差之和的变号数,即-(-2)=2。一般地,样本自由度等于观察值的个数(n)减去约束条件的个数(k),即df=n-k。第三节第三节 变异数变异数 同样,样本标准差是总体标准差的估计值。总体标准差用 表示:Ny2)(第三节第三节 变异数变异数 自由度自由度 Degree of freedom

9、样本标准差不以样本容量n,而以自由度n-1作为除数,这是因为通常所掌握的是样本资料,不知的数值,不得不用样本平均数 代替。与有差异,由算术平均数的性质可知,比 小。因此,由 算出的标准差将偏小。如分母用n-1代替,则可免除偏小的弊病。yy2)(yy 2)(y nyy/)(2 第三节第三节 变异数变异数四、标准差四、标准差 Standard deviation (SD)标准差为方差的正平方根值,用以表示资料的变异度,其单位与观察值的度量单位相同。样本资料计算标准差的公式为:1)(2nyys 第三节第三节 变异数变异数在应用上,小样本一定要用自由度来估计标准差;如为大样本,因n和n-1相差微小,也

10、可不用自由度,而直接用n作除数。但样本大小的界限没有统一规定,所以一般样本资料在估计标准差时,皆用自由度。第三节第三节 变异数变异数标准差的计算方法标准差的计算方法分四个步骤:先求出 ,再求出各个 和各个 ,求和得 ,即可代入下式算得标准差。yy 2)(yy 2)(yy 1)(2nyys yy例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其标准差。表达方法表格中:Means SD Means(SD)图中:误差线:正、负、正负第三节第三节 变异数变异数五、标准误五、标准误 Standard error(SE

11、)第三节第三节 变异数变异数Adapted from:Jacobs et al.2005.Relative contribution of initial root and shoot morphology in predicting field performance of hardwood seedlings.New Forests,30:235-251.第三节第三节 变异数变异数Adapted from:Boivin et al.2004.Late-season fertilization of Picea mariana seedlings:intensive loading and

12、outplanting response on greenhouse bioassays.Ann.For.Sci.61:737-745.第三节第三节 变异数变异数Adapted from:Rix et al.2012.Paternal and maternal effects on the response of seed germination to high temperatures in Eucalyptus globulus.Ann.For.Sci.69:673-679.第三节第三节 变异数变异数Adapted from:Campo et al.2007.Relationship be

13、tween root growth potential and field performance in Aleppo pine.Ann.For.Sci.64:541-548.第三节第三节 变异数变异数六、变异系数六、变异系数标准差和观察值的单位相同,表示一个样本的变异度。若比较两个样本的变异度,则因单位不同或均数不同,不能用标准差进行直接比较。这时可计算样本的标准差对均数的百分数,称为变异系数。(%)100%sCVy例在同一稀释度的10个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、96、127、86(单位:个)。试计算其变异系数。第三节第三节 变异数变

14、异数两个小麦品种主茎高度的平均数、标准差和变异系数。第三节第三节 变异数变异数 如只从标准差看,品种甲比乙的变异大些;但因两者的均数不同,标准差间不宜直接比较。如果算出变异系数,就可以相互比较,这里乙品种的变异系数为11.3%,甲品种为9.5%,可见乙品种的相对变异程度较大。第三节第三节 变异数变异数 但是在使用变异系数时,应该认识到它同时受标准差和平均数的影响。因此,在使用变异系数表示样本变异程度时,宜同时列举平均数和标准差,否则可能会引起误解。将变量送入右侧文本框选择点击Continue点击OkDescriptive StatisticsNRangeMinimumMaximumMeanSt

15、d.DeviationStatisticStatisticStatisticStatisticStatisticStd.ErrorStatistic微生物数量107486160115.308.16625.824Valid N(listwise)10练习题1:在同一稀释度的10个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、96、127、86(单位:个)。利用Excel和SPSS分别计算其变异系数。练习题2:见附注课题数表“多组变量与SPSS统计值实现”(1)利用SPSS分别计算其平均值、标准差、标准误(2)利用Sigmaplot作柱形图(含标准误),要求苗

16、高为一张图,地径为另一张图。第四节第四节 可疑数值的取舍可疑数值的取舍1.1.可疑数据的概念可疑数据的概念在测量中有时会出现过高或过低的测量值,这种数据称为可疑数据或逸出值(outlier)。2.2.可以数值的取舍(可以数值的取舍(拉依达法拉依达法、肖维纳特法、格拉布斯法、肖维纳特法、格拉布斯法)拉伊达法:当试验次数较多时,可简单地用3倍标准偏差(3s)作为确定可疑数据取舍的标准。当某一测量数据()与其测量结果的算术平均值()之差大于3倍标准偏差时,用公式表示为:则该测量数据应舍弃。先对数据排序,然后对极值按公式取舍第二章yiy3iyys例例对一批苗木随机抽取10株测定其苗高,测定值分别为、,

17、试用拉伊达法排除可疑值。取3的理由是:根据随机变量的正态分布规律,在多次试验中,测量值落在 x-3与x+3之间的概率为,出现在此范围之外的概率仅为0.27%,也就是在近400次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能。因而在实际试验中,一旦出现,就认为该测量数据是不可能的,应将其舍弃。第四节第四节 可疑数值剔除及正态与方差齐次性判断可疑数值剔除及正态与方差齐次性判断第二章SPSS实现1 建立数表2 Analyze-Descriptive Statistics-Explore3 选择分析变量Dependent、分组变量Factor及标示变量Label cases

18、by4 选择描述统计量Statistics5 剔除可疑值、判断正态性与方差齐次性,选择 Plots菜单6 读取结果第五节第五节 数据标准化数据标准化一、数据标准化的意义一、数据标准化的意义 不同要素的数据往往具有不同的单位和量纲,其数值的变异可能是很大的,这就会对统计结果产生影响。因此,在聚类分析、主成分分析之前,首先要对要素进行数据处理。第二章第五节第五节 数据标准化数据标准化二、数据标准化的方法二、数据标准化的方法第二章iiyyyS标准差标准化:标准化后各要素平均值为0,标准差为111niiyyn211()1niisyynSPSS实现第五节第五节 数据标准化数据标准化二、数据标准化的方法二

19、、数据标准化的方法极差标准化:标准化后各要素的极大值为1,极小值为0,其余的数值均在0与1之间。min(1,2,.,)maxminiiiiiiiiyyyinyy第五节第五节 数据标准化数据标准化二、数据标准化的方法二、数据标准化的方法极大值标准化(1,2,.,)maxiiiiyyiny例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。分别试用标准差法、极差法和最大值法对上述数据进行标准化处理。第六节第六节 数据转化数据转化 第二章为什么进行数据转化参数统计分析方法对资料有一定的要求,如t检验和方差分析要求样本来自正

20、态分布总体,并且方差齐同;直线相关(回归)分析要求两变量间呈直线关系。但实际工作中并非所有的统计资料都能满足参数统计分析方法的条件;对于不能满足条件的资料,则不能直接应用参数统计分析方法,否则有可能导致错误的结论。数据转换的常用方法对数变换(transformation of logarithm)将原始数据X取对数,以其对数值作为分析变量对数变换的用途使服从对数正态分布的资料正态化;使方差不齐且各组的接近的资料达到方差齐的要求;使曲线直线化,常用于曲线拟合。数据转换的常用方法平方根变换(square root transformation)将原始数据X的平方根作为分析变量平方根变换的用途:使服

21、从Poisson分布的计数资料,或轻度偏态资料正态化;使方差不齐且各样本的方差与均数间呈正相关的资料达到方差齐的要求。数据转换的常用方法平方根反正弦变换(arcsine trasformation of square root)将原始数据X的平方根反正弦作为分析变量平方根反正弦变换的用途:使总体率较小(70%)的二项分布资料达到正态或方差齐的要求。三角函数转换有范围限制,在-1到+1范围之内的数值才能进行转换。如成活率、浓度(小数)、相对生长率(小数)SPSSSPSS如何实现数据转化如何实现数据转化 第二章对数 TransformCompute过程 目标变量框(Traget)取要转换后生成的新

22、变量名字 表达式框(Numeric Express)中如下设置:对数:LN(原始变量名)点击OK完成平方根 TransformCompute过程 目标变量框(Traget)取要转换后生成的新变量名字 表达式框(Numeric Express)中如下设置:对数:SQRT(原始变量名)点击OK完成平方根反正弦 TransformCompute过程 目标变量框(Traget)取要转换后生成的新变量名字 表达式框(Numeric Express)中如下设置:反正弦:ARSIN(SQRT(原始变量名)点击OK完成 举例应用 The relative growth rate(RGR)for each me

23、thod was calculated from the following expression.RGR=ln(M2)-ln(M1)/(t2-t1)where ln(M2)and ln(M1)denote the mean ln-transformed plant dry mass at time t1 and t2,respectively.Gonzlez-Rodrguez V,Navarro-Cerrillo RM,and Villar R.2011.Artificial regeneration with Quercus ilex L.and Quercus suber L.by di

24、rect seeding and planting in southern Spain.Annals of Forest Science,68:637-646.描述Data were analyzed statistically using SPSS v.18(SPSS Inc.,Chicago,IL,USA).The explore function of SPSS was used to examine data for normality,and percent root biomass and percent EMF colonization were arcsine transfor

25、med prior to analyses(Kleczewski et al.2012).Kleczewski NM,Herms DA,Bonello P.2012.Nutrient and water availability alter belowground patters of biomass allocation,carbon partitioning,and ectomycorrhizal abundance in Betula nigra.Tree,26:525-533.第七节第七节 t t检验检验第二章T检验,亦称检验,亦称student t检验(检验(Students t t

26、est),主要用于样),主要用于样本含量较小(例如本含量较小(例如n30),),总体标准差总体标准差未知的未知的正态分布正态分布资料。资料。t t检验是戈斯特为了观测酿酒质量而发明的。戈斯特在位于都柏林的健力士检验是戈斯特为了观测酿酒质量而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家,基于酿酒厂担任统计学家,基于Claude GuinnessClaude Guinness聘用从牛津大学和剑桥大学出聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策。戈斯特于策。戈斯特于1908190

27、8年在年在BiometrikaBiometrika上公布上公布t t检验,但因其老板认为其为商业检验,但因其老板认为其为商业机密而被迫使用笔名(学生)。机密而被迫使用笔名(学生)。第七节第七节 t t检验检验第二章t检验前,首先利用检验前,首先利用explore进行判断数据是否满足正态、方差进行判断数据是否满足正态、方差齐次性条件,满足即可进行齐次性条件,满足即可进行t检验;若不满足,则需将数据进行检验;若不满足,则需将数据进行转换,然后再次利用转换,然后再次利用explore进行判断是否满足,满足后才能进行判断是否满足,满足后才能进行进行t检验;如果数据转换后实在无法条件,则进行非参数检验。

28、检验;如果数据转换后实在无法条件,则进行非参数检验。非参数检验非参数检验单样本检验:单样本检验:Wilcoxon符号秩检验符号秩检验两配对样本检验:两配对样本检验:Wilcoxon符号秩检验符号秩检验两独立样本检验:两独立样本检验:Mann-Whitney U检验检验第七节第七节 t t检验检验第二章单总体单总体t检验:检验一个样本平均数与一个已知的总体平均数的检验:检验一个样本平均数与一个已知的总体平均数的差异是否显著。差异是否显著。yytn :样本平均数 :整体平均数 :样本标准差 :样本数量查t表 判断显著性yyn如:全国大学生英语四级平均成绩为如:全国大学生英语四级平均成绩为6666分

29、,北林分,北林20102010级林学级林学1 1班参加英语班参加英语四级考试的人数为四级考试的人数为2525人,平均成绩为人,平均成绩为7575分,标准差为,该班级学生英语分,标准差为,该班级学生英语成绩是否与全国成绩存在显著差异?成绩是否与全国成绩存在显著差异?第七节第七节 t t检验检验第二章双总体双总体t检验:相关样本(配对)、独立样本。检验:相关样本(配对)、独立样本。相关样本平均数差异的显著性检验:用于检验匹配而成的两组被试获相关样本平均数差异的显著性检验:用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情得的数据或同组被试在不同条件下所获得的数

30、据的差异性,这两种情况组成的样本即为相关样本。况组成的样本即为相关样本。独立样本平均数的显著性检验:各实验处理组之间毫无相关存在,即独立样本平均数的显著性检验:各实验处理组之间毫无相关存在,即为独立样本。该检验用于检验两组非相关样本被试所获得的数据的差为独立样本。该检验用于检验两组非相关样本被试所获得的数据的差异性。异性。第七节第七节 t t检验检验(双总体检验双总体检验-配对样本配对样本)第二章为检验人对某品牌酒饮用清晰度的影响,随机选取8个人,分别测定饮用该酒前后的清晰度,数据如下。样本样本12345678饮用前清晰度2325262821282725饮用后清晰度12151611131714

31、17第七节第七节 t t检验检验(双总体检验双总体检验-配对样本配对样本)配对样本配对样本t t检验实际上是先求出每对观测值之差值,对差值检验实际上是先求出每对观测值之差值,对差值变量求均值。检验配对变量均值之间差异是否显著。其实变量求均值。检验配对变量均值之间差异是否显著。其实质检验的假设,是差值变量的均值与零均值之间差异的显质检验的假设,是差值变量的均值与零均值之间差异的显著性。著性。如果差值变量为如果差值变量为x x,差值变量的均值为,差值变量的均值为 ,样本观测数为,样本观测数为n n,差值变量的标准差为差值变量的标准差为S S,差值变量的均值标准误为,差值变量的均值标准误为 ,配,配

32、对样本对样本t t检验的检验的t t值计算公式为值计算公式为 第二章0 xxtSxSSnxxS第七节第七节 t t检验检验(双总体检验双总体检验-配对样本配对样本)SPSS实现 建立数据结构:两个变量分别在不同列 选择菜单Analyze-Compare Means-Paired Samples T Tests 选择一对或若干对检测变量到Paired Variables 选择Options 第二章第七节第七节 t t检验检验(双总体检验双总体检验-独立样本独立样本)两个平均数差异是否显著:t检验 第二章12dyytS:参数误差dS1112dSSnn2212()()122yyyySnnn:样本观测

33、数自由度 d.f.=(n1-1)+(n2-1)查t表 判断显著性例例分析耕地与荒地土壤中微生物数量各8次,它们的原始测量值、标准差、平均值分别为:两个处理的平均值是否有显著差异?SPSS实现实现Step 1数表结构!Step 2Step 4点击“Group Variable”点击“Define Groups”Step 3Step 5在Group 1、2中分别输入分类变量点击ContinueStep 6Step 7点击 OKRobert and Lindgren.2006.Relationships between root form and growth,stability,and morta

34、lity in planted versus naturally regenerated lodgepole pine in north-central British Columbia.Canadian Journal of Forest Research,36:2642-2653.练习:笔算与练习:笔算与SPSS实现实现分析耕地与荒地土壤中微生物数量分别为8次和10次,它们的原始测量值分别为:(1)两组数据是否存在可疑值,正态性及齐次性判断;(2)计算微生物数量在不同土壤中的变异系数;(3)运用t检验判断两个处理的平均值是否有显著差异;(4)尝试试用标准差法、极差法和最大值法对上述数据进行标准化处理。春季将5种规格不同的苗木按照完全随机区组试验进行造林,分为3个区组,10月末待苗木进入休眠后调查苗木高度,见下表。试用t检验分析,判断10月末苗高是否存在显著差异。肥料 区组 1 2 3 A 89.0 90.3 89.0 B 75.3 78.1 68.5 C 56.5 65.3 59.9 D 45.4 50.5 44.8 E 40.0 46.5 40.8

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!