卫统方差分析课件
《卫统方差分析课件》由会员分享,可在线阅读,更多相关《卫统方差分析课件(84页珍藏版)》请在装配图网上搜索。
1、应用条件的检查 1、独立性、独立性:在实验设计阶段应当保证随机:在实验设计阶段应当保证随机抽样真正得到实施,避免原始资料存在信抽样真正得到实施,避免原始资料存在信息重叠,这样才能保证变异能够按照模型息重叠,这样才能保证变异能够按照模型表达式那样具有可加性。表达式那样具有可加性。2、正态性、正态性正态性检验正态性检验 analyze-descriptive statisticsexploreplotsnormarlity tests 正态性得不到满足时,结论不受太大影正态性得不到满足时,结论不受太大影响,方差分析对正态性的要求是稳健的响,方差分析对正态性的要求是稳健的 3、方差齐性、方差齐性(H
2、omogeneity of variance)用方差齐性检验用方差齐性检验Levene方法方法 当原始资料不满足方差分析的要求时,除了求当原始资料不满足方差分析的要求时,除了求助于非参数检验方法外,也可以考虑变量变换助于非参数检验方法外,也可以考虑变量变换(transformation):通过对原始数据的数学变换,):通过对原始数据的数学变换,使其满足或者近似满足方差分析的要求。使其满足或者近似满足方差分析的要求。各组间样本含量相差不太大时,方差轻微不齐各组间样本含量相差不太大时,方差轻微不齐仅会对方差分析的结论有少许影响。一般而言,只仅会对方差分析的结论有少许影响。一般而言,只要最大要最大/
3、最小方差之比小于最小方差之比小于3,结果都是稳定的。,结果都是稳定的。注意注意:各组在样本含量上的均衡性将会为分析计算各组在样本含量上的均衡性将会为分析计算提供极大的便利,也能在一定程度上弥补正态性或提供极大的便利,也能在一定程度上弥补正态性或方差齐性得不到满足时对检验效能所产生的影响,方差齐性得不到满足时对检验效能所产生的影响,这一点在多因素时体现得尤为明显。因此实验设计这一点在多因素时体现得尤为明显。因此实验设计时就应注意到均衡性的问题。时就应注意到均衡性的问题。实际操作中对适用条件的把握 适用条件中,对适用条件中,对独立性独立性的要求是最严的,但的要求是最严的,但除了重复测量等特殊情况外
4、,该条件一般都除了重复测量等特殊情况外,该条件一般都可以满足。可以满足。对对正态性和方差齐性正态性和方差齐性在不同情况下的考虑:在不同情况下的考虑:1、单因素方差分析、单因素方差分析 由于模型有一定的稳健性,只要因变由于模型有一定的稳健性,只要因变量分布不是明显偏态,分析结果一般都是量分布不是明显偏态,分析结果一般都是较稳定的。较稳定的。至于方差齐性,在单因素方差分析中,至于方差齐性,在单因素方差分析中,如果各组例数相同(均衡),或总体呈正如果各组例数相同(均衡),或总体呈正态分布,则方差分析模型对方差略微不齐态分布,则方差分析模型对方差略微不齐有一定的耐受性,只要最大与最小方差之有一定的耐受
5、性,只要最大与最小方差之比小于比小于3,分析结果都是稳定的。,分析结果都是稳定的。2、单元格内无重复数据的方差分、单元格内无重复数据的方差分析析 以配伍设计的方差分析最为典型,此时以配伍设计的方差分析最为典型,此时不需要考虑正态性和方差齐性问题,原因不需要考虑正态性和方差齐性问题,原因在于正态性和方差齐性的考察是以单元格在于正态性和方差齐性的考察是以单元格为单位的,此时每个格子只有一次试验,为单位的,此时每个格子只有一次试验,当然没法分析。当然没法分析。但不是说可以完全忽视这两个条件。但不是说可以完全忽视这两个条件。如果根据专业知识认为可能在不同单元格如果根据专业知识认为可能在不同单元格内正态
6、性、方差齐性有问题,则应避免使内正态性、方差齐性有问题,则应避免使用这种无重复数据的设计方案。用这种无重复数据的设计方案。3、有重复数据的多元素方差分析 由于单元格内样本数目往往比较少,由于单元格内样本数目往往比较少,很难检验出差别,另一方面,也可能因为很难检验出差别,另一方面,也可能因为只是极个别单元格方差不起而导致检验不只是极个别单元格方差不起而导致检验不能通过。根据实际经验,极端值的影响远能通过。根据实际经验,极端值的影响远大于方差齐性等问题的影响,因此实际分大于方差齐性等问题的影响,因此实际分析中可以直接考察因变量的分布情况,如析中可以直接考察因变量的分布情况,如分布不是明显偏态,不存
7、在极端值,则一分布不是明显偏态,不存在极端值,则一般而言方差齐性和正态性不会有太大问题。般而言方差齐性和正态性不会有太大问题。因此,在多因素方差分析中,方差齐性往因此,在多因素方差分析中,方差齐性往往只限于理论探讨。往只限于理论探讨。one-way ANOVA 过程 1、能进行单因素方差分析能进行单因素方差分析 2、根据各样本是否方差齐性,分为两类不、根据各样本是否方差齐性,分为两类不同均数两两比较的检验方法同均数两两比较的检验方法 3、还能进行单因素不同水平均数的各种多、还能进行单因素不同水平均数的各种多项式模型趋势检验。项式模型趋势检验。Compare meansone-way ANOVA
8、 例8-1 一、变量设置 二、输入数据三、正态性检验 Analyzedescriptive statisticsexploreplots正态性检验结果:服从正态性4、方差分析(包含方差齐性检验)analyzecompare meansone way ANOVAContrasts对话框Post Hoc对话框:均数两两比较按钮方差齐性方差齐性方差不齐方差不齐Options对话框(描述、方差齐性检验)结果:1、统计描述:样本含量、均数、标准差、标准误、均数可信区间、最小值、最大值2、方差齐性检验结果3、单因素方差分析结果4、两种方法的两两比较结果SNK法两两比较单因素方差分析方法二:analyzeg
9、eneral linear modelunivariate第二节 随机区组设计资料的多因素方差分析 又称为配伍组设计,是配对设计的扩又称为配伍组设计,是配对设计的扩展,也可看成是展,也可看成是1:m匹配设计。具体做法匹配设计。具体做法是:是:先按影响试验结果的非处理因素(如先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)性别、体重、年龄、职业、病情、病程等)相同或相近,将受试对象配成相同或相近,将受试对象配成b个区组个区组(block,配伍组,配伍组),再分别将各区组内的,再分别将各区组内的k个受试对象随机分配到各处理或对照组。个受试对象随机分配到各处理或对照组。其区组因
10、素可以是第二个处理因素,也可其区组因素可以是第二个处理因素,也可以是一种非处理因素。以是一种非处理因素。总变异的分解 处理变异(纵向处理变异(纵向3组间差异)组间差异)=处理作用处理作用+随机误差随机误差 总变异总变异 区组变异(横向区组变异(横向10组间差异)组间差异)=区组作用区组作用+随机误差随机误差 随机误差随机误差 数理统计证明:数理统计证明:误误差差区区组组处处理理总总误误差差区区组组处处理理总总SSSSSSSS步骤 一、变量设置 二、输入数据 三、三、analyzegeneral linear modelunivariate (普通线性模型)(普通线性模型)(单因(单因变量)变量
11、)Univariate过程过程 可进行双因素和多因素方差分析,协方差分析和可进行双因素和多因素方差分析,协方差分析和线性回归分析。线性回归分析。适用条件:适用条件:1、各样本是相互独立的随机样本、各样本是相互独立的随机样本 2、各样本来自正态总体、各样本来自正态总体 3、各样本的总体方差齐同、各样本的总体方差齐同 4、单个应变量(、单个应变量(Univariate),为连续型变量。),为连续型变量。5、单个或以上的因素(、单个或以上的因素(factor),它为分类变量。),它为分类变量。6、单个或以上的协变量(、单个或以上的协变量(covariate),为连续),为连续型变量。型变量。方差分析
12、中,可以作每个因素的主效方差分析中,可以作每个因素的主效应和因素间的交互效应分析,各个固定因应和因素间的交互效应分析,各个固定因素不同水平均数的两两比较和不同水平均素不同水平均数的两两比较和不同水平均数的多项式模型趋势检验。数的多项式模型趋势检验。在线性回归中,可以作直线回归和多在线性回归中,可以作直线回归和多元线性回归分析。元线性回归分析。界面介绍 Fixed factor:固定因素,:固定因素,指的是该因素在指的是该因素在样本中所有可能的水平都出现了,换言之,样本中所有可能的水平都出现了,换言之,该因素的所有可能水平仅此几种,针对该该因素的所有可能水平仅此几种,针对该因素而言,从样本的分析
13、结果中就可以得因素而言,从样本的分析结果中就可以得知所有水平的状况,无须进行外推。知所有水平的状况,无须进行外推。Random factor:随机因素,:随机因素,指的是该因指的是该因素所有可能的取值在样本中没有都出现,素所有可能的取值在样本中没有都出现,或不可能都出现。如调查全国各城市的某或不可能都出现。如调查全国各城市的某项指标,抽样调查只能调查其中一部分。项指标,抽样调查只能调查其中一部分。许多时候,不容易判断,区别两者的并许多时候,不容易判断,区别两者的并非是该因素本身的特性,而是我们分析的非是该因素本身的特性,而是我们分析的目的。假如将其看成是固定因素,结论就目的。假如将其看成是固定
14、因素,结论就不应当外推到为出现的水平中去,否则,不应当外推到为出现的水平中去,否则,应当按随机因素来分析。应当按随机因素来分析。Model 对话框Contrasts对话框Profile plots对话框两两比较对话框Options对话框例8-2两两比较结果(LSD法)两两比较结果(SNK法)区组间两两比较第三节 析因设计 例8-3 1、变量设置2、输入数据3、analyzegeneral linear modelunivariate第四节 重复测量设计3、analyzegeneral linear modelrepeated measuresWithin-subject factor-受试者内
15、因素,用于区分重复测量次数然后,点击defineOptions对话框先输出了重复测量的变量名因变量的描述性统计因变量的描述性统计球对称检验球对称检验:p=0.003,拒绝,拒绝H0,不满足,不满足球对称性,应对自由度进行校正球对称性,应对自由度进行校正Mauchlys test of sphericity 如果满足球对称,则看下面的一元分析结果如果满足球对称,则看下面的一元分析结果(tests of within-subjects effects)中)中 sphericity assumed所在行的统计量及所在行的统计量及p值。值。如果不满足,则看上面的多元分析结果如果不满足,则看上面的多元分
16、析结果(multivariate tests)或一元分析结果中的校正)或一元分析结果中的校正值。值。在在tests of within-subjects effects中,中,spss提提供三种校正方法,分别为供三种校正方法,分别为greenhouse-geisser、huynh-feldt,lower-bound.但不服从球形假设时,如果校正的一元分析结果但不服从球形假设时,如果校正的一元分析结果与多元分析结论不一致,应该看多元分析结果与多元分析结论不一致,应该看多元分析结果不满足球对称性时,看多元分析结果不满足球对称性时,看多元分析结果:四个多元方差四个多元方差分析的统计量:分析的统计量:
17、pillais Trace 最为稳健,当最为稳健,当4个结论个结论不一致时,推荐他为最终结论。不一致时,推荐他为最终结论。Multivariate tests 输出了对受试者内因输出了对受试者内因素(即时间因素),受试者内因素与一个素(即时间因素),受试者内因素与一个自变量(自变量(group)的一级交互作用的多元)的一级交互作用的多元方差分析统计学检验结果。方差分析统计学检验结果。说明不同时间的平均细胞数不全相同。但说明不同时间的平均细胞数不全相同。但分组与时间不拒绝分组与时间不拒绝H0,认为无交互作用。,认为无交互作用。即还不能认为受试对象类别与时间有交互即还不能认为受试对象类别与时间有交
18、互作用。作用。一元分析结果:受试对象内(时间、交互效应)的效应检验对各次重复测量结果进行线形(对各次重复测量结果进行线形(linear)、二次方曲线)、二次方曲线(qudaratic)、三次方()、三次方(cubic)等拟和,本例,时间)等拟和,本例,时间因素的各组均数成线性趋势,交互效应的各组均数不呈因素的各组均数成线性趋势,交互效应的各组均数不呈任何趋势。任何趋势。课后练习二、1、2、3、4、5、6Post Hoc按钮:均数两两比较按钮 在在Equal Variances Assumed框体内框体内有有14种两两比较的方法!这并不是说两两种两两比较的方法!这并不是说两两比较方法如百花齐放般
19、衬托了统计学的欣比较方法如百花齐放般衬托了统计学的欣欣向荣,相反却说明目前为止仍然没有什欣向荣,相反却说明目前为止仍然没有什么令人完全信服的方法或者没有什么统一么令人完全信服的方法或者没有什么统一的解决之道。的解决之道。多重比较的类型多重比较的类型 1、计划化的多重比较、计划化的多重比较(contrast对话框进行对话框进行)即在收集数据之前便决定了要通过多重即在收集数据之前便决定了要通过多重比较来考察多个组与某个特定组间的差别或者比较来考察多个组与某个特定组间的差别或者某几个特定组间彼此的差别某几个特定组间彼此的差别 2、非计划化的多重比较、非计划化的多重比较(post-hoc compar
20、isons对话框进行对话框进行)只有在方差分析得到有统计学意义的只有在方差分析得到有统计学意义的F 值后才有必要进行,是一种探索性的分析。值后才有必要进行,是一种探索性的分析。专用的两两比较方法 针对比较目的和应用条件的不同,各种针对比较目的和应用条件的不同,各种多重比较方法有其不同的侧重点。比较方法:多重比较方法有其不同的侧重点。比较方法:1、LSD法法(least-significance-difference Method,最小显著差法,最小显著差法):最简单的比较):最简单的比较方法之一。只是方法之一。只是t检验的一个简单变形,并未检验的一个简单变形,并未对检验水准作任何校正,只是计算
21、了一个更对检验水准作任何校正,只是计算了一个更为稳健的标准误。一般为稳健的标准误。一般用于计划好的多重比用于计划好的多重比较。较。由于单次比较的检验水准仍为由于单次比较的检验水准仍为,因此,因此可以认为可以认为LSD法是最灵敏的。比其他方法容法是最灵敏的。比其他方法容易得出有差异的结论。易得出有差异的结论。2、sidak法:即sidak校正在LSD法上的应用,sidak校正认为各次比较的不犯一类错误与总的不犯一类错误概率间的关系为累乘,通过sidak校正降低每次两两比较的一类错误率,以达到最终整个比较的一类错误率为的目的。每一次的目的。每一次检验用的检验用的ij 对于相同的比较,有对于相同的比
22、较,有 C为比较次数,显然,为比较次数,显然,sidak法要比LSD法保守得多。cij1)1(1cLSDsidakpp)1(1 3、Bonferroni法:即法:即Bonferroni校正在校正在LSD法上的法上的应用,认为各次比较的一类错误一总的一类错误概率应用,认为各次比较的一类错误一总的一类错误概率间的关系是累加的(课本上第三种方法),共进行间的关系是累加的(课本上第三种方法),共进行m(或(或c)次两两比较,)次两两比较,每一次检验用的每一次检验用的 对于相同的比较,对于相同的比较,一般而言,一般而言,Bonferroni法要比法要比sinak法更为保守一些。法更为保守一些。不容易得出
23、有差异的结论。不容易得出有差异的结论。)(mcppLSDBonferroni)(cm 4、Scheffe法:与一般的多重比较不同,法:与一般的多重比较不同,实质是对多组均数间的线性组合是否为实质是对多组均数间的线性组合是否为0进进行假设检验(即所谓的行假设检验(即所谓的Contrast)多用于)多用于进行比较的两组间样本含量不等时,详见进行比较的两组间样本含量不等时,详见后面相关章节后面相关章节 5、Dunnett法:常用于多个实验组于一个法:常用于多个实验组于一个对照组间的比较,因此在指定对照组间的比较,因此在指定Dunnett法时,法时,还应当指定对照组。还应当指定对照组。另外一大类方法:
24、目的在于寻找同质亚组另外一大类方法:目的在于寻找同质亚组的检验方法,常见的有的检验方法,常见的有 1、S-N-K法:法:全称为全称为student-Newman-Keuls法。法。实质上是根据预先指定的准则将各组均数实质上是根据预先指定的准则将各组均数分为多个子集,利用分为多个子集,利用studentized Range分分布来进行假设检验,并根据所要检验的均布来进行假设检验,并根据所要检验的均数的个数调整总的一类错误概率不超过数的个数调整总的一类错误概率不超过。2、Tukey法:此法要求样本含量相同,利法:此法要求样本含量相同,利用用studentized range分布来进行各组均数分布来
25、进行各组均数间的比较,控制所有比较中最大的一类错间的比较,控制所有比较中最大的一类错误的概率不超过误的概率不超过。3、Duncan法法:思路与:思路与S-N-K法相似,只不法相似,只不过检验统计量服从的是过检验统计量服从的是Duncans Multiple range 分布。分布。其他方法并不常用。不再阐述。其他方法并不常用。不再阐述。此外,在各组方差不齐时,此外,在各组方差不齐时,spss在在Equal Variance Not Assumed 框组中也框组中也给出了给出了4种方法。种方法。但从方法的接受程度和结果的稳健性但从方法的接受程度和结果的稳健性讲,希望大家尽量不要在方差不齐时进行讲
26、,希望大家尽量不要在方差不齐时进行方差分析甚至两两比较,求助于变量变换方差分析甚至两两比较,求助于变量变换或者非参数检验往往更可靠。或者非参数检验往往更可靠。两两比较方法的选择策略两两比较方法的选择策略 1、如两个均数间的比较是独立的,或者虽、如两个均数间的比较是独立的,或者虽有多个样本均数,但事先已计划好要做某有多个样本均数,但事先已计划好要做某几对均数的比较,则不管方差分析的结果几对均数的比较,则不管方差分析的结果如何,均应进行比较。一般采用如何,均应进行比较。一般采用LSD法或法或Bonferroni法。法。2、如果事先未计划进行多重比较,在方差、如果事先未计划进行多重比较,在方差分析得
27、到有统计学意义的分析得到有统计学意义的F之后,可以利用之后,可以利用多重比较进行探索性数据分析。根据研究多重比较进行探索性数据分析。根据研究目的和样本性质选择方法。目的和样本性质选择方法。多个样本均数的全面比较,可以选用多个样本均数的全面比较,可以选用S-N-K检验。检验。多个试验组和一个对照组的比较时多个试验组和一个对照组的比较时采用采用Dunnett法;法;任意两组之间比较且各组样本含量又相同时,可任意两组之间比较且各组样本含量又相同时,可以选用以选用Tukey法;法;若样本含量彼此不同时,可以采用若样本含量彼此不同时,可以采用Scheffe法。法。若是事先未计划进行多重比较,且方差分析未
28、检若是事先未计划进行多重比较,且方差分析未检出差别,此时不应当进行多重比较。出差别,此时不应当进行多重比较。事先未计划的多重比较,组建的差别只是一种提事先未计划的多重比较,组建的差别只是一种提示,要确认这种差别最好重新设计实验。示,要确认这种差别最好重新设计实验。有时候,研究者在实验设计之初就有比较特定有时候,研究者在实验设计之初就有比较特定几组均数的考虑,这种比较往往不像几组均数的考虑,这种比较往往不像post Hoc那样需要对几乎所有的组合进行比较,所那样需要对几乎所有的组合进行比较,所以在分析时不需要对检验水准或统计量进行太以在分析时不需要对检验水准或统计量进行太多修正。多修正。Planned Comparison,主要是通过,主要是通过one-way ANOVA对话框中的对话框中的contrast按钮所对应按钮所对应的功能来实现的。的功能来实现的。如果组数较少,如如果组数较少,如3组、组、4组,比较方法的选组,比较方法的选择可能结果差异不大,如果组数很多,应慎重择可能结果差异不大,如果组数很多,应慎重选择比较方法。选择比较方法。
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。