4第四章多个样本均数比较的方差分析ppt课件

上传人:仙*** 文档编号:187476715 上传时间:2023-02-14 格式:PPT 页数:85 大小:885.50KB
收藏 版权申诉 举报 下载
4第四章多个样本均数比较的方差分析ppt课件_第1页
第1页 / 共85页
4第四章多个样本均数比较的方差分析ppt课件_第2页
第2页 / 共85页
4第四章多个样本均数比较的方差分析ppt课件_第3页
第3页 / 共85页
资源描述:

《4第四章多个样本均数比较的方差分析ppt课件》由会员分享,可在线阅读,更多相关《4第四章多个样本均数比较的方差分析ppt课件(85页珍藏版)》请在装配图网上搜索。

1、第四章第四章 多个样本均数比较多个样本均数比较 的方差分析的方差分析Analysis of Variance,ANOVA Analysis of Variance,ANOVA Content Content1.Basal ideal and application 1.Basal ideal and application conditionsconditions2.ANOVA of completely random designed 2.ANOVA of completely random designed data data 3.ANOVA of randomized block des

2、igned 3.ANOVA of randomized block designed datadata4.ANOVA of latin square designed data 4.ANOVA of latin square designed data 5.ANOVA of cross-over designed data 5.ANOVA of cross-over designed data 6.Multiple comparison of sample means6.Multiple comparison of sample means7.Bartlett test and Levene

3、test 7.Bartlett test and Levene test 第一节第一节 方差分析的基本思想方差分析的基本思想及其应用条件及其应用条件目的:推断多个总体均数是否有差别。目的:推断多个总体均数是否有差别。也可用于两个也可用于两个 方法:方差分析,即多个样本均数比较方法:方差分析,即多个样本均数比较 的的F检验。检验。基本思想:根据资料设计的类型及研究基本思想:根据资料设计的类型及研究目的,可将总变异分解为两个或多个部目的,可将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用分,每个部分的变异可由某因素的作用来解释。通过比较可能由某因素所至的来解释。通过比较可能由某因素所至

4、的变异与随机误差,即可了解该因素对测变异与随机误差,即可了解该因素对测定结果有无影响。定结果有无影响。应用条件:应用条件:总体总体正态且方差相等正态且方差相等 样本样本独立、随机独立、随机设计类型:设计类型:完全随机设计资料的方差分析完全随机设计资料的方差分析随机区组设计资料的方差分析随机区组设计资料的方差分析拉丁方设计资料的方差分析拉丁方设计资料的方差分析两阶段交叉设计资料的方差分析两阶段交叉设计资料的方差分析2221122(,),(,),(,)ggNNN表 4-1 g 个处理组的试验结果 处理分组 测量值 统计量 1 水平 X11 X12 X1j 1nX1 n1 1X S1 2 水平 X2

5、1 X22 X2j 2nX2 n2 2X S2 g 水平 Xg1 Xg2 Xgj ggnX ng gX Sg 完全随机设计资料的方差分析的基本思想完全随机设计资料的方差分析的基本思想 合计合计 N S :第第i个处理组第个处理组第j个观察结果个观察结果XijXijXw 记总均数为 ,各处理组均w 数为 ,总例数为Nw nl+n2+ng,g为处理组数。11/ingijijXXN1/iniijijXXn w1.1.总变异总变异:全部测量值大小不同,全部测量值大小不同,这种变异称为总变异。这种变异称为总变异。w总变异的大小可以用离均差平方总变异的大小可以用离均差平方和和(sum of squares

6、 of(sum of squares of deviations from meandeviations from mean,SS)SS)表表示,即各测量值示,即各测量值XijXij与总均数差与总均数差值的平方和,记为值的平方和,记为SSSS总。总。w总变异总变异SSSS总反映了所有测量值之总反映了所有测量值之间总的变异程度。间总的变异程度。计算公式为计算公式为2212111,iinnggi ji jijNi jijijXCS SXXXC总221 1,()()ingNijiji jijXXCNN 其中:其中:1N总w2组间变异:组间变异:各处理组由于接受处各处理组由于接受处理的水平不同,各组的

7、样本均数理的水平不同,各组的样本均数(i1,2,g)也大小不等,这种变异也大小不等,这种变异称为组间变异。称为组间变异。w其大小可用各组均数与总均数的离均其大小可用各组均数与总均数的离均差平方和表示,记为差平方和表示,记为SS组间组间。21211()()inijjggiiiiiXSSn XXCn组间1g组间计算公式为计算公式为w Ng组 内211()ingijiijSSXX组内SSSSSS总组间组内总组间组内三种变异的关系:三种变异的关系:SSMSSSMS组间组间组间组内组内组内 均方差,均方均方差,均方(mean square(mean square,MS)MS)。检验统计量:检验统计量:假

8、设假设 ,那么,那么 都为都为随机误差随机误差 的估计,的估计,F F值应接近于值应接近于1 1。假设假设 不全相等,不全相等,F F值将明显大于值将明显大于1 1。用用F F界值单侧界值确定界值单侧界值确定P P值。值。12,MSFMS组间组间组内组内12g,MSMS组间组内212,g 第二节第二节完全随机设计资料的方差分析完全随机设计资料的方差分析 (completely random design)是采用完全随机化的分组方法,将全部试验对象分配到g个处理组水平组),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。一、完全随机设计一、完全随机设计

9、 例4-1 某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名患者,采用完全随机设计方法将患者等分为4组进行双盲试验。问如何进行分组?(1 1完全随机分组方法:完全随机分组方法:1.编号:编号:120名高血脂患者从名高血脂患者从1开始到开始到120,见表见表4-2第第1行行P72););2.取随机数字:从附表取随机数字:从附表15中的任一行任中的任一行任一列开始,如第一列开始,如第5行第行第7列开始,依次列开始,依次读取三位数作为一个随机数录于编号读取三位数作为一个随机数录于编号下,见表下,见表4-2第第2行;行;表4-2 完全随机设计分组结果 编 号 1 2 3 4 5 6

10、7 8 9 10 119 120 随机数 260 873 373 204 056 930 160 905 886 958 220 634 序 号 24 106 39 15 3 114 13 109 108 117 16 75 分组结果 甲 丁 乙 甲 甲 丁 甲 丁 丁 丁 甲 丙 3.3.编序号:将全部随机数字从小到大编序号:将全部随机数字从小到大(数据相同则按数据相同则按先后顺序编序号,见表先后顺序编序号,见表4-24-2第第3 3行。行。4.4.事先规定:序号事先规定:序号1-301-30为甲组,序号为甲组,序号31-6031-60为乙组,序为乙组,序号号61-9061-90为丙组,序号

11、为丙组,序号91-12091-120为丁组,见表为丁组,见表4-24-2第四行。第四行。(2 2统计分析方法选择:统计分析方法选择:1.对于正态分布且方差齐同的资料,常采用对于正态分布且方差齐同的资料,常采用完全随机设计的单因素方差分析完全随机设计的单因素方差分析(one-way ANOVA)或成组资料的或成组资料的 t 检验检验g=2););2.对于非正态分布或方差不齐的资料,可进对于非正态分布或方差不齐的资料,可进行数据变换或采用行数据变换或采用Wilcoxon秩和检验。秩和检验。二、变异分解二、变异分解 表 4-4 完 全 随 机 设 计 资 料 的 方 差 分 析 表 变 异 来 源

12、自 由 度 SS M S F 总 变 异 N1 21 1ingijijXC 组 间 g1 211()inijgjiiXCn SS组 间组 间 M SM S组 间组 内 组 内 Ng SS SS总组 间 SS组 内组 内 例4-2 某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组具体分组方法见例4-1),进行双盲试验。6周后测得低密度脂蛋白作为试验结果,见表4-3。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?表表4-3 44-3 4个处理组低密度脂蛋白测量值个处理组低密度脂蛋白测量值(mmol/L)(mmol/L)三、分析

13、步骤三、分析步骤 H0:1234,即4个试验组的总体均数相等 H1:4个试验组的总体均数不全相等 0.05 按表4-4中的公式计算各离均差平方和SS、自由度、均方MS和F值。H0:即即4个试验组总体均数相个试验组总体均数相等等 H1:4个试验组总体均数不全相等个试验组总体均数不全相等 12340.052.计算检验统计量计算检验统计量:1.建立检验假设,确定检验水准建立检验假设,确定检验水准:表表4-5 完全随机设计方差分析表完全随机设计方差分析表列方差分析表列方差分析表0.053.确定确定P值,作出推断结论:值,作出推断结论:按按 水准,拒绝水准,拒绝H0,接受,接受H1,认为认为4个试验组个

14、试验组ldl-c总体均数不相等,即总体均数不相等,即不同剂量药物对血脂中不同剂量药物对血脂中ldl-c降低影响有差降低影响有差别。别。留意:留意:方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,可进行多个均数间的多重比较见本章第六节)。当g=2时,完全随机设计方差分析与成组设计资料的t 检验等价,有 。tF第三节第三节随机区组设计资料的方随机区组设计资料的方差分析差分析一、随机区组设计一、随机区组设计配伍组设计配伍组设计(randomized block design)w 随机区组设计(randomized block design)又称为配伍

15、组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素如性别、体重、年龄、职业、病情、病程等将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。w w (1 1随机分组方法:随机分组方法:(2 2随机区组设计的特点随机区组设计的特点 随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同。区组内均衡。在进行统计分析时,将区组变异离均差平方和从完全随机设计的组内离均差平和中分离出来,从而减小组内离均差平方和误差平方和),提高了统计检验效率。例4-3 如何按随机区组设计,分配5个区组的15只小白鼠接受甲、乙、

16、丙三种抗癌药物?分组方法:先将小白鼠按体重编号,体重相近的3只小白鼠配成一个区组,见表4-6。在随机数字表中任选一行一列开始的2位数作为1个随机数,如从第8行第3列开始纪录,见表4-6;在每个区组内将随机数按大小排序;各区组中内序号为1的接受甲药、序号为2的接受乙药、序号为3的接受丙药,分配结果见表4-6。(3 3统计方法选择:统计方法选择:1.正态分布且方差齐同的资料,应采用两因正态分布且方差齐同的资料,应采用两因素处置、配伍方差分析素处置、配伍方差分析(two-way ANOVA)或配对或配对t检验检验g=2););2.当不满足方差分析和当不满足方差分析和t检验条件时,可对数检验条件时,可

17、对数据进行变换或采用随机区组设计资料的据进行变换或采用随机区组设计资料的Friedman M检验。检验。处理因素(g 个水平)区组 编号 1 2 3 g 1 X11 X21 X31 Xg1 2 X12 X22 X32 Xg2 j X1j X2j X3j Xgj n 1nX 2nX 3nX gnX 表4-7 随机区组设计的试验结果 二、变异分解二、变异分解(1)总变异:反映所有观察值之间的变异总变异:反映所有观察值之间的变异,记为记为SS总。总。(2)处理间变异:由处理因素的不同水平作用和随机误差处理间变异:由处理因素的不同水平作用和随机误差产生的变异,记为产生的变异,记为SS处理。处理。(3)

18、区组间变异:由不同区组作用和随机误差产生的变异,区组间变异:由不同区组作用和随机误差产生的变异,记为记为SS区组区组.(4)误差变异:完全由随机误差产生的变异,记为误差变异:完全由随机误差产生的变异,记为SS误差。误差。对总离均差平方和及其自由度的分解,有对总离均差平方和及其自由度的分解,有:SSSSSSSS处理区组总误差处理区组总误差 表4-8 随机区组设计资料的方差分析表 三、分析步骤三、分析步骤 例4-4 某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物具体分配方法见例4-3)

19、,以肉瘤的重量为指标,试验结果见表4-9。问三种不同的药物的抑瘤效果有无差别?区组 A 药 B 药 C 药 1gijiX 1 0.82 0.65 0.51 1.98 2 0.73 0.54 0.23 1.50 3 0.43 0.34 0.28 1.05 4 0.41 0.21 0.31 0.93 5 0.68 0.43 0.24 1.35 1nijjX 3.07 2.17 1.57 6.81()ijX iX 0.614 0.434 0.314 0.454()X 21nijjX 2.0207 1.0587 0.5451 3.6245 2()ijX 表表4-9 4-9 不同药物作用后小白鼠肉瘤重量

20、不同药物作用后小白鼠肉瘤重量g g)H0:,即三种不同药物作用后,即三种不同药物作用后 小白鼠肉瘤重量的总体均数相等小白鼠肉瘤重量的总体均数相等 H1:三种不同药物作用后小白鼠肉瘤重:三种不同药物作用后小白鼠肉瘤重 量的总体均数不全相等量的总体均数不全相等1230.052113.62453.0917=0.5328gnijijSSXC总22221111()(3.072.171.57)3.0917 0.22805gnijijSSXCn 处理2211()/(6.81)/153.0917gnijijCXN 211222221()1 (1.981.501.050.931.35)3.09170.22823

21、gnijjiSSXCg 区组 据据 1=2、2=8查附表查附表3的的F界值表,得界值表,得 在在=0.05的水准上,拒绝的水准上,拒绝H0,接受,接受H1,认为三种不同,认为三种不同药物作用后小白鼠肉瘤重量的总体均数不全相等,即药物作用后小白鼠肉瘤重量的总体均数不全相等,即不同药物的抑瘤效果有差别。同理可对区组间的差别不同药物的抑瘤效果有差别。同理可对区组间的差别进行检验。进行检验。0.01(2,80.05(2,8)0.01(2,8)4.46,8.65,11.88,0.01FFFFP。留意:留意:方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,

22、可进行多个均数间的多重比较见本章第六节)。当g=2时,随机区组设计方差分析与配对设计资料的t 检验等价,有 。tF 随机区组设计确定区组因素应是对试验随机区组设计确定区组因素应是对试验结果有影响的非处理因素。区组内各试验结果有影响的非处理因素。区组内各试验对象应均衡,区组之间试验对象具有较大对象应均衡,区组之间试验对象具有较大的差异为好,这样利用区组控制非处理因的差异为好,这样利用区组控制非处理因素的影响,并在方差分析时将区组间的变素的影响,并在方差分析时将区组间的变异从组内变异中分解出来。异从组内变异中分解出来。因此,当区组间差别有统计学意义时,因此,当区组间差别有统计学意义时,这种设计的误

23、差比完全随机设计小,试验这种设计的误差比完全随机设计小,试验效率得以提高。效率得以提高。第四节拉丁方设计资料的方差分析拉丁方设计资料的方差分析 第五节两阶段交叉设计资料的方差分析两阶段交叉设计资料的方差分析 第六节 多个样本均数间的多重比较多个样本均数间的多重比较 (multiple comparisonmultiple comparison)多重比较不能用两样本均数比较的多重比较不能用两样本均数比较的 t t 检验!检验!若用两样本均数比较的t 检验进行多重比较,将会加大犯类错误把本无差别的两个总体均数判为有差别的概率。例如,有4个样本均数,两两组合数为 ,若用 t 检验做6次比较,且每次比

24、较的检验水准定为=0.05,则每次比较不犯类错误的概率为10.05),6次均不犯类错误 的 概 率 为 ,这 时,总 的 检 验 水 准 变为 ,远比0.05大。因此,样本均数间的多重比较不能用两样本均数比较的 t 检验。4()626(1-0.05)61-(1-0.05)0.26适用条件:当方差分析的结果为拒绝H0,接受H1时,只说明g个总体均数不全相等。若想进一步了解哪些两个总体均数不等,需进行多个样本均数间的两两比较或称多重比较。一、一、LSD-t检验检验(least significant difference)适用范围:一对或几对在专业上有特殊适用范围:一对或几对在专业上有特殊 意义的

25、样本均数间的比较。意义的样本均数间的比较。检验统计量检验统计量t的计算公式为的计算公式为LSD,ijijXXXXtS误差11ijXXijSMSnn误差式中 MSMS误差组内L S D-t 检检 验验 公公 式式 与与 两两 样样 本本 均均数数 比比 较较 的的t 检检 验验 公公 式式 区区 别别 在在 于于 两两样样 本本 均均 数数 差差 值值 的的 标标 准准 误误ijXXS和和自自 由由 度度 的的 计计 算算 上上。留意:留意:在两样本均数比较的 t 检验公式里是用合并方差2cS来计算ijXXS,=n1+n22;LSD-t 检验是用方差分析表中的误差均方误差MS来计算ijXXS,=

26、误差。,即降血脂新药,即降血脂新药2.4g组与安慰剂组与安慰剂 组的低密度脂蛋白含量总体均数相等组的低密度脂蛋白含量总体均数相等 ,即降血脂新药即降血脂新药2.4g组与安慰剂组与安慰剂 组的低密度脂蛋白含量总体均数不等组的低密度脂蛋白含量总体均数不等=0.05降血脂新药降血脂新药2.4g2.4g组与安慰剂组的比较:组与安慰剂组的比较:02.4g0:H12.4g0:H根根 据据 例例4-2,2.4gX=2.72,0X=3.43,2.4gn=0n=30,误差MS=0.43,误误 差差=116。按按 公公 式式(4-13)和和公公式式(4-14)ijXXS=110.433030=0.17 LSD-t

27、=2.723.430.17=4.18 以以=116,t=4.18 查查附附表表 2 的的 t 界界值值表表,得得P0.001。按按0.05水水准准,拒拒绝绝 H0,接接受受 H1,有有统统计计学学意意义义。可可认认为为降降血血脂脂新新药药 2.4g 组组的的低低密密度度脂脂蛋蛋白白含含量量总总体体均均数数低低于于安安慰慰剂剂组组。新药新药4.8g组组VS安慰剂组安慰剂组:LSD-t为为-4.29 7.2g组组VS安慰剂组安慰剂组:LSD-t 为为-8.59。同理:按同理:按 水准,降血脂新药水准,降血脂新药4.8g组、组、7.2g组与安慰剂组间差别有统计学意义。组与安慰剂组间差别有统计学意义。

28、0.05二、二、Dunnett-t 检验检验 适用条件:g-1个实验组与一个对照组均数差别的多重比较,检验统计量为t,亦称t检验。式中 00iiXXXXtS0011,iX XiSM Snn 误 差误 差iX,in为第i个实验组的样本均数和样本例数;0X,0n为对照组的样本均数和样本例数。Dunnett-误差,例4-8 对例4-2资料,问高血脂患者的三个不同剂量降血脂新药组与安慰剂组的低密度脂蛋白含量总体均数是否有差别?H0:i=0,即各实验组与安慰剂组的低密度,即各实验组与安慰剂组的低密度 脂蛋白含脂蛋白含 量总体均数相等量总体均数相等H1:i 0,即各实验组与安慰剂组的低密度,即各实验组与安

29、慰剂组的低密度 脂蛋白含量总体均数不等脂蛋白含量总体均数不等=0.05根根 据据 例例4-2,2.4gX=2.72,4.8gX=2.70,7.2gX=1.97,0X=3.43,in=0n=30,误差MS=0.43,误误 差差=116。按按公公式式(4-15)和和公公式式(4-16)2.4g2.723.43110.433030t=4.18 4.8g2.703.43110.433030t=4.29 7.2g1.973.43110.433030t=8.59 Dunnett-Dunnett-Dunnett-116误差以以=116、处处理理组组数数1413Tg 查查附附表表 5的的 Dunnett-t检

30、检验验界界值值表表(双双侧侧),得得0.01/2(116)0.01/2(120)=2.98tt。2.4g0.01/2(116)tt,4.8g0.01/2(116)tt,7.2g0.01/2(116)tt,都都 得得P0.05 1,3 1.30 3 6.85 4.04 5.64 0.01 2,3 0.18 2 4.11 3.26 4.75 0.05 表4-15 多个均数两两比较值 例4-4 已求得误差MS=0.0096,8误差。各组例数均为5,有 0.0096 110.0438255ijXXS。结论:可认为结论:可认为A A药和药和B B药、药、C C药的抑瘤药的抑瘤 效果有差别,还不能认为效果

31、有差别,还不能认为B B药和药和C C药的药的抑瘤效果有差别。抑瘤效果有差别。第七节 多样本方差比较的Bartlett检验和Levene检验 在进行方差分析时要求所对比的各组即各样本的总体方差必须是相等的,这一般需要在作方差分析之前,先对资料的的方差齐性进行检验,特别是在样本方差相差悬殊时,应注意这个问题。对两样本方差进行齐性检验的方法前已介绍。本节介绍多样本也适用于两样本方差齐性检验的Bartlett检验法和Levene检验法。一、Bartlett 检验22222111(1)ln(1)ln(1)lngggciiciiiiiiSnnSnSS =g-1 式中合并方差 2211(1)(1)ggci

32、iiiiSnSn 对于完全随机设计资料,有2cS MS组内。按0.10水准,查2界值表得0.10(1)2g,若20.10。按0.10水准,不拒绝 H0;反之,若20.10(1)2g,则 P0.10。拒绝 H0,接受 H1。例 4-10 对例 4-2 资料,试分析各处理组的低密度脂蛋白值是否满足方差齐性?H0:22221234 H1:各总体方差不全相等 0.10 本例 n1=n2=n3=n4=30,g=4,各组的2iS、ln2iS见表 4-16。表4-17 例4-2的方差齐性检验表 =41=3,查 附 表 8 的2界 值 表,得0.1P0.25。按0.10水准,不拒绝 H0,还不能认为 4 个试

33、验组的低密度脂蛋白值不满足方差齐性。2(301)(0.511+0.407+0.247+0.557)0.4314(30-1)cS2(30 1)4)ln0.431(30 1)(0.6710.898 1.3910.585)=5.1011411()3(4 1)30 1(30 1)4 二、Levene 检验资料要求:可不具有正态性。资料要求:可不具有正态性。检验统计量:检验统计量:F计算公式:计算公式:21211()()(1)()igiiingijiijNgn ZZWgZZF(1)ijijiZXX (2)iijijdZXM idM为第i个样本的中位数(1,2,1,2,)iigjn。式中式中(3)ijijiZXX iX为第 i 个样本截除样本含量 10%后的均数(1,2,1,2,)iigjn。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!