协方差分析理论与案例

上传人:d****1 文档编号:145834627 上传时间:2022-08-30 格式:DOCX 页数:13 大小:106.51KB
收藏 版权申诉 举报 下载
协方差分析理论与案例_第1页
第1页 / 共13页
协方差分析理论与案例_第2页
第2页 / 共13页
协方差分析理论与案例_第3页
第3页 / 共13页
资源描述:

《协方差分析理论与案例》由会员分享,可在线阅读,更多相关《协方差分析理论与案例(13页珍藏版)》请在装配图网上搜索。

1、协方差分析理论与案例假设我们有N个个体的K个属性在T个不同时期的样本观测值,用y , it七,N,t=1,T,k=1,K表示。一般假定y的观测值是某随机实验的 结果,该实验结果在属性向量x和参数向量0下的条件概率分布为f (y|x,0)。使 用面板数据的最终目标之一就是利用获取的信息对参数0进行统计推断,譬如 常假设假定的y是关于x的线性函数的简单模型。协方差分析检验是识别样本 波动源时广泛采用的方法。方差分析:常指一类特殊的线性假设,这类假设假定随机变量y的期望值 仅与所考察个体所属的类(该类由一个或多个因素决定)有关,但不包括与回 归有关的检验。而协方差分析模型具有混合特征,既像回归模型一

2、样包含真正 的外生变量,同时又像通常的方差一样允许每个个体的真实关系依赖个体所属 的类。常用来分析定量因素和定性因素影响的线性模型为:y =a * + 0x + u ,i = 1,-,N,t = 1,-,T it it it it it从两个方面对回归系数估计量进行检验:首先,回归斜率系数的同质性; 其次,回归截距系数的同质性。检验过程主要有三步:(1)检验各个个体在不同时期的斜率和截距是否都相等;(2)检验(各个体或各时期的)回归斜率(向量)是否都相等;(3)检验各回归截距是否都相等。显然,如果接受完全同同质性假设(1),则检验步骤中止。但如果拒绝了 完全同质性性假设,则(2)将确定回归斜率

3、是否相同。如果没有拒绝斜率系数 的同质性假设,则(3)确定回归截距是否相等。(1)是从(2)、(3)分离出来 的。基本思想:在作两组或多组均数y,?,n的假设检验前,用线性回 归分析方法找出协变量X与各组Y之间的数量关系,求得在假定X相等时修定 均数,y然后用方差分析比较修正均数间的差别,这就是协方差 分析的基本思想。*协方差分析的应用条件:要求各组资料都来自正态总体,且各组的方差 相等;(t检验或方差分析的条件)各组的总体回归系数0,相等,且都不等于 0(回归方程检验)。因此,应用协方差分析前,要对资料进行方差齐性检验和 回归系数的假设检验(斜率同质性检验),只有满足上述两个条件之后才能应

4、用,否则不宜使用。各比较组协变量X与分析指标Y存在线性关系(按直线回归分析方法进行判断)。各比较组的总体回归系数P,相等,即各直线平行(绘出回归直线,看是否 平行)。协方差分析适用的资料:完全随机设计、随机区组设计、拉丁方设计、析 因设计等资料;协变量X可以仅有一个,称一元协方差分析;协变量也可以有 多个,称多元协方差分析。相关系数:r = U(X -学F乙(x -无)2 乙(y - y )2将公式右端的分子分母同除以自由度(-1),得: (x -无)(y - (n -1)乙3 -无)2,/ /(n -1) (y -1)协方差计算公式:其中: (X -元)2n - 1 是x的均方峪,它是x的方

5、差Q 2的无偏估计量;X (y y)2 ,、, 一一一n是y的均方MSy,它是y的方差Q 2的无偏估计量;3-无)(y-刃称为*与的平均的离均差的乘积和,简称均积,记为MPxy,即(x)(y) (x - x)(y - y) MPxy七 xynn 1与均积相应的总体参数叫协方差(covariance),记为COV(xy)或。统计学证明了,均积MPy是总体协方差COV(x,y)的无偏估计量,即EMPxy= COV(x,y)。于是,样本相关系数r可用均方MSx、MSy,均积MPy表示为:MPr = xMS MS相应的总体相关系数。可用x与y的总体标准差cb y,总体协方差 cov(xy)或b,表示如

6、下:均积与均方具有相似的形式,也有相似的性质。在方差分析中,一个变量 的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。统计学已 证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均 积。这种把两个变量的总乘积和与自由度按变异来源进行剖分并获得相应均积 的方法亦称为协方差分析。1. 协方差分析是将线性回归与方差分析相结合的一种分析方法;2. 把对反应变量Y有影响的因素X看作协变量,建立Y对X的线性回 归,利用回归关系把X值;3. 化为相等,再进行各组Y的修正均数间比较。修正均数是假设各协变量 取值固定在其总均数时的反应变量Y的均数。其实质是从Y的总离均差平方和(7 -

7、 f )2中,扣除协变量X对Y的回归平方和(f- f )2,对离回归平方和(Y - 7)2作进一步分解后再进行方差分析。方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变量,方 差分析数据结构:y . = u + t + e协方差分析将方差分析与回归分析结合了起来,勒方差分析数据结构:ijy = Uy +1 p e( X - u) + 协方差案例:设有k个处理、n次重复的双变量试验资料,每处理组内皆有n对观测值x、y, 则该资料为具kn对x、y观测值的单向分组资料,其数据一般模式如表10 1所 示。表1加对观测值X、y的单向分组资料的一般形式处理处理1处理2处理i处理k观测指标x yx

8、 yx yx yXnynX21y21x.y.i1i1Xk1yk1观测值X12LX22y22Xi2yi2Xk2yk2X、yj (i=1,2,.kX1jy1jX2jy2jx.y.ij7 ijXkjykjj=1,2,.n) X1ny1nx*y)“XinyinXknykn总和x .y.x .y.X.yrXk.yk.平均数1H 22x .y .2- 2x.y.表1的x和y变量的自由度和平方和的剖分参见单因素试验资料的方差分析方 法一节。其乘积和的剖分则为:总变异的乘积和SP 丁是x与&和y与亍的离均差乘积之和,即: T ijijSP=2 (x.f.)(一y.) = 8x*罕.i=1 j=1Tijijij

9、 ijkni=1 j=1df t=kn-1x.其中,入.= lx,., y. = ly., x. = X,=玲。 i=1i=1即:(10-6)处理间的乘积和SP是x,.与x.和y,.与y.的离均差乘积之和乘以n,SP = n (x.- x.)(y .- y.)=【 x.y.ii t 111n . 1 1 1 kndf = k -1处理内的乘积和SP是x与x .和y与y.的离均差乘积之和,即: e ij I ij Inyt = SPT-SPti=1(10-7)SPe = 龙 EL E 出 j A = i =1 j=1i =1 j=1df =k(n-1) e分别为仁、以上是各处理重复数相等时的计算

10、公式,若各处理重复数不相等i i=1SPTiji=1 j=1x,y,.切ii=1dfT = 5i=1(10-8)SP =tx .y .x.y.+ . + kknk乙ni i=1dftn;SP基气xeiji=1 j=1x . y .1勺n1x .y .2 2n2+. +x .y . -c -ck,k =SP-SPnT kdf = n.ki =1=dfdft(10-9)有了上述SP和df,再加上乂和的相应SS就可进行协方差分析。n2、nk,其和为En,则各项乘积和与自由度的计算公式为:【例10.1】 为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重, 对哺乳仔猪做了以下试验:试验设对照

11、、配方1、配方2、配方3共四个处理,重复12次,选 择初始条件尽量相近的长白种母猪的哺乳仔猪48头,完全随机分为4组进行试验,结果见表 102,试作分析。此例,x. = x . + x . + x . + x . =18.25+15.40+15.65+13.85=63.15 1234y. = y . + y . + y . + y . =141.80+130.10+144.80+133.80=550.50 1234k=4, n=12, kn=4x12=48表102不同食欲增进剂仔猪生长情况表(单位:kg)处理对照配方1配方2配方3观测初生重50日初生重50日初生重50日初生50日指标x龄重yx

12、龄重yx龄重yMx龄重y1.5012.401.3510.201.1510.001.20 12.401.8512.001.209.401.1010.601.009.801.3510.801.4512.201.1010.401.15 11.60观察值1.4510.001.2010.301.059.201.10 10.60x,y.ir ij1.4011.001.4011.301.4013.001.009.201.4511.801.3011.401.4513.501.45 13.901.5012.501.1512.801.3013.001.35 12.801.5513.401.3010.901.701

13、4.801.159.301.4011.201.3511.601.4012.301.109.601.5011.601.158.501.4513.201.20 12.401.6012.601.3512.201.2512.001.05 11.201.7012.501.209.301.3012.801.10 11.00总和X,., y:.18.25141.8015.40130.8015.65 144.8013.85 133.80平均x.,y.1.5211.821.2810.841.3012.071.15 1.15协方差分析的计算步骤如下:(一)求X变量的各项平方和与自由度1、总平方和及自由度SS =E

14、 X2 - = (1.502 +1.852 +. +1.102) 63-152 = 84.8325- 63,152 =1.75T (x)i kn4848df=kn-1=4x12-1=47T (x)2、处理间平方和与自由度1 vk X.2163.152SS = X2.-二=(18.252 +15.402 +15.652 +13.852)- = 0.83札x)n . 1 kn1248df =k-1=4-1=3 t ( X )3、处理内平方和与自由度SS = SS - SS =1.75-0.83=0.92 e (x)T (x)t (x)df= dfT - df =47-3=44(与求y变量各项平方和

15、与自由度1、总平方和与自由度SS = y2 - Zt = (12.402 +12.002 +. +11.002) - 550.52 = 6410.31 -55052 = 96.76 T(y)i kn4848df=kn-1=4x12-1=47T (y)2、处理间平方和与自由度SS =1 y2.-旦=(141.802 +130.802 +144.802 +133.802) 550.502 = 11.68心)n 七 kn 1248df=k-1=4-1=3t (y)3、处理内平方和与自由度SS ()= SST()- SS( )=96.76-11.68=85.08df。(y)= df, (y)- df(

16、 (y)=47-3=44(三)求乂和两变量的各项离均差乘积和与自由度1、总乘积和与自由度SPT& nX.V.=在 x ij*i=1 j=1kn= 1.50x 12.40 +1.85x 12.00 +. +1.10xll.OO- 63.15*550.504 x12=732.50- 6345X55-50 = 8.254 x12df =kn-1=4x12-1=47T (x, v )2、处理间乘积和与自由度SP = 1 芝 x.y .- At n . , , kn= (18.25 x 141.80 +15.40 x130.10 +15.65 x 144.80 +13.85 x133.80) 63.15

17、 x 550.50 124x12=1.64df =k-1=4-1=33、处理内乘积和与自由度SP = SPt- SP =8.25-1.64=6.61表 103x与y的平方和与乘积和表变异来源dfSSSSSP处理间(t)3x0.83V11.68xV1.64处理内(误差)(e)440.9285.086.61总变异(丁)471.7596.768.25e(x,v) = T(x,v) - dft(x,v) =47-3=44平方和、乘积和与自由度的计算结果列于表103。(四)对赫职各作方差分析(表104)变异来源dfx变量y变量F值SSMSFSSMSF处理间处理内(误差)3440.830.920.280.

18、02113.33*11.6885.083.891.932.02以5=2.82Fo.o】=426总变异471.7596.76表104初生重与50日龄重的方差分析表分析结果表明,4种处理的供试仔猪平均初生重间存在着极显著的差异,其50日龄平 均重差异不显著。须进行协方差分析,以消除初生重不同对试验结果的影响,减小试验误 差,揭示出可能被掩盖的处理间差异的显著性。(五)协方差分析1、误差项回归关系的分析 误差项回归关系分析的意义是要从剔除处理间差异 的影响的误差变异中找出50日龄重(y)与初生重(x)之间是否存在线性回归关系。计算出误 差项的回归系数并对线性回归关系进行显著性检验,若显著则说明两者间

19、存在回归关系。这时就可应用线性回归关系来校正值(50日龄重)以消去仔猪初生重(x)不同对它的影响。然后根据校正后的y值(校正50日龄重)来进行方差分析。如线性回归关系不显著,则无需继 续进行分析。回归分析的步骤如下:(1)计算误差项回归系数,回归平方和,离回归平方和与相应的自由度从误差项的平方和与乘积和求误差项回归系数:b=-SP = 661 = 7.1848E) SS 0.92e( x)(10-10)误差项回归平方和与自由度SP 2 R()= SSC e( x)6.612=47.49 0.92(10-11)叽疽误差项离回归平方和与自由度SS (e)淄(,)-%( )dfe = f -听疽44

20、-1=43 (2)检验回归关系的显著性(表 1)05)( ()=85.08-47.49=37.59(10-12)变异来源SSdfMSFF0 01误差回归47.49147.4954.32*0.07.255误差离回归37.59430.8742误差总和85.0844表105哺乳仔猪50日龄重与初生重的回归关系显著性检验表F检验表明,误差项回归关系极显著,表明哺乳仔猪50日龄重与初生重间存在极显著 的线性回归关系。因此,可以利用线性回归关系来校正/,并对校正后的y进行方差分析。2、对校正后的50日龄重作方差分析(1)求校正后的50日龄重的各项平方和及自由度 利用线性回归关系对50日龄重作校 正,并由校

21、正后的50日龄重计算各项平方和是相当麻烦的,统计学已证明,校正后的总平 方和、误差平方和及自由度等于其相应变异项的离回归平方和及自由度,因此,其各项平 方和及自由度可直接由下述公式计算。校正50日龄重的总平方和与自由度,即总离回归平方和与自由度(10-13)SST = SST(y) - SSR(y)= SST(y)SPT2 = 96.76 - 8252 = 57.85SSt( x)1.75dfT = (f()- dfR()=47-1=46校正50日龄重的误差项平方和与自由度,即误差离回归平方和与自由度SS = SS - SS = SS- = 85.08 -6612 = 37.59(10-14)

22、e e (y)R (e)e( y) SS0.92e( x)df = df - df =44-1=43ee (y)e (R)上述回归自由度均为1,因仅有一个自变量乂。校正50日龄重的处理间平方和与自由度SS = SS - SS =57.87-37.59=20.28(10-15)t T edf;= df;- df: =k-1=4-1=3(2)列出协方差分析表,对校正后的50日龄重进行方差分析(表106)查表:歹001 3 43 =* 275(由线性内插法计算),由于F=7.63尸001 3 43,P01,表 明对于校正后的0 0龄重不同食欲添加剂配方间存在极显著的差异爵故须进一步检验不同 处理间的

23、差异显著性,即进行多重比较。表106 表10-2资料的协方差分析表变异来源dfSSxSSySPxyb校正50日龄重的方差分析FdfSSMS处理间(t) 机误(e)30.8311.681.64440.9285.086.617.18484337.590.8742总和(T)471.7596.768.254657.87校正处理间320.286.767.63*3、根据线性回归关系计算各处理的校正50日龄平均重误差项的回归系数b表示初生重对50日龄重影响的性质和程度,且不包含处理间差yx(e)异的影响,于是可用b ,、根据平均初生重的不同来校正每一处理的50日龄平均重。校正50 yx(e)日龄平均重计算公

24、式如下:y:. = y,. - b (1 - - x.)(10-16)公式中:y:.为第/处理校正50日龄平均重;;y.为第/处理实际50日龄平均重(见表102);X,.为第/处理实际平均初生重(见表102);X.为全试验的平均数,X.=互=6315 = 1.3156kn 48byx(e)为误差回归系数,byx(e) =7.1848将所需要的各数值代入(1016)式中,即可计算出各处理的校正50日龄平均重(见表107)。表107各处理的校正50日龄平均重计算表处理x,X.byx(e)(弓-X.)实际50日 龄平均重校正50日龄平均重R.-b 了、( X. - x.)对照1.52-1.3156=

25、0.20447.1848x0.2044=1.468611.82yx(e),11.82-1.1686=10.3514配方11.28-1.3156=-0.03567.1848x(-0.0356)=-0.258810.8410.84+0.2558=12.0758配方21.30-1.3156=-0.01567.1848x(-0.0156)=-0.112112.0712.07+0.1121=12.1821配方31.15-1.3156=-0.16567.1848x(-0.1656)=-1.189811.1511.15+1.1898=12.33984、各处理校正50日龄平均重间的多重比较各处理校正50日龄平

26、均重间的多重比较,即各种食欲添加剂的效果比较。(1)t检验检验两个处理校正平均数间的差异显著性,可应用t检验法:t =%; -j -(10-17)二, 二,2 (*. - %.)2n SS e( x)式中,亍:.-矿.为两个处理校正平均数间的差异;I JS_, _ ,为两个处理校正平均数差数标准误; y - y -MS:为误差离回归均方; e为各处理的重复数;X;.为处理/的X变量的平均数;X.为处理/的x变量的平均数;S仞为X变量的误差平方和例如,检验食欲添加剂配方1与对照校正50日龄平均重间的差异显著性:._ y2, =10.3514-12.0758=-1.7244MS: =37.59/4

27、3=0.8742n=12eX. =1.52, X2. =1.28, SSe妒0.92将上面各数值代入(1018 )式得:2S_,一,= 0.8742x y- y2 - 2(1.52 -1.28)212 +0.92=0.4477(10-18)于是10.3514 -12.0758t = -3.850.4477查t值表,当自由度为43时(见表106误差自由度),t001网=2.70(利用线性内插法计 算),田t001网,PV0.01,表明对照与食欲添加剂1号配方校正50日龄平均重间存在着 极显著的差异,这里表现为1号配方的校正50日龄平均重极显著高于对照。其余的每两处理间的比较都须另行算出S再进行t

28、检验。y -y -(2)最小显著差数法 利用t检验法进行多重比较,每一次比较都要算出各自的S,比较麻烦。当误差项自由度在20以上,X变量的变异不甚大(即乂变量各处理平均y;.数间差异不显著),为简便起见,可计算一个平均的豆,一,采用最小显著差数法进行多重 y - - yj -比较。S的计算公式如下:y;. 一 yj.S-一y f -,2MS1 +SS (k-1) e( x)(10-19)公式中SSt(x)为x变量的处理间平方和。然后按误差自由度查临界t值,计算出最小显著差数:(10-20),2 x 0.8742:11 +0.830.92 x (4 -1)=0.4354L”财)七,? 1./本例

29、X变量处理平均数间差异极显著,不满足“X变量的变异不甚大”这一条件,不应 采用此处所介绍的最小显著差数法进行多重比较。为了便于读者熟悉该方法,仍以本例的 数据说明之。此时由dfe =43,查临界t值得:扇泗产.017,葡43)=2.70于是LSDOO5=2.017x0.4353=0.878lSdo_Oi=2.70x0.4353=1.175不同食欲添加剂配方与对照校正50日龄平均重比较结果见表108。表108不同食欲添加剂配方与对照间的效果比较表食欲添加剂配方校正50日龄平均重对照校正50日龄平均重差数12312.075810.35141.7244*12.182110.35141.8307*12

30、.339810.35141.9884*多重比较结果表明:食欲添加剂配方1、2、3号与对照比较,其校正50日龄平均重间均存在极显著的差异,这里表现为配方1、2、3号的校正50日龄平均重均极显著高于对照。(3)最小显著极差法当误差自由度在20以上,X变量的变异不甚大,还可以计算出平均的平均数校正标准误号,利用LSR法进行多重比较。Sy的计算公式如下:(10-21)(10-22)SS1 Ht(x)SS (k -1)e( x)然后由误差自由度dfe和秩次距A查SSR表(或q表),计算最小显著极差:LSRa = SSRa Sy对于【例10.1】资料,由于不满足“x变量的变异不甚大”这一条件,不应采用此处

31、 所介绍的LSR法进行多重比较。为了便于读者熟悉该方法,仍以【例10.1】的数据说明之。 此时MS=0.8742,n=12,SS=0.83,SS-仞=0.92,k=4,代入(1021)式可计算得:(0.87420.83S-1 += 0.3078ySSR值与LSR值见表109。勺120.92 x (4 -1)表 109SSR值与LSR值表秩次距k234SSR2.863.013.100.05SSR3.823.994.100.01LSR0.8830.9290.9570.05LSR0.011.1791.2321.266各处理校正50日龄平均重多重比较结果见表1010。表10-10各处理校正50日龄平均重多重比较表(SSR法)处理1 yy -10.3514y -12.0758y -12.1821配方3i.12.3398i.1.9884*i.0.2640i.0.1577配方212.18211.8307*0.1063配方112.07581.7244*对照10.3514多重比较结果表明:食欲添加剂配方3、2、1号的哺乳仔猪校正50日龄平均重极显著 高于对照,不同食欲添加剂配方间哺乳仔猪校正50日龄平均重差异不显著。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!