第2章单因素方差分析

上传人:daj****de 文档编号:132667262 上传时间:2022-08-08 格式:DOCX 页数:10 大小:84.03KB
收藏 版权申诉 举报 下载
第2章单因素方差分析_第1页
第1页 / 共10页
第2章单因素方差分析_第2页
第2页 / 共10页
第2章单因素方差分析_第3页
第3页 / 共10页
资源描述:

《第2章单因素方差分析》由会员分享,可在线阅读,更多相关《第2章单因素方差分析(10页珍藏版)》请在装配图网上搜索。

1、第 12 章 方差分析(Analysis of Variance)方差分析是鉴别各因素效应的一种有效统计方法,它是通过实验观察某一种或多种因素 的变化对实验结果是否带来显著影响,从而选取最优方案的一种统计方法。在科学实验和生产实践中,影响一件事物的因素往往很多,每一个因素的改变都有可能 影响产品产量和质量特征。有的影响大些,有的影响小些。为了使生产过程稳定,保证优质 高产,就有必要找出对产品质量有显著影响的那些因素及因素所处等级。方差分析就是处理 这类问题,从中找出最佳方案。方差分析开始于本世纪20年代。1923年英国统计学家R.A. Fisher首先提出这个概念, (ANOVA)。因当时他在

2、Rothamsted农业实验场工作,所以首先把方差分析应用于农业实 验上,通过分析提高农作物产量的主要因素Fisher1926年在澳大利亚去世。现在方差分析 方法已广泛应用于科学实验,医学,化工,管理学等各个领域,范围广阔。在方差分析中,把可控制的条件称为“因素”(factor),把因素变化的各个等级称为“水 平”或“处理”(treatment)。若是试验中只有一个可控因素在变化,其它可控因素不变,称之为单因素试验,否则是 多因素试验。下面分别介绍单因素和双因素试验结果的方差分析。1.1 单因素方差分析(One Way Analysis of Variance)1. 一般表达形式2. 方差分析

3、的假定前提3. 数学模形4. 统计假设5. 方差分析:(1)总平方和的分解;(2)自由度分解;(3)F检验6. 举例7. 多重比较1.1.1 一般表达形式首先通过一个例子引出单因素方差分析方法。某农业科研所新培养了四种水稻品种,分 别用A,A2, A3, A4表示。每个品种随机选种在四块试验田中,共16块试验田。除水稻 品种之外,尽量保持其它条件相同(如面积,水分,日照,肥量等),收获后计算各试验田 中产量如下表:通过这些数据要考察四个不同品种的单位产量,是否有显著性差异。类似的例子很多, 如劳动生产率差异,汽车燃油消耗,金属材料淬火温度等问题。上述问题可控实验条件是“种 子”。所以种子是因素

4、。把不同的品种A” A2, A3, A4称为“水平”。1,2, 3, 4表示试验批号,即每次随机的选取某个地块种某个品种的种子。称此种问题为单因素试验。单因素试验通常分多个试验批号,目的是平衡一些不可控因素带来的影响。如土地的基 本条件不一样。如各品种只试验一次,必然在试验结果中含有不可控因素带来的影响。在众多的数据中,怎样判别不同品种的水稻产量是否存在显著性差异?初步观察A1品 种的产量可能低一些,A3,A4的产量可能高一些。这是从平均数上观察。若按前面介绍的 两个总体的比较,需要作C24= 6次检验。比较麻烦,所以需要方差分析方法。首先从数学上给出这类问题的一般形式(单因素)比号验结果水平

5、行平均均值AA,PIjmXuXijX.i mX1XkjX.k m元1.Xk3 z X.* / k=x(km = N)X1 jX1m这表明该可控因素共有k个水平,每个水平都进行m次试验,某个水平上的m次试验 可当作一个样本看待。X.表示第i个水平上第j次试验的结果。很容易看出当水平只有2个时,这相当于两个总体的均值的显著性检验问题。现在的目 的是要分析各个水平上的均值是否有显著性差异。1.1.2方差分析的假定前题(1)每个水平(Ai)上的随机变量X.的分布都是正态的,即服从N(庇6)。但光,(1= 1, m),B未知。每个水平上的一系列观测值,看作是取自该水平正态总体的一个容量为m的 样本。(2

6、)认为k个水平上的k个总体方差相等,都是b2 (方差齐性)。(3)观测值X.相互独立。这三个假定在实际中一般都能得到满足。1.1.3数学模型因为X.jNg, b2),(I = 1, .M)所以可以把观测值X.分解为两部分,即X.=光 + e.j , (I = 1, ., k),(j = 1, 2, ., m)其中表示X.对光的随机偏差。为便于比较水平不同对X.造成的影响,可以把光也分解 成两部分 zylJ1光.=日 + a.(I = 1, ., k).=1其中日=*丈H .,称为总平均(Grand mean),a.称为A.水平上的效应,它满足 a. = 0把光代入上式则有:X.j =日 + %

7、 + e., % = 0,(i=1, 2, ., k) , (j=1, 2, , m)e.表示随机变量,%.表示水平变量。这就是单因素方差分析的数学模型。1.1.4统计假设:若可控因素的不同水平对试验结果无显著性影响,那么观测值X.应该来自同一正态总 体,X. . - N(jb2)。所以对应的零假设是H。: 出=.,光.=四k =四 或 %1 =,,=%k = 0H1:光不全相等或.不全为零。当H0成立时,样本的行平均数X.必然差异不大,差异表现为随机误差,当可为真时,X,间必存在较大差异,这时差异表现为系统误差。I. 1.5方差分析方法为判别不同水平对试验结果有无显著性影响,关键是把观测值变

8、量中的随机误差和系统 误差分开,并能进行比较,问题就解决了。(1)分解总离差平方和(Total Sum of Squares),一 W -ST =乙乙(X广X)2i=1 J=1方法是在st公式中加入行平均数X.。-, 一 W 一, 一、,一 一 一ST =乙乙(X - X)2 =乙乙(X - X ) + (X. - X)2.=1 J=1.=1 J=1W ,-、 WW 一、, 一 、,一 一、=乙乙(X - X )2+ 乙乙(X. - X)2 +2乙乙(X - X )(X . - X).=1 j=1.=1 j=1.=1 j=1因为 尤(x广 x )( xx )= (X - x )艺(x. - x

9、 )=0= 1 j = 1= 1j = 1所以ST(X= 1 j = 1-X)2 = (X广 X, )2= 1 j = 1S疽 (X X)2 = m(X. - X)2.=1 j=1.=1ST=SE +Sa其中st称总离差平方和,总变差。se称样本组内离差平方和。它测量同一水平上因重复实 验而产生的误差。这是由于不可控因素引起的,故se反映的是随机误差。sa称样本组间离差平方和。它表示各个水平上的样本平均数X.与样本总平均数X之间离差的加权平方和。可见不同水平上的样本差异越大,Sa的值就越大。它反映的是系统误差。(2).求各离差平方和 St, Sa,Se 的自由度(Degrees of free

10、dom),fT,fA,fE。st =桅尤 (X广X )2的自由度。因随机变量X的个数是N个,相互独立,但受一个约 i=1 J =1束条件。X = NlSnXjj约束,所以自由度为N- 1,即fT = N- 1。 i=1 J =1Sa =(X - X)2= m(X t - X)2的自由度。因 X的个数是k个,但受条件.=1 j=1.=11 KX =匕mX,约束,所以自由度为fA = k -1。i = 1s= 切 (X - X )2的自由度。因X.的个数为N,但受条件X = m X,(匕1, ., k)Eij ijiiji =1 j=1j=1约束,所以自由度为fE = N- k。三个自由度之间也有

11、这样的关系。fT = fA + fE, N - =(N k)+(k-1)(3)F检验S -T =b 2在H0成立条件下,乂可服从正态分布N(W b2),又知乂寸相互独立,所以有X2(N - 1) (Xf )2-A = i=1 j=1X2b 2b 2X(k-1)X2(N -k) (x - x )2 M = ij_-b2b2且sa, se相互独立(证明从略)。由抽样分布一章知,若X - X2 ,JX2 ,且X与J相互独立,则(n1)(n2)F =冬Fy / n 2(ni,n2)当已知*, SE相互独立且分别服从(k-1)和(N-k)个自由度的部分布时,则有(k DF = A 成一)FSe (N k

12、)SE 3 - k)(k-1)(N-k)b 2有了统计量F就可以做假设检验。怎样制定判别规则?分析如下:在H0成立条件下,有E二)=E(三Di)=项)k Tk Tk -1=伯十)=m( X) = m 已=。2艺(Xj X )24=1m 一 1k 11 mE( ) = E( Se ) = E1 N k km k k(xM =1 贰m 1ki=11梦乙 b 2 = b2 k=1可见;七和匚都是b2的无偏估计量。所以在H成立条件下,F= 其一,应接k 1 N k0Se /(N k)近1。当F值很大时,说明组间均方误差,大于组内均方误差,则不能认为k个总体服从同 一个正态分布,即拒绝H。,否则接受H0

13、。这是一个单端检验问题。临界值由检验水平X确 定。pFFS1)(n - k) = a检验步骤是:(1)建立假设H:四=四2= .=如=四(2)选统计量F,H0成立条件下FF(k-D(N-k)(3)由a计算临界值F-1,n- k)(4)判别规则:若F*f Equality.N-Way Tabulation.Test BetweenCommon sampleTest Equality Of:+ jMean:MedianVariance点击OK,Test for Equality of Means Bet ween SeriesDate: 11/22/02 Time: 17:26Sample: 1

14、5Included obseivaticins: 6Methoddf Value ProbabilityAnova F-statistic(2, 12)4.B963800.0279Analysis of VarianceSource ofVariationdf Sum cf Sq. Mean SqBetweenWithin2123S7W5.6474357.3193552.839529.78Toial14861462.961533.06Category StatisticsStd. Err.Va riableCountMeanStd. Dev.of MeanLN53554.134150.3561

15、67.24128HB63646.460233.6327104.4837SX63209.676203.465390.99246All163436.720240.068664.04845常用格式是,方差来源离差平方和自由度均方FF0 05 (2 12)sa组间387105.62193552.84.903.89se组内474357.31239529.78ST总和86146.2915图示如下:12.7方差分析的简便算法。当试验的观测值X的数字太大,不便计算时,可以对X作如下线性变换。X.,= X厂a ,(i= 1, 2, .k), (j = 1, 2, .m)。 lJ b其中a, b是任意两个实数(b丰0)。a, b选择适当就可以减少计算量。这样计算出的结果 与原来结果相同。因为4 .SJ= m(X / - X/)2=乙m(Xi - a) - (X - a)2=乙m(X. - X)2i=i即使b更1时,也会在 S, /(k -1)F = S:/( N - K)中约掉。这是一种古老的简易算法,当有了计算器和计算机之后,这种简化已没有多大必要。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!