[理学]方差分析建模

上传人:仙*** 文档编号:33652532 上传时间:2021-10-18 格式:PPT 页数:30 大小:349.51KB
收藏 版权申诉 举报 下载
[理学]方差分析建模_第1页
第1页 / 共30页
[理学]方差分析建模_第2页
第2页 / 共30页
[理学]方差分析建模_第3页
第3页 / 共30页
资源描述:

《[理学]方差分析建模》由会员分享,可在线阅读,更多相关《[理学]方差分析建模(30页珍藏版)》请在装配图网上搜索。

1、 方差分析作为分析试验数据的一种重要工具,方差分析作为分析试验数据的一种重要工具,是数理统计的是数理统计的 基本方法之一基本方法之一.方差方差 分析是研究一些因分析是研究一些因素(自变量)对某个指标(因变量)的相关关系,素(自变量)对某个指标(因变量)的相关关系,研究哪些因素对指标的影响是显著的,哪些因素对研究哪些因素对指标的影响是显著的,哪些因素对指标的影响不显著,最终找到有力的试验条件指标的影响不显著,最终找到有力的试验条件 方差分析建模方差分析建模 当试验中考察的因素只有一个时,称为单因素试当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的验;若同时

2、研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。通常方差分析影响时,则称为两因素或多因素试验。通常方差分析简称为简称为ANOVA(Analysis of Variance) 单因素方差分析单因素方差分析1单因素方差分析模型单因素方差分析模型 设指标变量为设指标变量为Y,因素为因素为A,它可以取几个不同,它可以取几个不同的水平,记为的水平,记为A1,Aa, 在水平在水平Ai上作若干次试验,上作若干次试验,试验结果为试验结果为yi1,yini,需要考虑因素需要考虑因素A对指标的影响对指标的影响是否显著是否显著. 将将A在某个水平下的试验结果看成一个随机变量在某个水平下的试验结

3、果看成一个随机变量(总体总体),因此考虑,因此考虑A取不同水平时的指标有无显著差取不同水平时的指标有无显著差异,就是检验几个总体的均值是否相等异,就是检验几个总体的均值是否相等.假定在水平假定在水平Ai下的总体服从正态分布,他们可以有不同的均值下的总体服从正态分布,他们可以有不同的均值 i,但有相同的方差但有相同的方差 2,需要检验假设:,需要检验假设:01a11aH :.,H :,.,不全相等不全相等(3.1)将每次试验结果将每次试验结果 yij 分解为分解为ijiijy10aiiin其中其中 表示总的均值,表示总的均值, i= i- 是水平是水平Ai对指标的效应对指标的效应,满足满足 ij

4、是相互独立的随机误差,服从正态分布是相互独立的随机误差,服从正态分布N(0, 2).建立方差分析模型如下:建立方差分析模型如下:120(0,),1,., ,1,.,ijiijaiiiijiynNia jn(3.2)2. 单因素方差分析的单因素方差分析的Matlab实现实现p,c,s=anova1(X,group)输入:输入:X是一个向量,从第一个总体的样本到第是一个向量,从第一个总体的样本到第r个总个总体的样本依次排列,体的样本依次排列,group是与是与X有相同长度的向量,有相同长度的向量,表示表示X中的元素是如何分组的中的元素是如何分组的. group中某元素等于中某元素等于i,表示表示X

5、中这个位置的数据来自第中这个位置的数据来自第i个总体个总体.因此因此group中中分量必须取正整数,从分量必须取正整数,从1直到直到r.p,c,s=anova1(X) %比较比较X各列数据的均值是否相等各列数据的均值是否相等输出输出p是零假设成立时概率,对给定的是零假设成立时概率,对给定的 ,若,若p ,则,则有显著差异;有显著差异;c是方差分析表,是方差分析表,s用于多重比较的输入用于多重比较的输入.输入输入X各列的元素相同,即各总体的样本大小相等,各列的元素相同,即各总体的样本大小相等,称为均衡数据的方差分析,不均衡时用下面的命令称为均衡数据的方差分析,不均衡时用下面的命令例例3.1. 某

6、水产研究所为了比较四种不同配合饲料某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼对鱼的饲喂效果,选取了条件基本相同的鱼20尾,尾,随机分成四组,投喂不同饲料,经一个月试验以随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。后,各组鱼的增重结果列于下表。表表3-1 饲喂不同饲料的鱼的增(单位:饲喂不同饲料的鱼的增(单位:10g)饲料饲料鱼的增重(鱼的增重(xijij)A A1 131.931.927.927.931.831.828.428.435.935.9A A2 224.824.825.725.726.826.827.927.926.226.

7、2A A3 322.122.123.623.627.327.324.924.925.825.8A A4 427.027.030.830.829.029.024.524.528.528.5四种不同饲料对鱼的增重效果是否显著四种不同饲料对鱼的增重效果是否显著 ?解:这是单因素均衡数据的方差分析,解:这是单因素均衡数据的方差分析,Matlab程序程序如下:如下:A=31.927.9 31.8 28.4 35.9 24.825.7 26.8 27.9 26.2 22.123.6 27.3 24.9 25.8 27.030.8 29.0 24.5 28.5; %原始数据输入原始数据输入 B=A; % 将

8、矩阵转置将矩阵转置,Matlab中要求各列为不同水平中要求各列为不同水平p,c,s=anova1(B) 运行后得到一表一图,表是方差分析表(重要);运行后得到一表一图,表是方差分析表(重要);图是各列数据的盒子图,离盒子图中心线较远的对应于图是各列数据的盒子图,离盒子图中心线较远的对应于较大的较大的F值,较小的概率值,较小的概率p.SourceSource方差来源方差来源SSSS平方和平方和dfdf自由度自由度MSMS均方差均方差F F统计量统计量P P值值ColumnsColumns( (因素因素A A组间组间) )SSSSA Ar-1r-1SS/(r-1)SS/(r-1)7.147.140

9、.00290.0029ErrorError误差误差(组内)(组内)SSSSE En-rn-rSS/(n-rSS/(n-r) )TotalTotal总和总和SSSST Tn-1n-1表中所列出的各项意义如下:表中所列出的各项意义如下:因为因为p=0.00290.01,故不同饲料对鱼的增重效,故不同饲料对鱼的增重效果极为显著果极为显著 .1234253035ValuesColumn Number四种不同饲料对鱼的增重效果极为显著四种不同饲料对鱼的增重效果极为显著 ,那么,那么哪一种最好呢?请看下图哪一种最好呢?请看下图 此时,第一个图对应第一种饲料且离盒子图中此时,第一个图对应第一种饲料且离盒子图

10、中心线较远,效果最突出。如果从原始数据中去掉第心线较远,效果最突出。如果从原始数据中去掉第一种饲料的试验数据,得到的结果为各种饲料之间一种饲料的试验数据,得到的结果为各种饲料之间对鱼的增重效果不显著对鱼的增重效果不显著 .p=anova1(B(:,2:4)1232224262830ValuesColumn Number 例例3.2 为比较同一类型的三种不同食谱的营养效果,为比较同一类型的三种不同食谱的营养效果,将将19支幼鼠随机分为三组,各采用三种食谱喂养支幼鼠随机分为三组,各采用三种食谱喂养. 12周周后测得体重,三种食谱营养效果是否有显著差异?后测得体重,三种食谱营养效果是否有显著差异?食

11、谱食谱体重增加量体重增加量甲甲164 190 203 205 206 214 228 257乙乙185 197 201 231丙丙187 212 215 220 248 265 281解:这是单因素非均衡数据的方差分析解:这是单因素非均衡数据的方差分析A=164 190 203 205 206 214 228 257 185 197 201 231 187 212 215 220 248 265 281;group=ones(1,8),2*ones(1,4),3*ones(1,7);p=anova1(A, group)表表3-2 饲喂不同食谱鼠的增重饲喂不同食谱鼠的增重方差分析表方差分析表 1

12、23160180200220240260280Values 均值盒子图均值盒子图由于概率由于概率p=0.1863比较大,故认为三种食料没有比较大,故认为三种食料没有显著差异显著差异.3. 多重比较的多重比较的MATLAB实现实现 为方便找到具有显著差异的方案,我们给出为方便找到具有显著差异的方案,我们给出多重比较的多重比较的MATLAB命令。命令。C=multcompare(s)其中输入其中输入s,由,由p,c,s=anova1(b);得到输出的结果;得到输出的结果;输出输出C共有共有5列,其中前两列给出样本编号,后三列分列,其中前两列给出样本编号,后三列分别为两个样本均值差的置信区间与估计量

13、别为两个样本均值差的置信区间与估计量.练习:对于例练习:对于例3.1,利用多重比较命令进行分析,利用多重比较命令进行分析,关键理解输出的含义。关键理解输出的含义。例例3.3 四个实验室试制同一型号纸张,为了比较光四个实验室试制同一型号纸张,为了比较光滑度每个实验室测量了滑度每个实验室测量了8张纸,进行方差分析张纸,进行方差分析 实验室实验室纸张光滑度纸张光滑度A138.741.543.844.545.54647.758A2 39.239.339.741.441.842.943.345.8A33435394043434445A43434.834.835.437.237.841.242.8解:解:

14、a=38.7,41.5,43.8,44.5,45.5,46,47.7,58 39.2,39.3,39.7,41.4,41.8,42.9,43.3,45.8 34,35,39,40,43,43,44,45 34,34.8,34.8,35.4,37.2,37.8,41.2,42.8; %输入数据输入数据b=a; % MATLAB只对各列进行分析只对各列进行分析p,c,s=anova1(b); % 方差分析方差分析c=multcompare(s) % 多重比较多重比较表表3.3 纸张光滑度数据纸张光滑度数据从方差分析表可知:四个实验室生产有差异,那么从方差分析表可知:四个实验室生产有差异,那么如何比

15、较?软件输出如何比较?软件输出c如下所示:如下所示:1,2列表示比较的列表示比较的实验室号码,实验室号码,3,5 列分别为置信区间左右端点列分别为置信区间左右端点 ,第第4 列是均值差的统计量观测值列是均值差的统计量观测值. 1.0000 2.0000 -1.4753 4.0375 9.5503 1.0000 3.0000 -0.1753 5.3375 10.8503 1.0000 4.0000 2.9497 8.4625 13.9753 2.0000 3.0000 -4.2128 1.3000 6.8128 2.0000 4.0000 -1.0878 4.4250 9.9378 3.0000

16、 4.0000 -2.3878 3.1250 8.6378若置信区间包含原点则无显著差异,可见只有若置信区间包含原点则无显著差异,可见只有1,4实实验室有显著差异验室有显著差异.3436384042444648504321Click on the group you want to testThe means of groups 1 and 4 are significantly different另外,软件输出一幅图形,告知另外,软件输出一幅图形,告知1,4有显著差异有显著差异.例例3.4 内蒙古网络挑战赛内蒙古网络挑战赛C题,就可以用方差分析题,就可以用方差分析比如,考虑承保车辆的车龄统计

17、数据,从比如,考虑承保车辆的车龄统计数据,从2010年年9月到月到2011年年3月共有月共有7个月统计数据,我们看成个月统计数据,我们看成7个个水平水平.根据表根据表3-4分析到期车辆续保率有无差异?分析到期车辆续保率有无差异?车龄2010-92010-102010-112010-122011-12011-22011-30-1年24.83025.22025.06025.84037.27037.76037.8101-2年27.45029.08028.81029.22044.77046.28045.3502-3年21.64022.24022.19022.37037.09039.03037.2203

18、-4年21.16021.95021.86021.71035.31036.85035.3404-5年18.50018.42018.34018.70033.68032.78029.0005-6年17.23017.82018.00018.34038.24038.21037.2406-7年18.01018.45018.74018.96043.78039.22036.3907-8年19.66020.07020.06020.14036.84032.49034.4108-9年18.92019.80020.24020.21028.00026.42026.8509-10年16.47017.12016.82017

19、.71035.71033.87025.360超10年16.51016.49016.41016.76018.52025.48025.650MATLAB程序如下:程序如下:A=24.83025.22025.06025.84037.27037.76037.81027.45029.08028.81029.22044.77046.28045.35021.64022.24022.19022.37037.09039.03037.22021.16021.95021.86021.71035.31036.85035.34018.50018.42018.34018.70033.68032.78029.00017.2

20、3017.82018.00018.34038.24038.21037.24018.01018.45018.74018.96043.78039.22036.39019.66020.07020.06020.14036.84032.49034.41018.92019.80020.24020.21028.00026.42026.85016.47017.12016.82017.71035.71033.87025.36016.51016.49016.41016.76018.52025.48025.650;B=A; % 为何转置?为何转置?p,c,s=anova1(B);C=multcompare(s)输出

21、概率为输出概率为p=0.04381)试验,将实验结果试验,将实验结果yij列成下面的形式列成下面的形式.A因素因素B因素因素B1 1B2 2Bb bA1 1y111 111 y112 112 y11c11cy121 121 y122 122 y12c12cy1b1 1b1 y1b2 1b2 y1bc1bcA2 2y211 211 y211211 y21c21cy221 221 y222 222 y22c22cy2b1 2b1 y2b2 2b2 y2bc2bcAaya11 a11 ya12 a12 ya1ca1cya21 a21 ya22 a22 ya2ca2cyab1 ab1 yab2 ab2

22、 yabcabc对于任一水平组合对于任一水平组合(Ai,Bj),假设,假设yij1,yij2,yijc为来为来自正态总体自正态总体N( ij, 2)的一个样本,可得模型的一个样本,可得模型110,0abijijij110,0abijij2,1,.,1,., ,1,.,(0,),ijkijijijkijkijkyia jb kcN且诸相互独立例例3.5在某化工产品的生产中,对不同反应温度和催在某化工产品的生产中,对不同反应温度和催化剂种类重复试验二次,测得产量如下:化剂种类重复试验二次,测得产量如下:催化剂催化剂 (A)反应温度反应温度(B)6080100120甲甲2.71.382.352.26

23、3.31.351.952.13乙乙1.71.741.673.412.141.561.52.56丙丙1.93.141.633.172.02.291.053.18丁丁2.723.511.392.221.853.151.722.19表表3.5 化工实验数据化工实验数据2. 双因素有交互作用的方差分析的双因素有交互作用的方差分析的MATLAB实现实现p,t,s=anova2(X,resp)其中输入其中输入X是一个矩阵;是一个矩阵;resp表示试验的重复次数输出表示试验的重复次数输出的的p值有三个,分别为各行、各列以及交互作用的概率值有三个,分别为各行、各列以及交互作用的概率.t 是方差分析表,是方差分

24、析表,s用于各因素均值估计与比较用于各因素均值估计与比较.程序如下:程序如下:X=2.71.382.352.263.31.351.952.131.71.741.673.412.141.561.52.561.93.141.633.172.02.291.053.182.723.511.392.221.853.151.722.19;p,t,s=anova2(X,2) 从方差分析表可以看出:不同的温度之间从方差分析表可以看出:不同的温度之间有高度显著差异,温度与催化剂的交互作用也有高度显著差异,温度与催化剂的交互作用也具有高度显著差异具有高度显著差异.注意:由于此时交互作用显著,因此利用多重比较注意:

25、由于此时交互作用显著,因此利用多重比较可能出现问题可能出现问题多因素方差分析多因素方差分析 在在MATLAB软件统计工具箱有多因素方差分析的软件统计工具箱有多因素方差分析的命令,调用格式如下:命令,调用格式如下:p,t,st = anovan(X,group)例例3. 6 某集团为了研究商品销售点所在的地理位置、某集团为了研究商品销售点所在的地理位置、销售点处的广告和销售点的装潢这三个因素对商品销售点处的广告和销售点的装潢这三个因素对商品的影响程度,选了三个位置(如市中心黄金地段、的影响程度,选了三个位置(如市中心黄金地段、非中心的地段、城乡结合部),两种广告形式,两非中心的地段、城乡结合部)

26、,两种广告形式,两种装潢档次在四个城市进行了搭配试验。表种装潢档次在四个城市进行了搭配试验。表3-6是销是销售量的数据,试在显著水平售量的数据,试在显著水平0.05下,检验不同地理下,检验不同地理位置、不同广告、不同装潢下的销售量是否有显著位置、不同广告、不同装潢下的销售量是否有显著差异?差异?表表3-6 四城市销售量的数据四城市销售量的数据水平组合水平组合城市城市1城市城市2城市城市3城市城市4A1B1C1955967960980A1B1C2927949950930A1B2C1905930910920A1B2C2855860880875A2B1C1880890895900A2B1C28608

27、40850830A2B2C1870865850860A2B2C2830850840830A3B1C1875888900892A3B1C2870850847965A3B2C1870863845855A3B2C2821842832848Q=955 967 960 980927 949 950 930905 930 910 920855 860 880 875880 890 895 900860 840 850 830870 865 850 860830 850 840 830875 888 900 892870 850 847 965870 863 845 855821 842 832 848;g

28、1=ones(4,1);2*ones(4,1);3*ones(4,1);g2=ones(2,1);2*ones(2,1);ones(2,1);2*ones(2,1);ones(2,1);2*ones(2,1);g3=1;2;1;2;1;2;1;2;1;2;1;2;for j=1:4p(:,j)=anovan(Q(:,j),g1,g2,g3);endp程序如下:程序如下:p = 0.0036 0.0039 0.0004 0.0588 0.0055 0.0442 0.0018 0.0346 0.0099 0.0204 0.0149 0.3111 其中其中P的每一列分别表示每个城市三因素方差分的每一

29、列分别表示每个城市三因素方差分析的概率;每一行分别表示销售点地理位置、广告析的概率;每一行分别表示销售点地理位置、广告和装潢的概率和装潢的概率.请同学们给出结果的合理解释请同学们给出结果的合理解释练习:练习: 1992 年年A题:题: 施肥效果分析施肥效果分析 某地区作物生长所需的营养素主要是氮某地区作物生长所需的营养素主要是氮(N)、钾钾 (K)、磷、磷 (P).某作物研究所在该地区对土豆与某作物研究所在该地区对土豆与生菜作了一定数量的实验,实验数据如下列表格生菜作了一定数量的实验,实验数据如下列表格所示,其中所示,其中ha 表示公顷,表示公顷,t 表示吨,表示吨,kg 表示公表示公斤斤.当

30、一个营养素的施肥量变化时,总将另两个营当一个营养素的施肥量变化时,总将另两个营养素的施肥量保持在第七个水平上,如对土豆产养素的施肥量保持在第七个水平上,如对土豆产量关于量关于N 的施肥量作实验时,的施肥量作实验时,P 与与K 的施肥量分的施肥量分别取为别取为196kg/ha 与与372kg/ha,对于对于 =0.1,试分试分析施肥量与产量之间的关系析施肥量与产量之间的关系.提示:首先利用提示:首先利用EXCLE表将原始表格进表将原始表格进行整理后用三因素方差分析行整理后用三因素方差分析.表表1 土豆产量与施肥量的关系土豆产量与施肥量的关系施肥量施肥量(N)(kg/ha)产量产量(t/ha)施肥

31、量施肥量(P)(kg/ha)产量产量(t/ha)施肥量施肥量(K)(kg/ha)产量产量(t/ha)015.18033.46018.983421.362432.474727.356725.724936.069334.8610132.297337.9614038.5213534.039841.0418638.4420239.4514740.0927937.7325943.1519641.2637238.4333643.4624542.1746543.8740440.8329440.3655842.7747130.7534242.7365146.22A=0 196 372 15.18;34 196

32、 372 21.36;67 196 372 25.72;101 196 372 32.29;135 196 372 34.03;202 196 372 39.45;259 196 372 43.15;336 196 372 43.46;404 196 372 40.83;471 196 372 30.75259 0 372 33.46;259 24 372 32.47;259 49 372 36.06;259 73 372 37.96259 98 372 41.04;259 147 372 40.09;259 196 372 41.26;259 245 372 42.17259 294 372

33、 40.36;259 342 372 42.73;259 196 0 18.98;259 196 47 27.35259 196 93 34.86;259 196 140 38.52;259 196 186 38.44;259 196 279 37.73259 196 372 38.43;259 196 465 43.87;259 196 558 42.77;259 196 651 46.22;y=A(:,4);g1=1:10,7*ones(1,20);g2=7*ones(1,10),1:10,7*ones(1,10);g3=7*ones(1,20),1:10;p=anovan(y,g1,g2,g3)p = 0.0542 0.3213 0.0762由于由于 =0.1,所以氮肥与钾肥的施,所以氮肥与钾肥的施用量对土豆的产量有显著差异,而用量对土豆的产量有显著差异,而磷肥效果则不显著磷肥效果则不显著.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!