第四章回归分析3逐步回归分析ppt课件

上传人:无*** 文档编号:175894386 上传时间:2022-12-20 格式:PPT 页数:48 大小:498KB
收藏 版权申诉 举报 下载
第四章回归分析3逐步回归分析ppt课件_第1页
第1页 / 共48页
第四章回归分析3逐步回归分析ppt课件_第2页
第2页 / 共48页
第四章回归分析3逐步回归分析ppt课件_第3页
第3页 / 共48页
资源描述:

《第四章回归分析3逐步回归分析ppt课件》由会员分享,可在线阅读,更多相关《第四章回归分析3逐步回归分析ppt课件(48页珍藏版)》请在装配图网上搜索。

1、回归分析三逐渐回归分析最优回归方程的问题 寻求最优回归方程的问题 在有p个自变量的情况下,根据自变量的不同组合能够建立2p-1个回归方程。这些回归方程的效果有好有坏,而人们希望的是回归效果最好的,即“最优的回归方程 最优回归方程的要求 回归效果最正确 自变量的个数最少 选择一个最正确的变量组合 一方面对因变量起显著作用的自变量都选进回归方程,另一方面对因变量作用不显著的自变量都剔除回归方程,选择最优回归方程的方法 方法一:穷尽法 从一切能够的变量组合中,选择其中最优的回归方程 这种方法一定能选出一个最优组合,但任务量特别大 方法二:逐渐剔除法 根本步骤:从包含全部p个自变量组合的回归方程中逐个

2、检验回归系数,剔除对因变量作用不显著的自变量;对剔除后剩下的q个自变量建立对因变量的多元回归方程,再逐个检验回归系数,剔除不显著的变量;反复上述步骤,直到保管在回归方程中自变量的作用都显著为止 缺陷:一开场把全部自变量都要引入回归方程,计算量很大,实践上有些不重要的就不用引入 方法三:逐渐引入法1根本步骤:先逐个比较 xl,xp 对 y 的回归方程那些是显著的,从显著的方程中挑选 F 值最大的,相应的自变量 x 就被“引入方程。无妨设 x 就是x1再逐个比较(x1,x2)、(x1,x3)、(x1,xp)对y的回归方程,看有没有F值显著的,此时的F就是思索添加xi之后,xi的回归系数能否显著地不

3、为0,将显著的F中最大的F所相应的变量“引入方程。无妨设第二次“引入的自变量是x2再调查以x1、x2为根底,逐个添加x3、x4、xp之后的回归方程,能否较x1、x2的方程有显著的改良,有就再“引入新的自变量,这样下去,终于到某一步就没有可以再“引入的自变量了。这时就获得了最后的回归方程 方法四:逐渐回归分析方法 按照自变量对因变量所起作用的显著程度,从大到小逐个地引入回归方程 当每一变量引入以后,假设先前曾经引入的变量由于后来变量的引入而使其作用变得不显著时,就及时从回归方程中剔除出去,直到作用显著的变量都引入到回归方程,而作用不显者的变量都剔出回归方程,得到一个最正确的变量组合为止2“逐渐引

4、入“法的缺陷:不能反映后来变化的情况,想象x1、x2、x3引入后,又引入了x6,也许x3、x6引入后,x1的作用就不重要了,应该予以剔除,而“逐渐引入法不能到达这个要求逐渐回归分析的几个问题一、建立规范正规方程组二、变量的引入、剔除与消去法的关系一、建立规范正规方程组 为了分辨 p个自变量对因变量 Y 所起影响(或作用)的大小,一个自然的想法是比较各自变量回归系数 (j1,2,p)的绝对值的大小。根据回归系数的含义,Xj 的回归系数 是在其他p1个自变量坚持不变的条件下,Xj 改动一个单位所引起 Y 平均变化的大小。因此回归系数绝对值的大小反映了它所代表的要素的重要程度 由于回归系数和自变量所

5、取的单位(或数量级)有关,而各个自变量取不同的量纲的情况是常见的,因此不能将回归系数直接进展比较jj建立规范正规方程组 为了消除这个影响,对自变量和因变量都要加以规范化 规范化的方法 经过规范化的变量,其均值为 0,规范离差Lxjxj为 1pjLXXxjjjjj,2,12()11,2,jjjjx xjjXXLjpL现实上,*11112211*21122222*1122 ppyppyppppppyrrrrrrrrrrrr规范正规方程组 由规范化数据建立的正规方程组的系数矩阵即为变量间的相关系数矩阵,称为规范化正规方程组 规范化正规方程组为:规范正规方程组 规范化正规方程组的解 称为规范回归系数,

6、其常数项 为0 由于因变量也进展了规范化,其总离差平方和 Lyy=1 求解规范化正规方程组还需求处理以下两个问题 引入变量和剔除变量的规范;引入变量与剔除变量的方法。*j*0二、变量的引入、剔除与消去法的关系 假定已有 l 个自变量引入到回归方程,即*1122llyxxx相应的平方和分解公式是yyLUQ为了阐明 U 和 Q 与引入的自变量是有关的,分别用符号U(x1,xl)和 Q(x1,xl)表示当添加一个自变量 xi (i=l+1,p)后,有了新的回归方程,相应的平方和分解公式是11(,)(,)yyliliLU xx xQ xx x原来的分解公式是11(,)(,)yyllLU xxQ xx留

7、意到上两式左端 Lyy 是一样的,当xi 引入后,回归平方和从 U(x1,xl)添加到U(x1,xl,xi),而残差平方和从 Q(x1,xl)降到 Q(x1,xl,xi)因此,有1111(,)(,)(,)(,)lillliU xx xU xxQ xxQ xx x记11(,)(,)ililuU xx xU xx ui就是回归方程中引入 xi 后对回归平方和的奉献,即偏回归平方和,且有2iiiiuc21(1,2)(1)1)iiuuFFnlQ nl 经F 检验,当 xi 作用显著时,可将其引入。同理,假设同理,假设 xi 原来曾经在回归方程中,假设检验原来曾经在回归方程中,假设检验后其作用不显著,可

8、及时从回归方程中剔除出去。后其作用不显著,可及时从回归方程中剔除出去。2iuFF剔除引入利用统计量因此,取剔除和引入变量 xi的规范一样,即 在逐渐回归中引入一个变量与剔除一个变量都涉及变换,变换公式一样,采用求解求逆紧凑格式在第在第s 次对第次对第k 列消去的变换公式是:列消去的变换公式是:二、变量的引入、剔除与消去法的关系(1)(1)(1)(1)(1)(1)()(1)(1)(1)(,)(,)(,)1 (,)ssssijikkjkksskjkksijssikkkskkrrrrikjkrrikjkrrrikjkrikjk由相关矩阵构成的系数矩阵中,第 i 个变量的偏回归平方和ui(s)为:2(

9、1)()(1)siysisiirur由 可推倒出来2iiiiucui(s)为下一步引进变量的目的,每一步引入都是从未出如今回归方程的剩余变量中挑选ui(s)的最大者进展上述变换后,回归分析中的剩余平方和Q的值即为系数矩阵中ryy位置所得的结果。即有,(0)(0)()()()()1,1ssssyyyyyyQrQrUr 证明()()()1(1)1ssiisuFQnl式中,l 为先前曾经引入到回归方程中的变量个数,Fi 服从F(1,n-l-2)分布。假设已引进的变量中有不显著的,那么选其最不显著者作剔除变换,然后再检验。在未引入的变量中检验有无回归显著的变量,假设有,那么挑选最显著的作引入的消去变换

10、,然后再检验。反复进展,直到没有变量可以引进,也没有变量可以从方程中剔除为止。构造检验统计量n用消去法求解正规方程组的过程二、变量的引入、剔除与消去法的关系 当消去正规方程组系数矩阵的第一列时,常数项列的第一个数就是只需x1这一个自变量情况下所建立的回归方程的回归系数 这是由于:当回归方程只需一个自变量时,阐明其他自变量在多元回归方程中的回归系数为0。因此,正规方程的常数项部分就是该变量的解,即回归系数。1二、变量的引入、剔除与消去法的关系 第二次消去了正规方程组系数矩阵的第一、二两列时,常数项列中的第一、二两个数即为只需x1,x2两个自变量情况下所建立回归方程的回归系数 和 依次类推,得到引

11、入的各个自变量的回归系数12 由相关系数矩阵得到的回归系数是规范回归系数 ,假设要把它化为普通回归系数 两者关系为:*ii*YYiiiiLL其中 Lii 和LYY为变量 Xi 和 Y 的方差。01122()llYXXX二、变量的引入、剔除与消去法的关系推导三、例题分析【例】【例】某种水泥在凝固时,某种水泥在凝固时,放出的热量放出的热量Y卡克与卡克与水泥中以下水泥中以下4种成分有关:种成分有关:X1:铝酸三钙铝酸三钙 X2:硅酸三钙硅酸三钙 X3:铁铝硅四钙铁铝硅四钙 X4:硅酸二钙硅酸二钙 经过实验,获得数据资料经过实验,获得数据资料如右所示:如右所示:编号编号X1X2X3X4Y1234567

12、8910111213711111711312211111026295631525571315447406668615886917221842398605220473322644222634121278.574.3104.287.695.9109.2102.772.593.1115.983.8113.3109.4 阐明:按第一种方法选最优,全部能够的回归方程有C41+C42+C43+C44=15个计算各要素之间的相关系数,得到相关系数矩阵R(0)(0)(0)(0)11141(0)(0)(0)(0)41444(0)(0)(0)14yyyyyyrrrrrrrrrR 预备任务:根据本例资料,算出(0)

13、10.22860.82410.24540.73070.228610.13920.97300.81630.82410.139210.02950.53470.24540.97300.029510.82130.73070.81630.53470.82131 R 从矩阵R(0)中可以看出:x1与x2 两因子不相关,x2与x4、x1与x3之间关系亲密,x3与y关系不太亲密,x4与y最相关 0.05(2,10)4.10F逐渐回归步骤:逐渐回归步骤:(1)2()(1)1,2,3,4tiytitiiruirt变换步数第一步(t=1)选择第一个变量进入回归方程 对一切4个变量,按下面公式计算偏回归平方和当变量引

14、入回归方程后(0)21(1)21(0)110.73070.5339yrur(0)22(1)22(0)220.81630.6663yrur(1)30.2859u(1)40.6745u 计算结果为:比较4个ui(1),可知第4个因子的偏回归值最大,即x4对y的回归奉献最大,于是优先思索选入x4()()()1(1)ttiituFQnl 剩引入要素的显著性检验引入要素的显著性检验()()()()()()()1111lltttttttiiiiQQuQQQu 回回总剩总其中,分子的自在度是1,l 为方程中的变量个数n 求解回归方程时,假设对资料进展规范化处置,可以证明:统计量()()ttiQQu回偏回()

15、()1ttiQu 剩当引入第一个因子时,l1故()()()1(1)(2)ttiitiuFun那么统计量(1)(1)44(1)40.674522.80(1)/(2)0.3255/11uFun于是由于F4(1)F0.05(1,11)=4.84,阐明引入的因子x4对回归方程的奉献是显著的,应将x4引入方程。矩阵矩阵R(0)的高斯亚当变换紧凑变换方式的高斯亚当变换紧凑变换方式以x4为主元进展矩阵变换x4刚刚引入方程,变换公式如下()(1)()()(),tttttijijikkjkkrrr rri jk kk第 个因子刚刚入选a.非主元所在行、列(1)()()tttkjkjkkrrrjkb.主元所在行除

16、主元(1)()()tttikikkkrrrik c.主元所在列除主元(1)()1ttkkkkrrd.主元n 变换过程要求按a d 顺序进展。记变换后的矩阵为R(1),(t=1)(1)0.93980.01020.81690.24540.52910.01020.05340.11050.97300.01720.81690.11050.99910.82130.02950.51040.24540.97300.029510.52910.01720.510.3040.82255 RQ剩 解*(1)4x4引入回归方程后的结果引入回归方程后的结果*(1)(1)440.8213yr 规范回归系数利用规范化数据求得

17、的回归系数为:(1)(1)0.3255yyQr剩剩余平方和40.8213yx 回归方程的规范方式为:(1)(1)(1)(1)(1)(1)(1)(1)(1)(1)/(10.3255)/122.80/(1)0.3255/(13 1 1)yyyyQlQfFQfQnlrlrnl 剩回回剩剩剩其中l1,阐明方程只引入一个变量回归方程的普通方式为:4117.570.7382YX普通回归系数为:(1)*(1)44442715.760.82133362.000.7382YYLL 常数项为(1)(1)04495.42(0.7380)30117.67YX 第二步(t=2)计算偏回归平方和 ui(2)(i=1,2,

18、3)利用R(1)对不在回归方程中的每个变量做计算(1)221(2)1(1)11(2)(2)230.52910.29800.93980.00550.2601yruruu其中以u1(2)=0.2980最大,故最优先思索 x1 引入回归方程能否引入方程要做检验。7A(2)(2)11(2)1(1)uFQnl 剩偏回归系数检验偏回归系数检验(2)Q剩式中,分母表示x1引入回归方程后,剩余平方和 等于只包含x4一个变量时的剩余平方和 减去x1引入回归方程而使回归平方和增大的部分 。(1)Q剩(2)1un由于F1(2)F0.05(1,10)=4.96,因此x1应引入回归方程中。将x1引入,方程中有两个因子,

19、即l=20.2980/1108.22(0.32550.2980)/10(2)1(1)(2)411(1)(1)uuunl 矩阵矩阵R(1)的高斯亚当变换的高斯亚当变换 记变换后的矩阵为记变换后的矩阵为R(2)(2)1.0641-0.0109-0.86930.26120.01090.0532-0.11940.97560.02290.8693-0.11940.28910.180.5631-0.683138-0.05050.2612-0.9756-0.18381.0641-0.563010.0229-0.05050.6831.0275R Q剩(2)224(2)4(2)440.68310.43851.0

20、641yrur()(2)(2)44(2)(1)(132 1)0.4385159.460.0275yynluFr 由于由于F4(2)F0.05(1,10),因此,因此 x4 不应从方程中剔除。不应从方程中剔除。*(2)解1 *(2)解2即以即以x1的回归方程引入的回归方程引入x4后的偏后的偏回归显著性检验,其中,回归显著性检验,其中,x1的的回归奉献为回归奉献为0.5339,而,而x4的偏回的偏回归奉献为归奉献为0.4385的,合计为的,合计为0.9724*(2)(2)440.6831yr*(2)(2)110.5631yr规范回归系数:规范回归系数:14103.10 1.44010.6140YX

21、X(2)(2)0.0275yyQr剩回归方程的普通方式:回归方程的普通方式:剩余平方和:剩余平方和:第三步(t=3)计算偏回归平方和ui(3)(i=2,3)利用R(2)对不在回归方程中的每个变量做计算(2)222(3)(3)23(1)220.02290.00990.00880.0532yruurn其中 u2(3)u3(3),变量x2的偏回归平方和最大,选择x2(3)(3)22(1)(2)(3)412/10.0099(1)/(1)(0.02750.0099)/(133 1)uFuuunl 5.03矩阵矩阵R(2)的高斯亚当变换的高斯亚当变换 引入引入x2,以以r22(2)为为主元进展,记变换后的

22、矩阵为主元进展,记变换后的矩阵为R(3)(3)221(3)1(3)110.56770.30231.0663yrur(3)24(3)4(3)440.0037yrur引入引入x2后,对原有因子后,对原有因子x1、x4重新检验重新检验(l=3)剔除检验剔除检验(3)1.06630.2044-0.89370.46060.56770.204418.7804-2.242318.32260.43040.89372.24230.02132.37140.00090.460618.3226-2.371418.9401-0.2632-0.5677-0.43040.00090.26320.0177R Q剩 *(3)解

23、1 *(3)解2 *(3)解4上式表示,以上式表示,以x2为自变量的方程,再引入为自变量的方程,再引入x1、x4后,产生的偏回归奉献后,产生的偏回归奉献(3)(3)44(3)/10.00371.87/(1)0.0177/(133 1)yyuFrnl 其中u4(3)较小,计算(3)4FF由于 ,因此,应把 x4 从回归方程中剔除。n阐明:由于因子x2的引入,呵斥变量x4的显著性大大降低,回归方程中变量x4的存在是多余的,予以剔除。矩阵矩阵 R(3)以以 r44(3)为主元做高斯亚当变换,为主元做高斯亚当变换,记变换后的矩阵为记变换后的矩阵为R(4)*(4)*1.0551-0.2412-0.836

24、0-0.02430.5741-0.24121.05510.0518-0.96740.68500.8360-0.05180.3183-0.12520.03390.02430.9674-0.12520.0528-0.0139-0.5741-0.68500.0339-0.01390.0213R Q剩 *(4)解1 *(4)解2剔除剔除x4后,再检验后,再检验x1、x2(4)2(4)(4)111(4)11(4)(4)(1)(1)10 0.3124146.520.0213yyyyynlrrnluFrr (4)(4)22(4)(1)10 0.4447208.580.0213yynluFr 因(4)(4)1

25、2,FF由于 均大于F=4.10,所以x1、x2均不剔除。(4)t 第四步引入新变量引入新变量(5)(3,4)iui 计算偏回归平方和(4)2(4)2234(5)(5)34(4)(4)33440.03390.00360.00370.3183yyrruurr(5)(5)43uun由于 ,且x4是刚刚在上一步中被剔除的变量,故不需求再作F检验就知道它不显著 再没有变量可引入回归方程,逐渐回归选因子终了*(4)*(4)120.5741,0.6850引入变量x1、x2后,由R(4)得到规范回归系数:()*()ttYYiiiiLL原方程的回归系数221122()2713.9969()415.250829

26、05.6928YYiiiiLYYLxxLL其中(4)(4)121.46820.6622(4)(4)(4)0112252.58YXX因此1252.58 1.46820.6622YXX*(4)(4)57.8628yyyyyyyyQQLQLrL剩剩剩剩余平方和:57.86282.4055()132 1QSSf剩剩估计规范误差:210.98930.9787yyQRRL剩复相关系数:229.5QfFQf回回剩剩方程方程F检验:检验:ENDn 证明如下:在第0步,还没有因子引入回归方程,剩余方差Q(0)到达最大,即(0)(0)yyyyyyQSrS在第一步,引入因子 ,k1是1,2,m中的任一个数,1kx1

27、(0)(1)k RR剩余方差为111 1111 1(0)2(1)(0)(0)(0)(0)(0)(0)(0)(1)(0)()k ykyyyyk kk yykyyyyyyyyk krQQQrSrrrrSr Sr222 2(1)2(2)(1)(1)(1)(2)(1)()=k ykyyyyyyyyk krQQQrSrSr第二步,继续引入因子 ,k2也是1,2,m 中一个数。这时,2kx21kk2(1)(2)k RR如此下去,我们讨论第 l 步第 l 步,继续引入因子 ,kl 也是1,2,m中一个数。这时 ,lkx12lkkk(1)()lkll RR(1)2()(1)(1)(1)()(1)()=lll llk ylllllkyyyyyyyylk krQQQrSr Sr证毕求解求逆紧凑变换法设方程组为11 112211,121 122222,11 122,1nnnnnnnnnnnn na xa xa xaa xa xa xaa xa xa xa *1122kkyxxx回归方程的规范方式*yyiiiiLL也可以写成*1122121122kkkyykkXXXXXXYYLLLL因此,普通方式回归方程的回归系数为

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!