第四部分多重共线ppt课件

上传人:仙*** 文档编号:181904143 上传时间:2023-01-18 格式:PPT 页数:61 大小:490KB
收藏 版权申诉 举报 下载
第四部分多重共线ppt课件_第1页
第1页 / 共61页
第四部分多重共线ppt课件_第2页
第2页 / 共61页
第四部分多重共线ppt课件_第3页
第3页 / 共61页
资源描述:

《第四部分多重共线ppt课件》由会员分享,可在线阅读,更多相关《第四部分多重共线ppt课件(61页珍藏版)》请在装配图网上搜索。

1、第四章 多重共线性问题的提出n在前述根本假定下OLS估计具有BLUE的优良性。n然而实践问题中,这些根本假定往往不能满足,使OLS方法失效不再具有BLUE特性。n估计参数时,必需检验根本假定能否满足,并针对根本假定不满足的情况,采取相应的补救措施或者新的方法。n检验根本假定能否满足的检验称为计量经济学检验回想6项根本假定n1解释变量间不相关无多重共线性n2E(ui)=0 随机项均值为零 n3Var(ui)=2 同方差 n4Cov(ui,uj)=0随机项无自相关 n5Cov(X,ui)=0随机项与解释变量X不相关n6随机扰动服从正态分布。不满足根本假定的情形1n1、通常不会发生随机扰动项均值不等

2、于0的情形。假设发生也不会影响解释变量的系数,只会影响截距项。n2、随机扰动项正态性假设普通可以成立,就算不成立,在大样本下也会近似成立的。所以不讨论此假定能否违背。不满足根本假定的情形2n3、解释变量之间相关=多重共线n4、随机扰动项相关=序列自相关n时间序列数据经常出现序列相关n5、随机扰动项方差不等于常数=异方差n截面数据时,经常出现异方差处理问题的思绪n1、定义违反各个根本假定的根本概念n2、违反根本假定的缘由、背景n3、诊断根本假定的违反n4、违反根本假定的补救措施修正本章主要引见4.1 多重共线性的实例、定义、产生背景;4.2 多重共线性产生的后果;4.3 多重共线性的检验;4.4

3、 多重共线性的修正。4.5 违反三个假定的总结4.6 案例4.1 多重共线性的实例、定义、产生背景n4.1.1 实例n 例一 消费与收入、家庭财富n 例二 汽车保养费与汽车行驶里程、拥有汽车时间4.1.2 多重共线性的定义n多重共线性:在多元线性回归模型中,解释变量之间存在着完全的线性关系或近似的线性关系iiiiXbXbbY2211002211iiXX02211iiivXX完全多重共线性近似多重共线性4.1.2 多重共线性的定义矩阵方式多重共线性。则称模型存在如果这一假定不满足,即即有:线性无关的的各列向量之间是矩阵基本假定是的中,对在多元线性回归模型0|XX|),()(,X:nkkXrXXY

4、多重共线性分类的矩阵方式对角线元素较大),(实际中多为此情况)不完全多重共线性:(不存在)(也就是)完全多重共线性:(情况:多重共线性表现为两种11XX0|XX|2XX0,|XX|,)(1 kXr4.1.3 产生多重共线性的背景1时间序列数据中经济变量在时间上常有共同的变动趋势;时间序列样本:经济昌盛时期,各根本经济变量收入、消费、投资、价钱都趋于增长;衰退时期,又同时趋于下降。2经济变量之间本身具有内在联络常在截面数据中出现;横截面数据:消费函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。4.1.3 产生多重共线性的背景3由于某种决议性要素的影响能够使各个变量向

5、着同方向变化;4滞后变量引入模型,同一变量的滞后值普通都存在相互关系;在计量经济模型中,往往需求引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入 显然,两期收入间有较强的线性相关性。有的学者以为多重共线性是一个数据样本的问题。普通阅历普通阅历 对于采用时间序列数据作样本、以简单线性对于采用时间序列数据作样本、以简单线性方式建立的计量经济学模型,往往存在多重共线方式建立的计量经济学模型,往往存在多重共线性。性。以截面数据作样本时,问题不那么严重,但以截面数据作样本时,问题不那么严重,但多重共线性依然是存在的。多重共线性依然是存在的。back4.2 多重共线性的后果4.2.

6、1 完全多重共线性下的后果1参数估计值不确定;2参数估计值的方差无限大;来。中没法解出唯一的不存在,从YXXXXX1)()(例例如如:对一个离差形式的二元回归模型 2211xxy 如果两个解释变量完全相关,如12xx,则有221212212121221221211iiiiiiiiiiixxxxxxxxxxxXX1121iiiiiiyxyxyxYX该回归模型的正规方程为 YXBX)X(或 iiiiiyxxxx1212211 iiiiiyxxxx2222121解该线性方程组得:002122121212121211221221212222111iiiiiiiiiiiiiiiiiiiiiiixxxxx

7、yxxyxxxxxxxxyxxxyx1为不定式;同理,2也为不定式,其值无法确定。事实上,当12xx时,原二元回归模型退化为一元回归模型:121)(xy只能确定综合参数21的估计值:21121iiixyx4.2.2 不完全多重共线性下的后果1参数估计仍是无偏估计,但不稳定;估计量及其规范差非常敏感,观测值略微变化,估计量就会产生较大的变动。2参数估计式的方差随着共线性程度的增大而增大。3t检验失效,区间估计失去意义;估计量的方差很大,相应规范差增大,进展t检验时,接受零假设的能够性增大4严重多重共线性时,甚至参数估计式的符号与其经济意义相反。得出完全错误的结论。4.2.2 4.2.2 普通共线

8、性下普通最小二乘法参数普通共线性下普通最小二乘法参数估计量非有效估计量非有效 在普通共线性或称近似共线性下,虽然可以得到OLS法参数估计量,但是由参数估计量方差的表达式为 12)()(XXCov 可见,由于此时|XX|0,引起(XX)-1主对角线元素较大,从而使参数估计值的方差增大,OLS参数估计量非有效。2221221)(iiiixxxx恰为1x与2x的线性相关系数的平方2r,由于2r1,故1112r。仍以二元模型中1为例,1的方差为 2221221212221222122211121)(1/)()()var(iiiiiiiiiixxxxxxxxxxXX即:多重共线性使参数估计值的方差增大,

9、方差扩展因子(Variance Inflation Factor)为1/(1-r2),其增大趋势见下表:当完完全全不不共共线线时,2r=0,2121/)var(ix当不不完完全全共共线线(近似共线)时,102 r,2122212111)var(iixrx相关系数平方00.50.80.90.950.960.970.980.990.999方差扩大因子12510202533501001000当完全共线时,2r=1,)var(14.2.2 4.2.2 参数估计量经济含义不合理参数估计量经济含义不合理 假设模型中两个解释变量具有线性相关性,例如X1和X2,那么它们中的一个变量可以由另一个变量表征。这时,

10、X1和X2前的参数并不反映各自与被解释变量之间的构造关系,而是反映它们对被解释变量的共同影响。所以各自的参数曾经失去了应有的经济含义,于是经常表现出似乎反常的景象,例如本来应该是正的,结果恰是负的。举例tttuPOPINTRATEHOUSING1321tttuGNPINTRATEHOUSING2321ttttuGNPPOPINTRATEHOUSING14321A:B:C:Housing:开工的住房数量Intrate:新房抵押利率POP:人口GNP:收入举例变量模型A模型B模型C估计值 t值估计值 t值估计值 t值C-3812.93-2.40687.901.80-1315.75-0.27Intr

11、ate-198.40-3.87-169.66-3.87-184.75-3.18POP33.823.6114.900.41GNP0.913.640.520.544.3 多重共线性的检验1简单相关系数矩阵法辅助手段此法简单易行;但要留意两变量的简单相关系数包含了其他变量的影响,并非它们真实的线性相关程度的反映;普通在0.8以上可初步断定它俩之间有线性相关。2变量显著性与方程显著性综合判别;拟合优度R2很高,F值显著大于临界值,而t值不显著;那么可以为存在多重共线性。3辅助回归:将每个解释变量对其他变量回归,假设某个回归方程显著成立,那么该解释变量和其他变量有多重共线性。即看断定系数较大。4判别参数

12、估计值的符号,假设不符合经济实际或实践情况,能够存在多重共线性4.4.1 多重共线性的修正方法一:添加样本容量n 添加后,样本向量有能够不再线性相关。这也可以降低察看误差,减小估计量的方差,有助于提高估计精度。n 但是,添加样本是比较困难的,也不能根本处理它。n适用于:样本引起的多重共线性丈量误差、偶尔要素,解释变量总体不存在多重共线性n添加样本容量,如把时间序列数据和截面数据合并成平行数据 4.4.2 多重共线性的修正方法:二利用先验信息改动约束方式n先验信息:在此之前的研讨成果所提供的信息。n利用某些先验信息,可以把有共线性的变量组合成新的变量,从而消除共线性。n如 其中Y消费,X2收入n

13、X3财富。由于收入与财富有高度共线的趋势,假设先验以为 那么代入消去iiiiuXXY332212310.0iiiiiiiiiXXXuXuXXY3221322211.010.0其中4.4.2 多重共线性的修正方法:二利用先验信息改动约束方式KLAYlnlnlnln高度相关知+=1,即规模报酬不变,那么将 =1-代入KLAKYlnlnln 4.4.3 多重共线性的修正方法:三截面数据和时序数据结合n有时在时间序列数据中多重共线性严重的变量,在截面数据中不一定有严重的共线性。n在假定截面数据估计出的参数在时间序列数据中变化不大的前提下,可先用截面数据估计出一些变量的参数,再代入原模型估计另一些变量的

14、参数。n例:销量与商品价钱、消费者收入。4.4.4 多重共线性的修正方法:四变换模型方式差分法一般慎用。序列自相关问题。所以可能会出现但是这的共线性将明显减弱。和差分后,则上差分式子变成:,令将上两式相减,得:将其滞后一期:设原模型为存在高度线性相关。和假设,tttttttttttttttttttttttttttttttttuXXuXXYuuuXXXXXXYYYuuXXXXYYuXXYuXXYXX32,33,22113,3,312,2,21113,3312,2211133122113322132 )()(:差分法差分法n 对于以时间序列数据为样本、以直接线性关系为模型关系方式的计量经济学模型,

15、将原模型变换为差分模型n Yi=1 X1i+2 X2i+k Xki+in可以有效地消除存在于原模型中的多重共线性。n n 普通讲,增量之间的线性关系远比总量之间的线性关系弱得多。例如:在中国消费模型中的例如:在中国消费模型中的2个变量:个变量:收入(Y:GDP)与消费 C 的总量与增量数据YC(-1)C(-1)/YYC(-1)C(-1)/Y1981490129760.60721982548933090.60285883330.56631983607636380.59965873290.56051984716440210.561310883830.35201985879246940.533916

16、286730.413419861013357730.5697144110790.748819871178465420.555216517690.465819881470474510.506729209090.311319891646693600.5684176219091.083199018320105560.5762185411960.6451199121280113620.533929608060.2723199225864131460.5083458417840.3892199334501159520.4624863728060.3249199447111201820.428412610

17、42300.3354199559405272160.45811229470340.5721199668498345290.5041909373130.8042 由表中的比值可以直观地看到,两变量增量的线性关系弱于总量之间的线性关系。n 进一步分析:n Y与C(-1)之间的相关系数为0.9845,n Y与C(-1)之间的相关系数为0.7456。n 普通以为:两个变量之间的相关系数大于0.8时,二者之间存在线性关系。n 所以,原模型经检验地被以为具有多重共线性,而差分模型那么可以为不具有多重共线性。4.4.4 多重共线性的修正方法:五逐渐回归法n根本思想:n 用逐渐回归法发现产生共线性的解释变量,

18、将其剔除,从而减少共线性的影响。n这既是判别能否存在多重共线性的方法,也是处理多重共线性的方法。n详细方法:见流程图word文档:多重共线性逐渐回归法流程图多重共线性逐渐回归法流程图4.4.4 多重共线性的修正方法:六剔除不重要的解释变量n假设多重共线性由不重要的解释变量引起,可以从模型中除去该解释变量,减弱多重共线性n该解释变量被纳入随机误差项中,能够使随机误差项不能满足零均值假设4.4.4 多重共线性的修正方法:六剔除变量与设定偏误n面对严重多重共线性,最简单的做法之一是剔除共线性诸变量之一,但是从模型中删除一个变量,能够导致设定偏误或设定误差。也就是说在分析中运用了不正确设定的模型。n由

19、上面的讨论可见,从模型中除掉一个变量以缓解多重共线性的问题会导致设定上的偏误,因此在某些情形中,治疗也许比疾病更糟糕,多重共线性虽然有碍于对模型参数的准确估计,但是剔除变量,那么对参数的真值有严重的误导,应该记得,在近似共线性情形下,OLS估计量仍是BLUE。4.4.4 多重共线性的修正方法:七变量变换n偶尔地,经过对模型中变量的变换可以降低共线性程度。如有的总量变成人均量,名义量变成实践量。但不能保证一定有效!n参看课本P214。4.4.4 多重共线性的修正方法:七变量变换tttttXbXbXbbY3322110lnln销量出厂价钱 市场价钱高度相关市场总供应量tttttXbXXbbY322

20、110lnln相对价钱数据中心化ikikiiiXbXbXbbY2210jijiXX令kikiiiXbXbXbbY22110jijijiXXX*令*22*110kikiiiXbXbXbbY4.4.4 多重共线性的修正方法:八用被解释变量的滞后值替代解释变量的滞后值ttttXbXbbY1210个人消费现期收入 前期收入高度相关ttttYXY1210线性关系较弱4.5 违反三个假定的总结对于模型对于模型Yi=Yi=0+0+1X1i+1X1i+2X2i+2X2i+kXki+kXki+i i i=1,2,n i=1,2,n 其根本假设之一其根本假设之一是解释变量是相是解释变量是相互独立的。假设互独立的。

21、假设某两个或多个解某两个或多个解释变量之间出现释变量之间出现了相关性,那么了相关性,那么称为多重共线性。称为多重共线性。定义要点多重共线性多重共线性序列相关性序列相关性异方差性异方差性随机误差项互相独随机误差项互相独立的基本假设表现立的基本假设表现为:为:Covij(,)0如果出现如果出现Covij(,)0即即对于不同的样本对于不同的样本点,随机误差项之点,随机误差项之间不再是完全互相间不再是完全互相独立,而是存在某独立,而是存在某种相关性种相关性后果多重共线性多重共线性序列相关性序列相关性异方差性异方差性1参参数数估估计计量量非非有有效效2变变量量的的显显著著性性检检验验失失去去意意义义3模

22、模型型的的预预测测失失效效1参参数数估估计计量量非非有有效效2变变量量的的显显著著性性检检验验失失去去意意义义3模模型型的的预预测测失失效效1完完全全共共线线性性下下参参数数估估计计量量不不存存在在2一一般般共共线线性性下下普普通通最最小小二二乘乘法法参参数数估估计计量量非非有有效效3参参数数估估计计量量经经济济含含义义不不合合理理4变变量量的的显显著著性性检检验验失失去去意意义义5模模型型的的预预测测功功能能失失效效检检验验解解释释变变量量之之间间的的相相关关性性1 1 采采 用用 普普 通通 最最 小小 二二 乘乘 法法估估 计计 模模 型型,以以 求求 得得 随随 机机误误 差差 项项

23、的的“近近 似似 估估 计计 量量”ei2 2 分分 析析 这这 些些“近近 似似 估估 计计 量量”之之 间间 的的 相相 关关 性性检检验验随随机机误误差差项项的的方方差差与与解解释释变变量量观观测测值值之之间间的的相相关关性性检验思绪n1断定系数检验法n2逐渐回归法检验方法多重共线性多重共线性序列相关性序列相关性异方差性异方差性处理方法排排除除引引起起共共线线性性的的变变量量差差分分法法减减小小参参数数估估计计量量的的方方差差1 1 广广义义最最小小二二乘乘法法2 2 差差分分法法(1 1)一一阶阶差差分分法法(2 2)广广义义差差分分法法1 1 回回归归检检验验法法2 2 冯冯诺诺曼曼

24、比比检检验验法法3 3D D.W W.检检验验加加权权最最小小二二乘乘法法1 图图示示检检验验法法2 等等级级相相关关系系数数法法3 戈戈里里瑟瑟检检验验4 巴巴特特列列特特检检验验5 戈戈德德菲菲尔尔特特夸夸特特检检验验4.6.1 案例一:服装市场需求函数案例一:服装市场需求函数1 1、建立模型、建立模型n 根据实际和阅历分析,影响居民服装类支出的主要要素有:可支配收入、居民流动资产拥有量、服装价钱指数、物价总指数。n 知某地域的有关资料,根据散点图判别,建立线性服装消费支出模型:n Y=0+1X+2K+3P1+4P0+2 2、样本数据、样本数据 由于R2较大且接近于1,而且 F=638.4

25、,大于临界值:F 0.05(4,5)=15.19,故以为服装支出与上述解释变量间总体线性关系显著。但由于参数K的估计值的t检验值较小未能经过检验,故解释变量间存在多重共线性。(1)用用 OLS 法法估估计计上上述述模模型型:01334.0197.0001.010.020.13PPKXY (-1.76)(3.71)(0.30)(-2.20)(2.24)r2=0.9980 R2=0.9965 F=638.43 3、估计模型、估计模型2检验简单相关系数检验简单相关系数n各解释变量间存在高度相关性,其中尤其以各解释变量间存在高度相关性,其中尤其以P1,P0间的相关系数为最高。间的相关系数为最高。列出

26、X,K,P1,P0 的相关系数矩阵:XKP1P0X10.9883 0.9804 0.9878K0.988310.9700 0.9695P10.9804 0.970010.9918P00.9878 0.9695 0.991813找出最简单的回归方式找出最简单的回归方式n可见,应选为初始的回归模型。可见,应选为初始的回归模型。分别作 Y 与 X,K,P1,P0 间的回归:XY118.024.1 KY327.0118.2 (-3.36)(42.48)(2.58)(15.31)2R=0.9950 F=1805.1 2R=0.9629 F=234.4 1516.05.38PY 0663.07.53PY

27、(-9.16)(12.53)(-14.77)(18.66)2R=0.9455 F=157.1 2R=0.9747 F=348.14 4逐渐回归逐渐回归 将其他解释变量分别导入上述初始回归模型,寻觅最正确回归方程。YCXKP1P02RF=f(X)-1.250.120.99501805.1t 值-3.3642.49=f(X,P1)1.530.13-0.040.9958826.9t0.318.57-0.57=f(X,P1,K)1.060.14-0.04-0.040.9941509.0t0.215.70-0.68-0.53=f(X,P1,P0)-12.450.10-0.190.310.99701003

28、.6t-1.927.55-2.472.59=f(X,P1,P0,K)-13.200.100.01-0.200.330.9965638.4-1.793.710.30-2.202.244 4、讨论:、讨论:在初始模型中引入P1,模型拟合优度提高,且参数符号合理,但P1的t检验未经过;再引入K,拟合优度虽有提高,但K与P1的t检验未能经过,且X与P1的t检验值及F检验值有所下降,阐明引入K并未对回归模型带来明显的“益处,K能够是多余的;去掉K,参与P0,拟合优度有所提高,且各解释变量的t检验全部经过,F值也增大了。将4个解释变量全部包括进模型,拟合优度未有明显改观,K的t检验未能经过,K显然是多余的

29、。5、结论回归方程以回归方程以Y=f(X,P1,P0)Y=f(X,P1,P0)为最优:为最优:Y=-12.45+0.10X-0.19P1+0.31P0Y=-12.45+0.10X-0.19P1+0.31P0back4.6.2 案例二:中国消费函数模型案例二:中国消费函数模型1 1、OLSOLS估计结果估计结果Dependent Variable:CONS Method:Least Squares Date:03/01/03 Time:00:46 Sample:1981 1996 Included observations:16 Variable Coefficient Std.Error t-

30、Statistic Prob.C 540.5286 84.30153 6.411848 0.0000 GDP 0.480948 0.021861 22.00035 0.0000 CONS1 0.198545 0.047409 4.187969 0.0011 R-squared 0.999773 Mean dependent var 13618.94 Adjusted R-squared 0.999739 S.D.dependent var 11360.47 S.E.of regression 183.6831 Akaike info criterion 13.43166 Sum squared

31、 resid 438613.2 Schwarz criterion 13.57652 Log likelihood-104.4533 F-statistic 28682.51 Durbin-Watson stat 1.450101 Prob(F-statistic)0.000000 2 2、差分法估计结果、差分法估计结果Dependent Variable:DCONS Method:Least Squares Date:03/18/03 Time:23:18 Sample(adjusted):1982 1996 Included observations:15 after adjusting

32、endpoints Variable Coefficient Std.Error t-Statistic Prob.DGDP 0.496723 0.026879 18.48006 0.0000 DCONS1 0.158504 0.051678 3.067122 0.0090 R-squared 0.992686 Mean dependent var 2457.533 Adjusted R-squared 0.992123 S.D.dependent var 2422.687 S.E.of regression 215.0169 Akaike info criterion 13.70288 Su

33、m squared resid 601019.5 Schwarz criterion 13.79728 Log likelihood-100.7716 Durbin-Watson stat 2.612102 3 3、比较、比较1:0.480950.496722:0.198540.15850在消除了共线性后,GDP对CONS的影响增大,CONS1对CONS的影响减少。n当模型存在共线性,将某个共线性变量去掉,当模型存在共线性,将某个共线性变量去掉,剩余变量的参数估计结果将发生变化,而且经剩余变量的参数估计结果将发生变化,而且经济含义发生变化;济含义发生变化;n严厉地说,实践模型由于总存在一定程度的共严厉地说,实践模型由于总存在一定程度的共线性,所以每个参数估计量并不真正反映对应线性,所以每个参数估计量并不真正反映对应变量与被解释变量之间的构造关系。变量与被解释变量之间的构造关系。一点阐明n当模型仅用于预测,而对参数估计值没有过高的要求,只需回归系数是显著的,符号和大小有意义,多重共线性问题可以忽略

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!