数理统计回归分析-国家财政收入的多元线性回归模型

上传人：无*** 文档编号：169826328 上传时间：2022-11-17 格式：DOC 页数：24 大小：814KB

收藏版权申诉举报下载

第1页 / 共24页

第2页 / 共24页

第3页 / 共24页

下载文档到电脑，查找使用更方便

10 积分

下载资源

资源描述：

《数理统计回归分析-国家财政收入的多元线性回归模型》由会员分享，可在线阅读，更多相关《数理统计回归分析-国家财政收入的多元线性回归模型（24页珍藏版）》请在装配图网上搜索。

1、应用数理统计学号：姓名：班级： 2010年12月国家财政收入的多元线性回归模型摘要本文以多元线性回归为出发点，选取我国自1990至2008年连续19年的财政收入为因变量，初步选取了7个影响因素,并利用统计软件PASW Statistics 17.0对各影响因素进行了筛选，最终确定了能反映财政收入与各因素之间关系的“最优”回归方程：从而得出了结论，最后我们用2009年的数据进行了验证，得出的结果在误差范围内，表明这个模型可以正确反映影响财政收入的各因素的情况。关键词：多元线性回归，逐步回归法，财政收入，SPSS 0符号说明变量符号财政收入Y工业X1农业X2受灾面积X3建筑业X4人

2、口X5商品销售额X6进出口总额X7 1 引言中国作为世界第一大发展中国家，要实现中华民族的伟大复兴，必须把发展放在第一位。近年来，随着国家经济水平的飞速进步，人民生活水平日益提高，综合国力日渐强大。经济上的飞速发展并带动了国家财政收入的飞速增加，国家财政的状况对整个社会的发展影响巨大。政府有了强有力的财政保证才能够对全局进行把握和调控，对于整个国家和社会的健康快速发展有着重要的意义。所以对国家财政的收入状况进行研究是十分必要的。国家财政收入的增长，宏观上必然与整个国家的经济有着必然的关系，但是具体到各个方面的影响因素又有着十分复杂的相关原因。为了研究影响国家财政收入的因素，我们就很有必要对其

3、财政收入和影响财政收入的因素作必要的认识，如果能对他们之间的关系作一下回归，并利用我们所知道的数据建立起回归模型这对我们很有作用。而影响财政收入的因素有很多，如人口状况、引进的外资总额，第一产业的发展情况，第二产业的发展情况，第三产业的发展情况等等。本文从国家统计信息网上选取了1990-2009年这20年间的年度财政收入及主要影响因素的数据，包括工业，农业，建筑业，批发和零售贸易餐饮业，人口总数等。文中主要应用逐步回归的统计方法，对数据进行分析处理，最终得出能够反映各个因素对财政收入影响的最“优”模型。2解决问题的方法和计算结果2.1 样本数据的选取与整理本文在进行统计时，查阅中国统计年鉴20

4、10中收录的1990年至2009年连续20年的全国财政收入为因变量，考虑一些与能源消耗关系密切并且直观上有线性关系的因素，初步选取这十九年的国内总产值、工业总产值、人口总数、建筑业、农业、受灾面积和商品零售总额等因素为自变量，分析它们之间的联系。根据选择的指标，从中国统计年鉴2010查选数据，整理如表2-1所示。表2-1 1990-2009年财政收入及其影响因素统计表工业（亿元）农业（亿元）受灾面积（千公顷）建筑业（亿元）人口（万人）社会商品零售总额（亿元）财政收入（亿元）国民生产总值（亿元）199018689.227662.13847413451143338300.12937.118718.

5、3199122088.688157554721564.31158239415.63149.4821826.2199227724.219084.7513332174.411717110993.73483.3726937.319933969310995.5488293253.511851714270.44348.9535260.0199451353.0315750.5550434653.311985018622.95218.148108.5199554946.8620340.9458215793.812112123613.86242.259810.5199662740.1622353.746989

6、8282.212238928360.27407.9970142.5199768352.6823788.4534299126.512362631252.98651.1478060.8199867737.1424541.9501451006212476133378.19875.9583024.3199972707.0424519.14998111152.912578635647.911444.0888479.2200085673.6624915.85468812497.612674339105.713395.2398000.5200195448.9826179.65221515361.512762

7、743055.416386.04108068.22002110776.4827390.847119.118527.112845348135.918903.64119095.72003142271.2229691.854506.323083.812922752516.321715.25135174.02004201722.193623937106.25627745.31299885950126396.47159586.72005251619.539450.938818.22534552.013075667176.631649.29185808.62006316588.9640810.841091

8、.4141557.11314487641038760.2217522.72007405177.1348892.935972.2351043.71321298921051321.78267763.72008130260.233702.056234.2618743.213280211603261330.35316228.82009135239.935226.050223.5122398.81334741489468518.30343464.72.2 模型的建立与分析将数据录入统计软件excel，建立统计数据库，先建立财政收入与各变量的散点图，如图2-1至图2-7所示。图2-1 财政收入与工业总产值

9、的散点图图2-2 财政收入与农业总产值的散点图图2-3 财政收入与受灾面积的散点图图2-4 财政收入与建筑业的散点图图2-5 财政收入与人口总数的散点图图2-6 财政收入与商品零售总额的散点图图2-7 财政收入与国内总产值的散点图从散点图中看出，国内生产总值、工业生产总值、农业、建筑业、商品零售总额这四个变量与财政收入总量基本呈线性分布；而人口总数虽然也与财政收入存在正比的关系，但是从直观上看线性关系不显著，并且人口因素呈现指数关系。受灾面积与财政收入总量的关系不明显。因此为使得到的模型有显著的线性关系，在选取进入回归模型的自变量时，就要进行筛选。下面给出筛选过程。（1）将国内生产总值、农业

10、、工业生产总值、建筑业和商品零售总额纳入自变量，逐步回归法，输出结果如图2-8(a)(b)所示。从结果可以看出，该回归的F值为1600.595，查表得，显而易见，回归的显著性很好；但是由于在这里我们要分析的是影响财政收入的具体产业，而该结果只说明了财政收入与国民生产总值的相关性很好，并不能说明问题的根本所在。所以在下面的分析中我们将剔除国民生产总值这个因素做进一步的分析。Anovab模型平方和df均方FSig.1回归7.506E917.506E91600.595.000a残差8.441E7184689341.382总计7.590E919a. 预测变量: (常量), 国民生产总值b. 因变量:

11、财政收入模型汇总b模型RR 方调整 R 方标准估计的误差更改统计量Durbin-WatsonR 方更改F 更改df1df2Sig. F 更改1.994a.989.9882165.489.9891600.595118.000.200a. 预测变量: (常量), 国民生产总值b. 因变量: 财政收入图2-8(a)(b) 输出结果（2）将工业生产总值、农工、建筑业和商品零售总额纳入自变量，逐步回归法，输出结果如图2-9(a)(b)(c)所示。Anovab模型平方和df均方FSig.1回归4.757E914.757E930.215.000a残差2.834E9181.574E8总计7.590E919a.

12、预测变量: (常量), 农业b. 因变量: 财政收入模型汇总b模型RR 方调整R 方标准估计的误差更改统计量Durbin-WatsonR 方更改F 更改df1df2Sig. F 更改1.792a.627.60612546.807.62730.215118.000.390a. 预测变量: (常量), 农业b. 因变量: 财政收入图2-9(a)(b)(c) 输出结果从结果可以看出，该回归的F值为30.215，查表得，显而易见，回归的显著性很好；但是对回归系数的显著性来说，从直方图中可以看出，采用以上三个变量作为自变量得到的线性模型仍不是很好。这个模型也不是理想中的模型，所以下面我们试图根据我们

13、的判断对样本数据进行筛选，力求得出比较理想的模型。（3）下面我将农业这个变量暂且剔除，只采用工业、建筑业和商品零售总额作为自变量，采用逐步回归法，输出结果如图2-10(a)(b)所示。从结果可以看出，该回归的F值为20.219，查表得，显而易见，回归的显著性很好；但是对回归系数的显著性来说，建筑业的t检验值为0.0002，查表得，显然回归系数的显著性不好。以上检验得到的与利用P值法（图中的Sig值）得到的检验结果相符。因此，采用以上三个变量作为自变量得到的线性模型仍不是很好。同时可以看出，只对建筑业做回归分析时，F值为20.19，查表得到，这证明一元回归模型和回归系数的显著性都很好。Anova

14、b模型平方和df均方FSig.1回归4.015E914.015E920.219.000a残差3.575E9181.986E8总计7.590E919a. 预测变量: (常量), 建筑业b. 因变量: 财政收入模型汇总b模型RR 方调整R 方标准估计的误差更改统计量Durbin-WatsonR 方更改F 更改df1df2Sig. F 更改1.727a.529.50314092.439.52920.219118.000.546a. 预测变量: (常量), 建筑业b. 因变量: 财政收入图2-10(a)(b) 输出结果（4）只将工业和商品零售总额纳入自变量，输出结果如图2-11(a)(b)所示。Ano

15、vab模型平方和df均方FSig.1回归3.498E913.498E915.390.001a残差4.092E9182.273E8总计7.590E919a. 预测变量: (常量), 工业。b. 因变量: 财政收入系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量)4994.3655206.020.959.350工业.132.034.6793.923.0011.0001.000a. 因变量: 财政收入图2-11(a)(b) 输出结果从上图结果中可以看出，对这两个变量做回归分析时，F值为15.39，证明一元回归模型和回归系数的显著性都很好。2.3 分析结果由以上

16、筛选和分析过程可以看出，财政收入Y分别对X7国内总产值、X1工业总产值、X4建筑业及商品零售总额X6进行一元回归分析时，其回归的显著性都很好，但是综合为一个多元回归模型时，则出现了某些系数不显著的现象。综合比较选取的几个多元模型，将X4建筑业和X6商品零售总额纳入自变量时得到的模型效果最为显著，回归方程如下：其中，。3 结论本次大作业，根据查阅中国统计年鉴，列举了影响财政收入的7个因素。从直观上考虑，人口总量与受灾面积与财政收入存在线性关系，所以特意把这两个变量列到其中，但是散点图和回归效果显示这2个因素并没有进入逐步回归模型中，由此看来，这两项因素与财政收入存在的关系可能不是严格线性的，或者

17、这种线性关系是长期的线性关系。另外，在对进入模型的5个因素进行回归时发现，因变量对单独变量的回归性很显著，但是整合成多元回归出现了某些回归系数不显著的现象，具体原因可能是由于数据选取的太少，未能体现出长期线性这一特点。虽然得到的几个模型系数都不是很显著，但经综合比较，选取了一个较为显著的模型作为最“优”解。对得到的最“优”回归模型做预测，置信度为95%。查阅中国统计年鉴，得到2009年的X4建筑业为22398.8（亿元），X6商品零售总额为14894（亿元），Y财政收入为68518.30（亿元），将自变量带入回归方程：预测区间为，其中。代入数值得到置信度为95%的预测区间为，与查得的2009年

18、能源消耗总量68518.30（亿元）比较接近。得到的数据模型显示财政收入与建筑业、商品零售额有着密切的关系，这也很符合目前国家的经济状况。不过由于调研时间有限，上述回归模型存在一些不足，还需要不断查阅资料加以改进。但在一定程度上体现了与选取的自变量之间的线性关系，并能对因变量做出近似的预测。综合来看，数据模型基本达到了预期的目的。参考文献1 孙海燕,周梦,李卫国,冯伟. 应用数理统计M. 北京:北京航空航天大学数学系, 1999.2 张建同,孙昌言. 以Excel和SPSS为工具的管理统计M. 北京:清华大学出版社，2002.3 国家统计局.2010年中国统计年鉴M. 中国统计出版社，2010

19、.逐步回归法建立纳斯达克股市指数回归模型一问题描述为了研究纳斯达克股市的变化规律，建立回归方程，分析影响股票价格趋势变动的因素。这里我们选了3个影响股票价格指数的经济变量：x1是成交额(万$)，x2是国际贸易金额（100万$），x3是美元汇率。本例选择成交额x1来反映市场状况。Y为股票指数。本例采集了以上变量1996-2007年12年的数据资料，如表1所示。表1 1996-2007年纳斯达克股市指数年份股票指数X1是美元汇率x2是国际贸易金额x3是成交额x4优惠利率19963849.08556.1085.8589468.10113.9619972531.73317.4030.1774462

20、.60170.6619982262.34302.1026.2067884.60188.4219991059.94253.603.3334634.4070.1920001488.78279.9010.7846759.4097.4520011877.95290.6020.3758478.10162.8420027242.601333.50347.85136875.9093.4220032949.06340.8048.0378345.20141.8520043349.04413.4062.9082067.50125.8720054637.66719.10128.0997314.80112.89200

21、65480.03903.40172.55105172.30127.2820076208.271108.60259.01117390.20104.59二异方差问题分析1.异方差模型经典线性回归模型可以表示为，假设有n组观察值，则原模型方程可表示为：。在经典线性回归模型中，假设随机误差项是一个随机变量，且服从数学期望为零，方差为一常数的正态分布，即，这一假设称为随机误差项的同方差性假设。另外还假设不同观察值的随机误差项之间是不相关的，而且随机误差项与项不趋于共同变化。但在实际的经济问题中，上述假设不一定满足。比如，当自变量变化较大时（如在一些横截面数据中），的方差可能随的变化而变化；而当和之间存

22、在一定的顺序关系时（如在时间序列中），可能与并不独立（ji）。当同方差（homosce dasticity）或等方差（equal variance）性假定不满足，也就是说，随机误差项的方差不等于一个常数，即则称随机误差项具有异方差（heteroscedasticity）或非同方差（unequal variance）性。在模型（1-3）中，除随机误差项具有异方差性外，其它基本假设都能满足，则称这种模型为异方差的线性回归模型，简称异方差模型。2 异方差性的后果变量的显著性检验失去意义，在多元线性回归模型的显著性检验中,构造了t 统计量,在该统计量中包含有随机误差项共同的方差,并且有t 统计量服从自

23、由度为( n - k - 1) 的t 分布. 如果出现了异方差性, t 检验就失去意义. 采用其它检验也是如此.模型的预测失效，一方面,由于上述后果,使得模型不具有良好的统计性质;另一方面,在预测值的置信区间中也包含有随机误差项共同的方差，所以当模型出现异方差性时,它的预测功能失效.3异方差性检验(1)残差图分析法残差图分析法是一种直观、方便的分析法，它以残差e为纵坐标，以任何其他的量为横坐标画散点图。常用的横坐标有有三种选择：以拟合值为横坐标；以Xi为横坐标，i=1,2p;以观察时间或序号为横坐标。一般情况下，当回归模型满足所有假设时，残差图上的n个点的散布会应是随机的，无任何规律的。如果

24、回归模型存在异方差，残差图上的点的散步会呈现相应的趋势。（2）等级相关系数法等级相关系数检验法又称斯皮尔曼（spearman）检验，是一种应用较广泛的方法。这种检验法既可用于大样本，又可用于小样本。（3）格莱斯尔（Glejser）检验格莱斯尔检验的中心思想是随机项的估计值e与自变量是有关系的，是自变量的函数，它随J值的增减而变化。进行格莱斯尔检验主要有两个步骤：1）以所有解释变量Xi来解释被解释量y，估计其参数，计算出随机项的估计值e。2）以e为被解释变量，以某个解释变量Xi为解释变量，建立如下方程：以Xi的不同幂次的形式f(Xi),分别估计两个参数，选择最佳的拟合形式，并对它们的显著性进行检

25、验。如果它们显著性不为0，则认为异方差性存在，因为随机项与Xi存在相关性。否则就具有同方差性。4 异方差性问题的处理方法当研究的问题存在异方差性时，就违背了线性回归模型的假设。此时，就不能用普通最小二乘法进行参数估计，必须寻求适当的补救方法，对原来的模型进行变换，使变换后的模型满足同方差性假设，然后进行模型参数的估计，就可到理想的回归模型。消除异方差性的方法通常有加权最小二乘法（Weighted Least Square）、BOX-COX变换法、方差稳定性变换法。在SPSS软件中提供了加权最小二乘法。三多重共线性分析在多元线性回归模型的基本假设中，假定解释变量之间不存在密切的线性关系。如果存

26、在，则称它们存在多重共线性（Multi-Collinearity）。1多重共线性带来的问题当回归模型存在多重共线性时，有rk(x)p+1,所以不存在。这样参数向量的也不存在,对角线元素较大，所以参数向量的协方差也很大。这样虽然用OLSE还能得到参数向量的无偏估计，不能正确判断解释变量的影响程度，使估计精度降低，并且估计结果的波动性很大，这严重影响了估计量的经济意义解释。2 多重共线性的诊断本文介绍三种诊断方法（1）判定系数法设有p个自变量的回归模型为：y=f(x1,x2,.,xp)，为了诊断多重共线性，使模型中每一个解释变量分别为其余解释变量作为解释变量构造p个回归方程：X1=f(X2,X3,

27、Xp);X2=f(X1,X2,Xp);Xj=f(X1,X2,.Xj-1,Xj+1,Xp);Xp=f(X1,X1,.Xp)对上述p个方程进行参数估计，并计算样本决定系数。若这些决定系数中的最大者接近1，比如说，则说明该变量Xj可以用其他解释变量线性表示，则存在多重共线性。并且还同时找出了多重共线性的表达式。这种方法比较适合于解释变量少的模型。这种方法可以在SPSS软件上完成。（2）条件数被称为方差的条件数（Condition Number）.利用条件数可以度量的特征根散布程度，可以用它来判断多重共线性是否存在以及多重共线性的严重程度。通常认为0k100时，设计矩阵X没有多重共线性；100k100

28、0,则认为存在严重的多重共线性。在SPSS软件中没有该方法。（3）方差扩大因子设为Xj对其余p-1个变量的复相关系数，则被称为方差扩大因子（Variance inflation Factor,简记为VIF）。如果记的方差仅差一个因子，是由两个因子和构成，且与OLSE的方差仅差一个因子。因为度量了自变量Xj与其余p-1个自变量的线性依赖度，这种相关程度越强，说明自变量之间的多重共线性越严重，就越接近1，VIFj也就越大。反之则相反。由此可见VIF的大小反映了自变量之间是否存在多重共线性，由此可由它来度量多重共线性的严重程度。经验表明，当VIF10时，就说明自变量间有严重的多重共线性，且这种共线性

29、可能会过度地影响最小二乘估计值。以上三种方法都是诊断共线性是否存在的专门方法，相对这几种方法，还有一些在建模过程中能顺便主观判断的非正规方法。3消除多重共线性的方法当通过某种检验，发现解释变量中存在严重的多重共线性时，就要设法消除这种共线性。消除这种共线性的方法很多，常用的有下面几种。（1）剔除一些不重要的解释变量。通常在经济问题的建模中，由于人们认识水平的局限，容易考虑更多的自变量。当涉及自变量较多时，大多数回归方程都受到多重共线性的影响。这时，最常用的办法就是舍去一些与y相关程度低、而与其他自变量高度相关的变量，然后重新建立回归方程。（2）最大样本容量。建立一个实际经济问题的回归模型，如果

30、所收集的样本数据太少，也容易产生多重共线性。这时可以通过增加样本容量来减弱多重共线性的程度。（3）改变变量定义形式。对于样本数据是时间序列资料时，回归方程存在的多重共线性，我们可以重新定义变量的形式，差分法就是改变变量定义形式的一种方法。（4）利用已知信息。即利用一些先验信息组合某些变量。例如模型中的两个参数b1和b2满足关系：b1=5b2，这时可将这个等式代入到原模型中，把模型的变量综合到一起，再利用最小二乘法进行估计。（5）回归系数的有偏估计。这种方法提出以引人偏误为代价来提高估计量稳定性的方差，如岭回法、主成分法、偏最小二乘法等。（6）将截面数据与时序相结合。（7）采用新的样本数据。在

31、数据中重新抽取一个样本，有可能会减弱其中变量的多重共线性，因为数据样本的变化，往往会对方程的回归系数及其标准误差产生影响。这些消除多重共线性的方法都可以在SPSS软件中间接完成。四数据分析与模型建立1 对变量引入/剔除方式信息表的分析表2 输入移去的变量a模型输入的变量移去的变量方法1x3成交额.步进（准则: F-to-enter 的概率 = .100）。2x1美元汇率.步进（准则: F-to-enter 的概率 = .100）。3x2国际贸易金额.步进（准则: F-to-enter 的概率 = .100）。a. 因变量: y股票指数通过逐步回归产生的三种模型1、2、3，模型1的自变量只有X

32、3，模型2的自变量有X3和X1，模型3的自变量有X2、X3和X1。表2显示变量的引入和剔除，以及引入或剔除的标准。逐步回归方法最先引入变量X3，建立模型1。接着引入变量X1，没有变量被剔除，建立模型2。最后引入X2，没有变量被剔除，建立模型3。2 对模型汇总表的分析表3 模型汇总模型RR 方调整 R 方标准估计的误差更改统计量Durbin-WatsonR 方更改F更改df1df2Sig. F 更改1.984a.967.964370.28084.967296.554110.0002.997b.995.994154.49654.02848.44119.0003.999c.997.996121.8

33、4788.0026.46918.0351.236a. 预测变量: (常量), x3成交额。b. 预测变量: (常量), x3成交额, x1美元汇率。c. 预测变量: (常量), x3成交额, x1美元汇率, x2国际贸易金额。d. 因变量: y股票指数表3显示了各模型的拟合情况。模型3的自相关系数（R）为0.999，判断系数为0.997。从统计变量的改变看，模型1的改变值绝对大于其他两个模型，这说明与该模型相关的自变量X3是因变量很好的预测。3 对方差分析表的分析表4 方差分析表Anovad模型平方和df均方FSig.1回归4.066E714.066E7296.554.000a残差137107

34、8.97710137107.898总计4.203E7112回归4.182E722.091E7875.944.000b残差214822.633923869.181总计4.203E7113回归4.191E731.397E7940.986.000c残差118775.238814846.905总计4.203E711a. 预测变量: (常量), x3成交额。b. 预测变量: (常量), x3成交额, x1美元汇率。c. 预测变量: (常量), x3成交额, x1美元汇率, x2国际贸易金额。d. 因变量: y股票指数表4 显示各模型的方差分析结果。模型3的P值为0.000.05，拒绝原假设，认为因变量与

35、其他三变量X2、X3和X1之间有线性关系。4 对模型回归系数表的分析表5 回归系数a模型非标准化系数标准系数tSig.相关性共线性统计量B标准误差试用版零阶偏部分容差VIF1(常量)-1842.387332.416-5.542.000x3成交额.066.004.98417.221.000.984.984.9841.0001.0002(常量)-936.587190.196-4.924.001x3成交额.039.004.5799.222.000.984.951.220.1446.945x1美元汇率2.328.334.4376.960.000.973.918.166.1446.9453(常量)-1

36、507.722270.044-5.583.001x3成交额.041.003.60811.966.000.984.973.225.1377.317x1美元汇率4.316.825.8105.232.001.973.880.098.01567.916x2国际贸易金额-7.2232.840-.403-2.543.035.966-.669-.048.01471.164a. 因变量: y股票指数表5显示各模型的偏回归系数、标准化的偏回归系数及其对应的检验值；还显示了模型中的各变量与因变量的零阶相关、偏相关和部分相关；还有多重共线性统计量。根据模型3可以建立多元线性回归方程为：，这里X3的系数为负，显然不合

37、理，原因可能是由于自变量之间存在多重共线性。5对被剔除的变量信息表的分析表6 已排除的变量模型Beta IntSig.偏相关共线性统计量容差VIF最小容差1x1美元汇率.437a6.960.000.918.1446.945.144x2国际贸易金额.383a3.807.004.785.1377.277.137x4优惠利率-.144a-3.910.004-.793.9861.014.9862x2国际贸易金额-.403b-2.543.035-.669.01471.164.014x4优惠利率-.048b-1.426.192-.450.4582.181.0673x4优惠利率-.047c-1.982.08

38、8-.600.4582.181.013a. 模型中的预测变量: (常量), x3成交额。b. 模型中的预测变量: (常量), x3成交额, x1美元汇率。c. 模型中的预测变量: (常量), x3成交额, x1美元汇率, x2国际贸易金额。d. 因变量: y股票指数表6显示各模型变量的有关统计量。对模型3来说，它的偏回归系数的P值都大于0.05，接收原假设，不能把这些变量加入方程中6 对多重共线性的诊断及排除表7 多重共线性诊断a模型维数特征值条件索引方差比例(常量)x3成交额x1美元汇率x2国际贸易金额111.9471.000.03.032.0536.055.97.97212.8401.00

39、0.01.00.002.1504.352.20.00.123.01017.140.801.00.87313.6471.000.00.00.00.002.3413.271.02.00.00.013.01019.158.34.98.04.014.00238.535.64.02.96.98a. 因变量: y股票指数表7显示多重共线性的诊断表，它包括3项诊断值：特征值、条件数和方差比率。特征值表明在自变量中存在多少截然不同的维数，当几个特征值都接近0是，变量是高度相关的，这样的数据微小改变将导致系数估计值的改变较大。条件数是最大特征值对每一个连续特征值的比率的平方根，若条件数大于15则表明可能存在多重

40、共线问题，若大于30则表明存在严重的多重共线性问题方差比率是能够被每一个主成分解释的估计值方差的比率，这个主成分是与其对应的特征值相关的。当与高条件数相关的成分充分贡献于两个或者更多的变量方差时就产生了多重共线性。表7中变量X2的条件数大于30，说明回归方程存在多重共线性。6.1 多重共线性的诊断与处理(一)运用方差扩大因子法。如表5所示,x1、x2的方差扩大因子VIF1=67.916,VIF2=71.164。远超过10,说明回归方程存在严的多重共线性。(二)剔除一些解释变量。X2的方差扩大因子最大,剔除x2,用SPSS诊断，对数据进行分析可得下列几个表：表8 模型汇总c模型RR 方调整 R

41、方标准估计的误差更改统计量Durbin-WatsonR 方更改F 更改df1df2Sig. F 更改1.984a.967.964370.28084.967296.554110.0002.997b.995.994154.49654.02848.44119.0001.168a. 预测变量: (常量), x3成交额。b. 预测变量: (常量), x3成交额, x1美元汇率。c. 因变量: y股票指数表9 回归系数a模型非标准化系数标准系数tSig.相关性共线性统计量B标准误差试用版零阶偏部分容差VIF1(常量)-1842.387332.416-5.542.000x3成交额.066.004.984

42、17.221.000.984.984.9841.0001.0002(常量)-936.587190.196-4.924.001x3成交额.039.004.5799.222.000.984.951.220.1446.945x1美元汇率2.328.334.4376.960.000.973.918.166.1446.945a. 因变量: y股票指数此时x1、x3的方差扩大因子分别为VIF1=6.945,VIF3=6.945。同时,复相关系数R=0.997,决定系数R2=0.997,F=8754,回归系数的显著性检验P值均小于0.05,故可认为方程具较强的拟合性,x1、x3整体上与y高度相关。7对残差统

43、计表的分析表10 残差统计量a极小值极大值均值标准偏差N预测值971.91917304.21443578.04001951.9730512残差-142.10725187.85078.00000103.9122212标准预测值-1.3351.909.0001.00012标准残差-1.1661.542.000.85312a. 因变量: y股票指数表10是残差统计结果。主要显示预测值、标准化预测值、残差和标准化残差等统计量的最大值、最小值、均值和标准差。可见标准化残差的最大绝对值为1.5428迪欧残差分布直方图的分析图1 回归标准化残差图1是标准化残差的直方图。正态曲线被加在直方图上，判断标准

44、化残差是否呈正态分布。从图可以看见，它服从近似正态分布。9对残点图的分析图2散点图图2是散点图。选用DEPENDENT（X纵轴变量）与*ZPRED（Y横轴变量）作图，绘制回归残差项e的图形，从图中可以看出变量间不存在自相关性。9.1异方差性消除若模型存在异方差性，则可以进行如下操作，依次点击AnalyzeRegressionWeightEstima-tion,将人均食品消费支出选为因变量,人均纯收入选为自变量,人均纯收入选为WeightVariable, Power取值范围从-2到2,每次变化0.5,即可得到结果。五总结通过以上分析，可得回归方程为：代表纳斯达克指数，表示美元汇率（%）, 代表成交额（100万$）。从上述回归方程看，影响纳斯达克指数的主要因素为成交额和美元汇率。成交额作为反映市场因素的主要指标对股票价格有主要影响。纳斯达克股市上，成交额每增长100万美元，指数上涨0.039个百分点。美元汇率反映国际金融情况的指标，它代表金融环境对股票价格的影响，美元汇率没增长一个百分点，指数上涨2.328个百分点。23

展开阅读全文

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

备案号:蜀ICP备2024067431号-1 川公网安备51140202000466号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知装配图网，我们立即给予删除！

数理统计回归分析-国家财政收入的多元线性回归模型

最新文档

相关资源

相关搜索