数理统计回归分析大作业

上传人:每**** 文档编号:56093330 上传时间:2022-02-19 格式:DOC 页数:17 大小:361.50KB
收藏 版权申诉 举报 下载
数理统计回归分析大作业_第1页
第1页 / 共17页
数理统计回归分析大作业_第2页
第2页 / 共17页
数理统计回归分析大作业_第3页
第3页 / 共17页
资源描述:

《数理统计回归分析大作业》由会员分享,可在线阅读,更多相关《数理统计回归分析大作业(17页珍藏版)》请在装配图网上搜索。

1、 应用数理统计第一次大作业 回归分析姓 名: 学 号: 班 级: 2014-12-20推荐精选国家财政收入的多元线性回归模型摘 要:本文以多元线性回归为出发点,选取我国自1990至2009年连续20年的财政收入为因变量,初步选取了7个影响因素,并利用统计软件PASW Statistics 17.0对各影响因素进行了筛选,最终确定了能反映财政收入与各因素之间关系的回归方程:从而得出了结论,最后我们用2010年的数据进行了验证,得出的结果(86482.00)在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。关键词:多元线性回归,逐步回归法,财政收入,SPSS 0符号说明变 量符号财

2、政收入Y工 业X1农 业X2进出口总额X3建 筑 业X4人 口X5商品销售额X6国内生产总值X7 推荐精选 1 引言定义:所谓回归分析法,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。 回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析;当研究的因果关系涉及因变量和两个或两个以上自变量时,叫做多元回归分析。此外,回归分析中,又依据描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性的,分为线性回归分析和非线性回归分析。通常线性回归分析法是最基本的分析方法,遇到非线性回归问题可以借助数学手段化为线性回归问题

3、处理。回归分析法预测是利用回归分析方法,根据一个或一组自变量的变动情况预测与其有相关关系的某随机变量的未来值。进行回归分析需要建立描述变量间相关关系的回归方程。根据自变量的个数,可以是一元回归,也可以是多元回归。根据所研究问题的性质,可以是线性回归,也可以是非线性回归。本文应用逐步回归的方法进行分析。中国作为世界第一大发展中国家,要实现中华民族的伟大复兴,必须把发展放在第一位。近年来,随着国家经济水平的飞速进步,人民生活水平日益提高,综合国力日渐强大。经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。政府有了强有力的财政保证才能够对全局进行把握和调控,对于

4、整个国家和社会的健康快速发展有着重要的意义。所以对国家财政的收入状况进行研究是十分必要的。国家财政收入的增长,宏观上必然与整个国家的经济有着必然的关系,但是具体到各个方面的影响因素又有着十分复杂的相关原因。为了研究影响国家财政收入的因素,我们就很有必要对其财政收入和影响财政收入的因素作必要的认识,如果能对他们之间的关系作一下回归,并利用我们所知道的数据建立起回归模型这对我们很有作用。而影响财政收入的因素有很多,如人口状况、引进的外资总额,第一产业的发展情况,第二产业的发展情况,第三产业的发展情况等等。本文从国家统计信息网上选取了1990-2009年这20年间的年度财政收入及主要影响因素的数据,

5、包括工业,农业,建筑业,零售贸易总额,进出口总额,人口总数等。文中主要应用逐步回归的统计方法,对数据进行分析处理,最终得出能够反映各个因素对财政收入影响的最“优”模型。推荐精选2解决问题的方法和计算结果2.1 样本数据的选取与整理本文在进行统计时,查阅中国统计年鉴2010中收录的1990年至2009年连续20年的全国财政收入为因变量,考虑一些与能源消耗关系密切并且直观上有线性关系的因素,初步选取这十九年的国内总产值、工业总产值、人口总数、建筑业、农业、商品零售总额、进出口总额等因素为自变量,分析它们之间的联系。根据选择的指标,从中国统计年鉴2010查选数据,整理如表2-1所示。2010年的数据

6、是在网上搜索到的。表2-1 1990-2009年财政收入及其影响因素统计表年份工业(亿元)农业(亿元)进出口总额(亿元)建筑业(亿元)人口(万人)社会商品零售总额(亿元)财政收入(亿元)国内生产总值(亿元)199018689.227662.15560.113451143338300.12937.118718.3199122088.6881577225.81564.31158239415.63149.4821826.2199227724.219084.79119.62174.411717110993.73483.3726937.319933969310995.511271.03253.51185

7、1714270.44348.9535260.0199451353.0315750.520381.94653.311985018622.95218.148108.5199554946.8620340.923499.95793.812112123613.86242.259810.5199662740.1622353.724133.88282.212238928360.27407.9970142.5199768352.6823788.426967.29126.512362631252.98651.1478060.8199867737.1424541.926849.71006212476133378.

8、19875.9583024.3199972707.0424519.129896.211152.912578635647.911444.0888479.2200085673.6624915.839273.212497.612674339105.713395.2398000.5200195448.9826179.642183.615361.512762743055.416386.04108068.22002110776.4827390.851378.218527.112845348135.918903.64119095.72003142271.2229691.870483.523083.81292

9、2752516.321715.25135174.02004201722.193623995539.127745.31299885950126396.47159586.72005251619.539450.9116921.834552.013075667176.631649.29185808.62006316588.9640810.8140971.441557.11314487641038760.2217522.72007405177.1348892.9166740.251043.71321298921051321.78267763.7推荐精选2008130260.233702.0179921.

10、518743.213280211603261330.35316228.82009135239.935226.0150648.122398.813347414894068518.30343464.72010707772.1660361.0202923.095206.013705415455483080.00397983.02.2 模型的建立与分析 DataSet0 从散点图中看出,国内生产总值、工业生产总值、进出口总额、建筑业、商品零售总额这5个变量与财政收入总量基本呈线性分布;而人口总数虽然也与财政收入存在正比的关系,但是从直观上看线性关系不显著,并且人口因素呈现指数关系。农业与财政收入总量的

11、线性关系不十分明显。因此为使得到的模型有显著的线性关系,在选取进入回归模型的自变量时,就要进行筛选。下面给出筛选过程。推荐精选RegressionNotesOutput Created20-十二月-2014 19时35分52秒CommentsInputDataF:数理作业收入.savActive DatasetDataSet1FilterWeightSplit FileN of Rows in Working Data File20Missing Value HandlingDefinition of MissingUser-defined missing values are treated

12、 as missing.Cases UsedStatistics are based on cases with no missing values for any variable used.SyntaxREGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS BCOV R ANOVA COLLIN TOL CHANGE ZPP /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT VAR00008 /METHOD=STEPWISE VAR00001 VAR00003 VAR00004 VAR0000

13、6 VAR00007 /RESIDUALS DURBIN.ResourcesProcessor Time0:00:00.032Elapsed Time0:00:00.032推荐精选NotesOutput Created20-十二月-2014 19时35分52秒CommentsInputDataF:数理作业收入.savActive DatasetDataSet1FilterWeightSplit FileN of Rows in Working Data File20Missing Value HandlingDefinition of MissingUser-defined missing v

14、alues are treated as missing.Cases UsedStatistics are based on cases with no missing values for any variable used.SyntaxREGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS BCOV R ANOVA COLLIN TOL CHANGE ZPP /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT VAR00008 /METHOD=STEPWISE VAR00001 VAR00003

15、 VAR00004 VAR00006 VAR00007 /RESIDUALS DURBIN.ResourcesProcessor Time0:00:00.032Elapsed Time0:00:00.032Memory Required3020 bytesMemory Required3020 bytesAdditional Memory Required for Residual Plots0 bytesDataSet1 F:数理作业收入.savVariables Entered/RemovedaModelVariables EnteredVariables RemovedMethod1建筑

16、业.Stepwise (Criteria: Probability-of-F-to-enter = .100).2进出口总额.Stepwise (Criteria: Probability-of-F-to-enter = .100).a. Dependent Variable: 财政收入Model SummarycModelRR SquareAdjusted R SquareStd. Error of the Estimate1.997a.995.9941518.61953推荐精选Model SummarycModelRR SquareAdjusted R SquareStd. Error o

17、f the Estimate1.997a.995.9941518.619532.998b.996.9951348.53313a. Predictors: (Constant), 建筑业b. Predictors: (Constant), 建筑业, 进出口总额2.998b.996.9951348.53313a. Predictors: (Constant), 建筑业b. Predictors: (Constant), 建筑业, 进出口总额c. Dependent Variable: 财政收入Model SummarycModelChange StatisticsR Square ChangeF

18、Changedf1df2Sig. F ChangeDurbin-Watson1.9953273.184118.0002.0015.827117.0271.088c. Dependent Variable: 财政收入ANOVAcModelSum of SquaresdfMean SquareFSig.1Regression7.549E917.549E93273.184.000aResidual4.151E7182306205.273Total7.590E9192Regression7.559E923.780E92078.377.000bResidual3.092E7171818541.599To

19、tal7.590E919a. Predictors: (Constant), 建筑业b. Predictors: (Constant), 建筑业, 进出口总额c. Dependent Variable: 财政收入推荐精选CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientsBStd. ErrorBetatSig.1(Constant)1169.872479.7272.439.025建筑业.919.016.99757.212.0002(Constant)817.357450.3331.815.087建筑业.80

20、6.049.87516.541.000进出口总额.044.018.1282.414.027a. Dependent Variable: 财政收入CoefficientsaModelCorrelationsCollinearity StatisticsZero-orderPartialPartToleranceVIF1建筑业.997.997.9971.0001.0002建筑业.997.970.256.08611.683进出口总额.965.505.037.08611.683a. Dependent Variable: 财政收入Excluded VariablescModelBeta IntSig.

21、Partial Correlation1工业.021a.909.376.215进出口总额.128a2.414.027.505商品销售总额-.215a-1.663.115-.374推荐精选Excluded VariablescModelBeta IntSig.Partial Correlation1工业.021a.909.376.215进出口总额.128a2.414.027.505商品销售总额-.215a-1.663.115-.374国内总产值.284a2.026.059.4412工业-.051b-1.543.142-.360商品销售总额-.062b-.399.695-.099国内总产值.141

22、b.835.416.204a. Predictors in the Model: (Constant), 建筑业b. Predictors in the Model: (Constant), 建筑业, 进出口总额国内总产值.284a2.026.059.4412工业-.051b-1.543.142-.360商品销售总额-.062b-.399.695-.099国内总产值.141b.835.416.204a. Predictors in the Model: (Constant), 建筑业b. Predictors in the Model: (Constant), 建筑业, 进出口总额c. Dep

23、endent Variable: 财政收入Excluded VariablescModelCollinearity StatisticsToleranceVIFMinimum Tolerance1工业.5531.810.553进出口总额.08611.683.086商品销售总额.01760.479.017国内总产值.01376.062.0132工业.2014.967.031商品销售总额.01095.518.006国内总产值.009117.017.009c. Dependent Variable: 财政收入Coefficient CorrelationsaModel建筑业进出口总额1Correla

24、tions建筑业1.000Covariances建筑业.000推荐精选Coefficient CorrelationsaModel建筑业进出口总额1Correlations建筑业1.000Covariances建筑业.0002Correlations建筑业1.000-.956进出口总额-.9561.000Covariances建筑业.002.000进出口总额.000.0002Correlations建筑业1.000-.956进出口总额-.9561.000Covariances建筑业.002.000进出口总额.000.000a. Dependent Variable: 财政收入Collinear

25、ity DiagnosticsaModelDimensionVariance ProportionsEigenvalueCondition Index(Constant)建筑业进出口总额111.7061.000.15.152.2942.411.85.85212.6221.000.05.01.012.3572.709.89.02.013.02111.228.06.97.98a. Dependent Variable: 财政收入Residuals StatisticsaMinimumMaximumMeanStd. DeviationNPredicted Value2146.809369392.66

26、4120556.745519946.2837320Residual-2180.210212561.83057.000001275.5846420Std. Predicted Value-.9232.448.0001.00020Std. Residual-1.6171.900.000.94620a. Dependent Variable: 财政收入将X4建筑业和X3进出口总额纳入自变量时得到的模型效果最为显著,回归方程如下:推荐精选3 结论本次大作业,根据查阅中国统计年鉴,列举了影响财政收入的7个因素。从直观上考虑,人口总量、农业两个因素与财政收入存在线性关系,所以特意把这两个变量列到其中,但是

27、散点图和回归效果显示这2个因素并没有进入逐步回归模型中,由此看来,这两项因素与财政收入存在的关系可能不是严格线性的,或者这种线性关系是长期的线性关系。另外,在对进入模型的5个因素进行回归时发现,因变量对单独变量的回归性很显著,但是整合成多元回归出现了某些回归系数不显著的现象,具体原因可能是由于数据选取的太少,未能体现出长期线性这一特点;或是各因素之间存在相关性。虽然得到的几个模型系数都不是很显著,但经综合比较,选取了一个较为显著的模型作为最“优”解。对得到的最“优”回归模型做预测,置信度为95%。查阅网上公布结果,得到2010年的X4建筑业为95206.00(亿元),X3进出口总额为20292

28、3.00(亿元),Y财政收入为83080.00(亿元),将自变量带入回归方程: = 817.357+0.044202923.00+95206.00=86482.00CoefficientsaModel95.0% Confidence Interval for BLower BoundUpper Bound2(Constant)-132.7631767.476推荐精选CoefficientsaModel95.0% Confidence Interval for BLower BoundUpper Bound2(Constant)-132.7631767.476建筑业.704.909进出口总额.0

29、06.082建筑业.704.909进出口总额.006.082a. Dependent Variable: 财政收入将上表数值代入得到置信度为95%的预测区间为(79067.641,104949.416),与查得的2010财政收入为83080.00(亿元)在预测区间内。得到的数据模型显示财政收入与建筑业、进出口总额有着密切的关系,这也很符合目前国家的经济状况。不过由于调研时间有限,上述回归模型存在一些不足,比如两个自变量之间的VIF=11.68310,还需要不断查阅资料加以改进。但在一定程度上体现了与选取的自变量之间的线性关系,并能对因变量做出近似的预测。综合来看,数据模型基本达到了预期的目的。 (注:可编辑下载,若有不当之处,请指正,谢谢!) 推荐精选

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!