(整理)多元线性回归—国内旅游收入因素研究分析

上传人:ya****h 文档编号:128428502 上传时间:2022-08-01 格式:DOCX 页数:11 大小:166.50KB
收藏 版权申诉 举报 下载
(整理)多元线性回归—国内旅游收入因素研究分析_第1页
第1页 / 共11页
(整理)多元线性回归—国内旅游收入因素研究分析_第2页
第2页 / 共11页
(整理)多元线性回归—国内旅游收入因素研究分析_第3页
第3页 / 共11页
资源描述:

《(整理)多元线性回归—国内旅游收入因素研究分析》由会员分享,可在线阅读,更多相关《(整理)多元线性回归—国内旅游收入因素研究分析(11页珍藏版)》请在装配图网上搜索。

1、统计学课程案例研究题目:内旅游收入因素研究分析学院:经济管理学院指导教师:王秀芝团队成员:卢盈(11097111)欧阳园园(11096103)黄升(11096119)范哲武(11096118)陈光星(11096117)二O一四年五月1. 多元线性回归的概念及主要内容框架1.1多元线性回归的概念多元线性回归模型是用两个或两个以上的解释变量来解释因变量的一种模型。设为Y因变量,X,X,,X为k个用来说明Y的被称为解释变量的不同变12k量,其中X恒等于1,则Y二卩+卩X+A+卩X+卩,(i二1,2A,n)(1)式称为多元线性回归模型。其中,1i122ikkii卩(i=l,2,A,n)为随即扰动项;参

2、数卩,卩,A,卩i称为回归系数。若令ryrXXAX(叮11121Ak1C11YXXX,P=P卩Y=2,X=1222k22,卩=2MMMMMMMY丿nX1nX2nAX丿knP丿kn则(1)式可用矩阵形式表示为:Y二XB+P式。1.2多元线性回归的主要内容框架多元线性回归多元线性回归模型(最小二乘估计统计检验及回归处理勺拟合优度检验)线性关系检验-F显著性检验哑变量回归I回归系数检验t多重共线性处理彭响因衰分析爭元线性回归的应用,I估计与预测2. 多元线性回归模型的检验2.1拟合优度的检验回归方程的拟合优度检验是检验样本的数据点聚集在回归线周围的密集程度,从而评价回归方程对样本数据的代表程度。拟合

3、优度从对被解释变量y取值变化的成因分析入手。被解释变量y的变化可由两部分解释:第一,有p个解释变量x的变化引起的y的变化部分;第二,由其他随机因素引起的y的变化部分。定义由第一部分引起的y的变差平方和为ESS,称为回归平方和;由随机因素引起的y的变差平方和称为剩余平方和RSS,SST称为总离差平方和,其中有TSS二ESS+RSS定义多重判定系数是多元线性回归中回归平方和占总平方和的比例,计算公式为:ESS1RSSR21TSSTSSR2度量了多元回归方程的拟合优度,反映了回归方程所能解释的变差的比例,该统计量越接近于1,模型的拟合优度越高。在应用过程中发现,如果在模型中增加一个解释变量,R2往往

4、增大,这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。从而引入调整后的R2。在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:R2=1-RSS/(n_k_1)TSS/(n-1)其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。2.2回归方程的检验在已知回归系数卩,卩,A,卩的条件下还需对整个回归方程进行显著性检12k验。在对整个回归方程进行显著性检验时通常是构造F统计量,类似的,F

5、检验时仍需四个步骤: 提出原假设和备择假设:原假设H:P-P二A-P-0,备择假设H:P,P,A,p不全为零;012k112k 作统计量:F二SSR/(k1),其中SSR为残差平方和,SSE为回归平方和,SSE/(n-k)(k-l),(n-k)分别为SSR,SSE的自由度; 根据样本数据和原假设计算统计量F的值; 将统计量F的值与临界值F相比较,若F的值大于临界值F,则需拒绝原假aa设H,说明回归方程显著。反之,则需接受原假设H,说明回归方程不显著。002.3回归系数的检验运用计算方法或者通过计算机的运行可以得出回归系数P,P,A,P的估12k计,但所估计的回归系数在给定的显著性水平a下是否具

6、有显著性呢?这需要给予相应的显著性检验,通常是构造t统计量。那么在进行t检验过程中需遵循以下四个步骤: 提出原假设和备择假设:原假设H:P二0,(j=1,2,A,k),备择假设H:P丰0,(j二12A,k);0j1j旷一 作统计量:t=匚,其中S人为p的标准差;SPjPj 根据样本数据和原假设计算统计量t的值; 将统计量t的值与临界值t相比较,若t的绝对值大于临界值t,贝V拒绝原假aa设H,说明P显著不为零。反之,则接受原假设H,说明P显著为零。0j0j3. 多元线性回归的应用案例研究(见附件)附件】多元线性回归分析(南昌航空大学经济管理学院,江西省南昌市,330063)摘要:旅游业作为我国国

7、民经济的重要产业之一,在我国的经济建设中发挥了巨大的作用。我国旅游业经历了改革开放30年的发展,已初步形成了“大旅游、大产业、大发展”的基本格局,具备了一定的产业体系和产业规模,进入了前所未有的大发展时代。近年来,旅游业作为国民经济的增长点一直保持高速发展,在整个社会经济发展中的作用日益显现。21世纪随着中国加入WTO和知识经济的发展,国内旅游收入迅速增加,远高于同期GDP的增长率。为了对国内旅游收入影响因素进行研究分析,本文选取了国内旅游总花费、国民总收入、人均国民生产总值、居民消费水平和城乡居民人民币储蓄存款年底余额五个因素,采集了我国19942012年的数据,运用SPSS软件进行数据分析

8、。1.模型设定为了全面反映中国“国内旅游收入”的情况,选择国内旅游总花费作为被解释变量,以反映国内旅游收入情况;选择“国民总收入”、“人均国民生产总值”、“居民消费水平”及“城乡居民人民币储蓄存款年底余额”作为自变量;以此来分析国内旅游收入影响因素情况。从国家统计局收集到以下数据(见表1)表1国内旅游总花费及相关数据时间国内旅游总花费(亿元)国民总收入(亿元)人均国内生产总值(元)居民消费水平(元)城乡居民人民币储蓄存款年底余额(亿元)2012年22,706.22516,810.0538,459.4714,098399,551.002011年19,305.39468,562.3835,197.

9、7912,570343,635.892010年12,579.77399,759.5430,015.0510,522303,302.492009年10,183.69340,319.9525,607.539,283260,771.662008年&749.30316,030.3423,707.718,430217,885.352007年7,770.62266,422.0020,169.467,310172,534.192006年6,229.70215,904.4116,499.706,299161,587.302005年5,285.86183,617.3714,185.365,596141,050.

10、992004年4,710.71159,453.6012,335.585,032119,555.392003年3,442.27134,976.9710,541.974,475103,617.652002年3,878.36119,095.699,398.054,14486,910.652001年3,522.37108,068.22&621.713,88773,762.432000年3,175.5498,000.457,857.683,63264,332.381999年2,831.9288,479.157,158.503,34659,621.831998年2,391.1883,024.286,796

11、.033,15953,407.471997年2,112.7078,060.856,420.183,00246,279.801996年1,638.3870,142.495,845.892,78938,520.801995年1,375.7059,810.535,045.732,35529,662.301994年1,023.5148,108.464,044.001,83321,518.801、1980年以后国民总收入(原称国民生产总值)与国内生产总值的差额为国外净要素收入。【数据来源:国家统计局】2.SPSS软件分析求解图1数据输入及处理表1多元线性回归结果(1)VariablesEntered/R

12、emovedaVariablesMedelFntered1居民消费水平(元)人均国内生产总值(元)aDependentVariaVariablesRemovedMethodStepwise(Criteria:Probability-of-F-to-enter=.100).Stepwise(Criteria:Probability-of-F-to-enter=.100).ble:国内旅游总花费(亿元)表一表示引入的自变量是居民消费水平和人均国内生产总值,其他两个变量均被移除模型表2多元线性回归分析结果(2)ModelSummaryAdjustedStd.ErrorofDurbin-ModelRR

13、SquareRSquaretheEstimateWatson1.980a.960.957*2.985b.971.967*.595a. Predictors:(Constant),居民消费水平(元)b. Predictors:(Constant),居民消费水平(元),人均国内生产总值(元)c. DependentVariable:国内旅游总花费(亿元)从表2可以看出,只含有一个自变量居民消费水平的回归方程,其调整后的R2=0.957,而含有两个自变量居民消费水平和人均国内生产总值的回归方程,其调整后的R2=0.967,表明后者的拟合程度要高于前者。表3多元线性回归分析结果(3)ANOVAcMod

14、elSumofSquaresdfMeanSquareFSig.1Regression6E+0081627825308.7405.136.000aResidual26344285171549663.835Total7E+008182Regression6E+0082317551644.2266.482.000bResidual19066305161191644.091Total7E+00818a. Predictors:(Constant),居民消费水平(元)b. Predictors:(Constant),居民消费水平(元),人均国内生产总值(元)c. DependentVariable:国内

15、旅游总花费(亿元)表3是两个方程的方差分析表。两个回归方程F统计量的显著水平都接近0,表明两个方程都是显著的。表4多元线性回归分析结果(4)CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSigCollinearitvStatisticsBStdErrorBetaToleranceVIF1(Constant)-3261.546561.493-5.809.000居民消费水平(元)1.654.082.98020.128.0001.0001.0002(Constant)-5790.6011135.646-5.0

16、99.000居民消费水平(元)4.7651.2612.8223.779.002.003306.092人均国内生产总值(兀)-1.041.421-1.845-2.471.025.003306.092a.DependentVarabe:国内旅游总花费(亿元)表4是两个方程的回归系数估计值和回归系数t检验。由表中数据可知,第一个方程只有一个解释变量,回归系数显著;第二个方程有两个解释变量,其中,”居民消费水平“的回归系数t统计量的概率P值为0.002,”人均国内生产总值的回归系数t统计量的概率P值为0.025,如果显著性水平为0.05,概率P值均小于显著性水平0.05,可见检验结果均显著。根据以上回归结果的分析,可考虑使用二元线性回归模型,其估计方程为:Y=-5790.601+4.765X-1.041X32

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!