spss终期考核作业

上传人:1505****484 文档编号:108915971 上传时间:2022-06-16 格式:DOC 页数:31 大小:567.50KB
收藏 版权申诉 举报 下载
spss终期考核作业_第1页
第1页 / 共31页
spss终期考核作业_第2页
第2页 / 共31页
spss终期考核作业_第3页
第3页 / 共31页
资源描述:

《spss终期考核作业》由会员分享,可在线阅读,更多相关《spss终期考核作业(31页珍藏版)》请在装配图网上搜索。

1、.第六章线性回归分析2010级研究生:严飞学号:201011080122.多元线性回归的显著性检验包括哪些内容?如何进行?答:经过查找资料并总结得出多元线性回归的显著性检验主要包括:拟合优度检验、方程显著性检验和变量显著性检验三种。(一)拟合优度检验(R2检验)拟合优度检验是检验回归方程对样本观测值的拟合程度,即检验所有解释变量与被解释变量之间的相关程度。检验的方法是构造一个可以表征拟合程度的指标,这个指标是通过对总变差(总离差)的分解而得到。总变差平方和S总是各个观察值与样本均值之差的平方和,反映了全部数据之间的差异;残差平方和S残是总变差平方和中未被回归方程解释的部分,由解释变量xl、x2

2、xk中未包含的一切因素对被解释变量y的影响而造成的;回归平方和S回是总变差平方和中由回归方程解释的部分。一个拟合得好的回归模型,体现在总体平方和与回归平方和的接近程度,即S总中S残越小越好。于是采用:对回归方程的拟合优度进行检验。如果所有样本观测值都位于回归方程上,即:此时回归方程完全拟合了样本观测值,R等于1。如果R越接近1,则说明回归方程的拟合优度越高。(二)方程显著性检验(F检验)方程显著性检验就是对模型中解释变量与被解释变量之间的线性关系在总体上是否显著成立作出推断。即检验被解释变量y与所有解释变量xl、x2xk之间的线性关系是否显著,方程显著性检验所应用的方法是数理统计学中假设检验。

3、检验的原假设H0与对立假设H1分别为:H0:0=1=k=0H1:至少有一个1不为零应用数理统计理论可以证明:S回与S残相互独立,且当:H0:0=1=k=0为真时,S回与S残分别服从自由度为k、n-k-1的X2分布,故有:即:F统计量服从以(k、n-k-1)为自由度的F分布。首先根据样本观测值及回归值计算出统计量F,于是在给定的显著性水平下,若FF(K、n-k-1),则拒绝H0,判定被解释变量y与所有解释变量xl、x2xk之间的回归效果显著,即确实存在线性关系;反之,则不显著。(三)变量显著性检验(t检验)R2检验和F检验都是将所有的解释变量作为一个整体来检验它们与被解释变量y的相关程度以及回归

4、效果,但对于多元回归模型,方程的总体显著性并不意味每个解释变量对被解释变量y的影响都是显著的。如果某个解释变量并不显著,则应该从方程中把它剔除,重新建立更为简单的方程。所以必须对每个解释变量进行显著性检验。等价于对每个解释变量检验假设:H0:j=0H1:j0其中j=0,1,2k。应用数理统计理论可以证明:当:H0:j=0为真时,统计量tj服从自由度为(n-k-1)的t分布,即:在给定的显著性水平下:若tjt/2(n-k-1),则拒绝H0,说明解释变量xj对被解释变量y有显著影响,即xj是影响Y的主要因素;反之,接受,说明解释变量xj对被解释变量y无显著影响,则应删除该因素。当影响Y的主要因素只

5、有一个变量x时,问题变成了元回归分析,此时t检验和F检验的作用是一样的,因此可以不用再做F检验。3.如何建立多元线性回归方程?偏相关系数有何意义?答:(一)建立多元线性回归方程的步骤可总结如下:1)确定研究目标,即明确建立回归方程的自变量变量和因变量,然后在一定样本中取得自变量与因变量所对应的观测值。通常,预测变量是现实中容易测量的,被预测变量则是现实中较难测量或是指未来发展的结果。2)利用散点图或相关分析确定自变量与因变量之间是否存在线性关系。3)利用确定的计算方法或计算机软件计算回归方程的回归常数和回归系数,得到回归方程。4)进行拟合优度检验。就是检验样本数据聚集在样本回归线周围的密集程度

6、,从而判断回归方程对样本数据的代表程度。多元线性回归方程中由于引入的自变量不同,所以比较不同回归方程的拟合度时需要使用调整后的拟合度判定系数。5)回归方程的显著性检验。回归方程显著性检验是对因变量与自变量之间线性关系是否显著的一种检验。检验方法采用方差分析:F值等于平均的回归平方和与平均的残差平方和之比。6)对回归系数的显著性检验(t检验)。回归方程显著性检验是从总体上显示回归系数显著,多元线性回归,还需分别检验各回归系数的显著性。(二)偏相关系数的意义在多个相关变量中,其他变量保持固定不变,所研究的两个变量间的线性相关称为偏相关。用来表示两个相关变量偏相关的性质与程度的统计量叫偏相关系数,绝

7、对值越大,偏相关程度越大。根据被固定的变量个数可将偏相关系数分级,偏相关系数的级数等于被固定的变量的个数。1)当研究2个相关变量x1、x2的关系时,用直线相关系数r12表示x1与x2线性相关的性质与程度。此时固定的变量个数为0,所以直线相关系数r12又叫做零级偏相关系数。2)当研究3个相关变量x1、x2、x3的相关时,我们把x3保持固定不变,x1与x2的相关系数称为x1与x2的偏相关系数,记为r12-3,类似地,还有偏相关系数r13-2、r23-1。这3个偏相关系数固定的变量个数为1,所以都叫做一级偏相关系数。3)当研究4个相关变量x1、x2、x3、x4的相关时,须将其中的2个变量固定不变,研

8、究另外两个变量间的相关。即此时只有二级偏相关系数才真实地反映两个相关变量间线性相关的性质与程度。二级偏相关系数共有个:r12-34,r13-24,r14-23,r23-14,r24-13,r34-12。一般,当研究m个相关变量x1、x2、xm的相关时,只有将其中的m-2个变量保持固定不变,研究另外两个变量的相关才能真实地反映这两个相关变量间的相关,即此时只有m-2级偏相关系数才真实地反映了这两个相关变量间线性相关的性质与程度。m-2级偏相关系数共有个。xi与xj的m-2级偏相关系数记为rij.(i,j=1,2,m,ij)。偏相关系数的取值范围为-1,1,即:-1rij.1。5.如何将多项式回归

9、转化为多元线性回归?多项式回归问题可以通过变量转换化为多元线性回归问题来解决。对于一元m次多项式回归方程(9-35),令、=、=,则(9-35)就转化为m元线性回归方程:因此用本章第一节的方法就可解决多项式回归问题。需要指出的是,在多项式回归分析中,检验回归系数bi是否显著,实质上就是判断自变量x的i次方项xi对依变量y的影响是否显著。对于二元二次多项式回归方程(9-36),令,则(9-36)就转化为五元线性回归方程:但随着自变量个数的增加,多元多项式回归分析的计算量急剧增加,于是就需要转化为多元线性回归方程进行分析了。下面是我找的一具体实例对一元二次多项式回归作详细介绍:(大体上了解了多项式

10、回归转化为多元回归的具体过程,不过其中数学水平要求高,还是有些地方不是很清楚,会继续努力看明白的)【例9.3】给动物口服某种药物A1000mg,每间隔1小时测定血药浓度(g/ml),得到表9-5的数据(血药浓度为5头供试动物的平均值)。试建立血药浓度(依变量y)对服药时间(自变量x)的回归方程。表9-5血药浓度与服药时间测定结果表服药时间x(小时)123456789血药浓度y(g/ml)21.8947.1361.8670.7872.8166.3650.3425.313.1722.718246.256362.268470.754571.714665.148751.056829.43890.295

11、0y-0.82820.8737-0.40840.02551.09541.2113-0.7168-4.12982.8750(一)根据表9-5的数据资料绘制x与y的散点图(见下图)。由散点图我们看到:血药浓度最大值出现在服药后5小时,在5小时之前血药浓度随时间的增加而增加,在5小时之后随着时间的增加而减少,散点图呈抛物线形状,因此我们可以选用一元二次多项式来描述血药浓度与服药时间的关系,即进行一元二次多项式回归或抛物线回归。图1表9-5资料的散点图(二)进行变量转换设一元二次多项式回归方程为:令、,则得二元线性回归方程(三)进行二元线性回归分析先计算得:再计算得:于是得到关于求出上述正规方程组系数

12、矩阵的逆矩阵为:关于即:而于是得到二元线性回归方程为:现在对二元线性回归方程或二元线性回归关系进行显著性检验。列出方差分析表,进行F检验。表9-6二元线性回归关系方差分析表变异来源SSdfMSF回归4830.916222415.4581511.750*离回归28.320264.7200总变异4859.23648由查F值表得,因为FF0.01(2,6),P0.01,表明二元线性回归关系是极显著的。偏回归系数的显著检验,应用F检验法:由查F值表得,因为、,表明偏回归系数都是极显著的。(四)建立一元二次多项式回归方程将还原为,还原为x2,即得一元二次多项式回归方程为:(五)计算相关指数R2因为,相关

13、指数R2为:表明y对x的一元二次多项式回归方程的拟合度是比较高的,或者说该回归方程估测的可靠程度是比较高的。6.某地区的人均收入与同期某种耐用消费品的销售额之间的统计资料如下表所示。现要求确定两者之间是否存在相关关系。年份1987198819891990199119921993199419951996人均收入1.61.82.33.03.43.84.54.85.25.4销售额(百万元)4.75.97.08.210.5121313.51415具体操作步骤:1)输入数据(图1)图12)分析(图2)图23)变量选择(图3)图34)结果(图4)通过以上步骤获得结果显示,人均收入与同期某种耐用消费品的销售

14、额之间存在显著相关关系。7.一家商场20032005年个季度的销售额数据如下表所示。试建立一个多元回归模型预测2006,、2007年每季度的销售额。季度/年销售额2003年2004年2005年13890384041252250021903146319891765143444365421345311.数据输入2.分析:点击分析回归线性(L)设置统计量点击“统计量”进入统计量设置菜单设置完成点击继续回到主界面绘图设置点击“绘制”进入并设置,设置完成点击继续回到主界面。选项摄体保存设置点击“保存”,并设置,设置完成点击继续返回。点击“选项”,并设置,再点击继续回到主界面设置完成上述参数,点击主界面“

15、确定”,得到如下结果:REGRESSION/MISSINGLISTWISE/STATISTICSCOEFFOUTSBCOVRANOVACOLLINTOL/CRITERIA=PIN(.05)POUT(.10)CIN(95)/NOORIGIN/DEPENDENT销售额/METHOD=ENTER年份季度/SCATTERPLOT=(*SDRESID,*ZPRED)(*ZRESID,*ZPRED)/RESIDUALSHIST(ZRESID)/CASEWISEPLOT(ZRESID)OUTLIERS(3)/SAVECOOKLEVERMCINICIN.回归附注创建的输出22-十一月-201116时20分18

16、秒注释输入活动的数据集数据集0过滤器权重拆分文件工作数据文件中的N行12缺失值处理对缺失的定义用户定义的缺失值作为缺失数据对待。使用的案例统计是在所使用的变量不带有缺失值的案例基础上进行的。语法REGRESSION/MISSINGLISTWISE/STATISTICSCOEFFOUTSBCOVRANOVACOLLINTOL/CRITERIA=PIN(.05)POUT(.10)CIN(95)/NOORIGIN/DEPENDENT销售额/METHOD=ENTER年份季度/SCATTERPLOT=(*SDRESID,*ZPRED)(*ZRESID,*ZPRED)/RESIDUALSHIST(ZRES

17、ID)/CASEWISEPLOT(ZRESID)OUTLIERS(3)/SAVECOOKLEVERMCINICIN.资源处理器时间0:00:01.922已用时间0:00:02.250所需内存1644个字节残差图需要额外内存832个字节创建或修改的变量COO_1CooksDistanceLEV_1CenteredLeverageValueLMCI_1销售额的95%平均置信区间下限UMCI_1销售额的95%平均置信区间上限LICI_1销售额的95%单个置信区间下限UICI_1销售额的95%单个置信区间上限数据集0输入移去的变量b模型输入的变量移去的变量方法1季度,年份a.输入a.已输入所有请求的变

18、量。b.因变量:销售额模型汇总b模型RR方调整R方标准估计的误差1.175a.031-.1851112.5668a.预测变量:(常量),季度,年份。b.因变量:销售额Anovab模型平方和df均方FSig.1回归352741.2672176370.633.142.869a残差1.114E791237804.970总计1.149E711a.预测变量:(常量),季度,年份。b.因变量:销售额系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量)-370673.167788277.356-.470.649年份186.500393.352.156.474.6471.0

19、001.000季度70.467287.264.081.245.8121.0001.000a.因变量:销售额系数相关a模型季度年份1相关性季度1.000.000年份.0001.000协方差季度82520.331.000年份.000154725.621a.因变量:销售额共线性诊断a模型维数特征值条件索引方差比例(常量)年份季度112.8841.000.00.00.022.1164.996.00.00.9838.300E-85895.0701.001.00.00a.因变量:销售额残差统计量a极小值极大值均值标准偏差N预测值2956.8003541.2003249.000179.073712标准预测值

20、-1.6321.632.0001.00012预测值的标准误差351.825665.993546.118110.57012调整的预测值2435.6623771.7203121.731399.873012残差-1519.23331196.8000.00001006.354612标准残差-1.3661.076.000.90512Student化残差-1.4391.343.0491.04312已删除的残差-1688.03701865.1428127.26921346.509712Student化已删除的残差-1.5471.416.0461.06612Mahal。距离.1833.0251.8331.02212Cook的距离.007.336.119.09712居中杠杆值.017.275.167.09312a.因变量:销售额图表结果:根据结果中“系数a”表格给出的模型的回归系数估计值,并由此模型建立多元线性回归方程为:销售额=-370673.167+186.5*年+70.467*季度(年用y表示,季度用J表示,销售额用Y表示)Y=-370673.167+186.5*y+70.467*J再通过此模型多元回归方程预测2006和2007年个季度的销售额如下表:季度/年销售额2006年2007年135163703235873773336573844437273914.31

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!