Excel回归结果地解读

上传人:痛*** 文档编号:97665987 上传时间:2022-05-27 格式:DOC 页数:12 大小:283KB
收藏 版权申诉 举报 下载
Excel回归结果地解读_第1页
第1页 / 共12页
Excel回归结果地解读_第2页
第2页 / 共12页
Excel回归结果地解读_第3页
第3页 / 共12页
资源描述:

《Excel回归结果地解读》由会员分享,可在线阅读,更多相关《Excel回归结果地解读(12页珍藏版)》请在装配图网上搜索。

1、10年积雪Excel回归结果的解读利用Excel的数据分析进行回归,可以得到一系列的统计参量。下面以连续 深度和灌溉面积序列(图1 )为例给予详细的说明。ABC1年份最大积雪深度规米)灌溉面积啊干亩2nu15+ 228+ 6 13197210. 419.3 n419732L246 515197418. 635. 662乩44乳917197&23. 4458197715.529.2919?g血734,11101979244& 7 11198CJ1汛1图1连续10年的最大积雪深度与灌溉面积(1971 1980 )回归结果摘要(Summary Output )如下(图2):ABcDEFGHISUWI

2、ARY OUTPUT回归统计Multiple098916R Square0.978944Adjus red0.976212标整吴差1.41892410方差分析dfssMSF;ni ficsncE5 F回归分析1748. 8542748.8542371.94535 42E-0B残養s16.106762. 013345总计9764. 961Ccififfici firr标淮误莘t SathrLpwipt E%TTnnfir 9硼F限勺反 0止限 95. CMIni ere ept 2- 356381.827876L 2891670. 233363-1. 858656, 51&3-1. 858656

3、. 57153最大积雪2L8129210. 09400219. 285885. 42E-081. 5961512.0296911.5961512.329691RESIDUAL OUTPUTPROBABILITY OUTPUT雷綁面和y斥椎磯差百分比排駅面积泌千叭129. 91284-1.31284-0.98136519.3L 221.21082-k 91082-1. 428361.528.6134U, 79036-0.鸥如-0. 21T05莢436. 07677-0* J7&777* 356393534.1550. 21755-1.31755-0.984894535. e-图2利用数据分析工具

4、得到的回归结果第一部分:回归统计表这一部分给出了相关系数、 测定系数、校正测定系数、标准误差和样本数目如下 (表1):表1回归统计表回归统计Multiple0. 989416R SquareJ.973944Adjusted0. 976312标淮误差1. 41892410逐行说明如下:Multiple对应的数据是相关系数(correlation coefficient),即 R=0.989416 。R Square 对应的 数值为 测 定系数(determinationcoefficient),或称拟 合优度(goodness of fit),它是相关系数的平方,即有R2=0.989416 2=

5、0.978944 。Adjusted 对应的是校正测定系数 (adjusted determ in ation coefficie nt),计算公式为(n 1)(1 R2)Ra 1 n m 1式中n为样本数,m为变量数,R2为测定系数。对于本例,n =10,m=1,R2=0.978944代入上式得(10 1)(1 0.978944)Ra10.97631210 1 1标准误差(standard error )对应的即所谓标准误差,计算公式为s1 SSe n m 1这里SSe为剩余平方和,可以从下面的方差分析表中读出,即有SSe=16.10676 ,代入上式可得I_1s*16.106761.418

6、924.10 1 1最后一行的观测值对应的是样本数目,即有n=10。第二部分,方差分析表F值、P值等(表2 )。方差分析部分包括自由度、误差平方和、均方差、表2方差分析表(ANOVA )方差分析dfSSFficance回归分析1748. 8542748. 8542371. 94535. 42E-08殘差816. L0&7&2. 013345总计9754. 961逐列、分行说明如下:第一列df对应的是自由度(degree of freedom ),第一行是回归自由度dfr,等于变量数目,即dfr= m ;第二行为残差自由度 dfe,等于样本数目减去变量数目再减1,即有dfe= n-m-1 ;第三

7、行为总自由度 dft,等于样本数目减1,即有dft= n-1。对于本例,m=1, n=10,因此,dfr=1 , dfe= n- m -1=8 , dft= n -仁9。第二列SS对应的是误差平方和,或称变差。第一行为回归平方和或称回归变差SSr,即有n2SSr(?iyi)748.8542i 1它表征的是因变量的预测值对其平均值的总偏差。小 SSr又称组间离差平方和,反应出不同的因子对样本波动的影响第二行为剩余平方和(也称残差平方和)或称剩余变差SSe,即有nSSe(yiy?i)2 16.10676i 1它表征的是因变量对其预测值的总偏差,这个数值越大,意味着拟合的效果越差。上述的y的标准误差

8、即由 SSe给出。-SSe又称组内离差平方和,是不考虑组间方差的纯随机影响第三行为总平方和或称总变差SSt,即有nSSt (yiyi )2764.961i 1它表示的是因变量对其平均值的总偏差。容易验证748.8542+16.10676=764.961 ,即有SSr SSe SSt- 总离差平方和=组间离差平方和 +组内离差平方和亠 样本数据的波动有两个来源:一个是随机波动,一个是因子影响。样本数据的波动,可通过总离差平方和来反映。这个总离差平方和可分解为组间方差和组内方差两部分。而测定系数就是回归平方和在总平方和中所占的比重,即有R2 竺竺竺 0.978944SSt 764.961显然这个数

9、值越大,拟合的效果也就越好。- 方差、均方差:表示一组数相对平均值的离散程度越接近1,说明预测值和实际值的分亠R2 :预测值与实际值相对平均值的分布情况比较,布情况越接近。第四列MS对应的是均方差,它是误差平方和除以相应的自由度得到的商。第一行为回归均方差MSr,即有MSrSSrdfr第二行为剩余均方差 MSe,即有MSeSSedfe空竺 2.0133458显然这个数值越小,拟合的效果也就越好。第四列对应的是F值,用于线性关系的判定。对于一元线性回归,F值的计算公式为R21 2(1 R )n m 1dfeR21 R2式中 R2=0.978944,dfe=10-1-1=8 ,因此8*0.9789

10、44F 1 0.978944 371.9453亠 方差、均方差:表示一组数相对平均值的离散程度F检验完整公式SSRnSse厂 MSR FMSE亠F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的均方差,以确定他们的精密度是否有显著性差异。F F表 表明两组数据存在显著差异。亠 此处的F检验是比较回归均方差(组间均方差)和剩余均方差(组内均方差),如果组间均方差明显大于组内均方差,说明数据波动的主要来源是组间均方差,因子是引起波动的主要原因,可认为因子影响是显著的。第五列Significance F对应的是在显著性水平下的 Fa临界值,其实等于 P值,即弃真 概率。所谓“弃真概率”

11、即模型为假的概率,显然1- P便是模型为真的概率。可见, P值越小越好。对于本例, P=0.00000005420.0001,故置信度达到 99.99%以上。第三部分,回归参数表回归参数表包括回归模型的截距、斜率及其有关的检验参数(表3 )。表3回归参数表Coefficients标准误差t StatIntercept2. 35G437929L8278761. 289167最犬积雪探度工(米)1. 8129210650. 094002.19. 28588PalueLowjer 55 Upper 9鬧下限95.伽上限95愠0. 233363-h 8585E;6.5715301-1. 8586546

12、. 57153015. 42E-081. 5961512.02969131.5961508Z 0296913a=2.356437929和斜率第一列Coefficie nts对应的模型的回归系数,包括截距b=1.812921065,由此可以建立回归模型?i2.3564 1.8129xiyi2.3564 1.8129xii第二列为回归系数的标准误差 (用?a或?b表示),误差值越小,表明参数的精确度越高。这个参数较少使用,只是在一些特别的场合出现。例如L. Benguigui等人在 When andwhere is a city fractal ?一文中将斜率对应的标准误差值作为分形演化的标准,建

13、议采用0.04作为分维判定的统计指标(参见 EPB2000 )。不常使用标准误差的原因在于:其统计信息已经包含在后述的t检验中。第三列t Stat对应的是统计量t值,用于对模型参数的检验,需要查表才能决定。t值是回归系数与其标准误差的比值,即有b?b根据表3中的数据容易算出:2.3564381.8278761.289167, tb1.8129210.09400219.28588对于一元线性回归,t值可用相关系数或测定系数计算,公式如下将R=0.989416、n=10、m=1代入上式得到19.285880.9894161 0.989416210 1 1对于一元线性回归,F值与t值都与相关系数 R

14、等价,因此,相关系数检验就已包含了这部分信息。但是,对于多元线性回归,t检验就不可缺省了。第四列P value对应的是参数的 P值(双侧)。当P0.05时,可以认为模型在 a=0.05 的水平上显著,或者置信度达到95% ;当P0.01时,可以认为模型在 a=0.01的水平上显著,或者置信度达到 99% ;当P0.001时,可以认为模型在 a=0.001的水平上显著,或者 置信度达到99.9%。对于本例,P=0.00000005420.0001,故可认为在a=0.0001 的水平上显著,或者置信度达到99.99% 。 P值检验与t值检验是等价的,但P值不用查表,显然要方便得多。最后几列给出的回

15、归系数以95%为置信区间的上限和下限。可以看出,在a=0.05的显著水平上,截距的变化上限和下限为-1.85865和6.57153,即有斜率的变化极限则为1.85865 a 6.571531.59615 和 2.02969,即有1.59615 b 2.02969第四部分,残差输出结果这一部分为选择输出内容,如果在“回归”分析选项框中没有选中有关内容,则输出结果不会给出这部分结果。残差输出中包括观测值序号(第一列,用i表示),因变量的预测值(第二列,用?i表示),残差(residuals,第三列,用 ei表示)以及标准残差( 表4 )。表4残差输出结果观测值预测權溉面积讥千亩)残差标准残差129

16、. 91283811-1.51284-0. 98188221. 210817-1. 42836340. 7903645-0. 29036-0. 21705436. 076769737. 47677-0. 35639550. 21755404-L 31755-0. 98489644. 778790840.2212090. 165356726. 83087232.369128L 77097832. 63221971E467781. 097181g45. 866543480. 8334570. 6230171036. 983230270. 41&770. 31154预测值是用回归模型?2.3564

17、1.8129xi计算的结果,式中Xi即原始数据的中的自变量。从 图1可见,X1=15.2,代入上式,得? 2.3564 1.8129x1 其余依此类推。残差ei的计算公式为eiyi?从图1可见,yi=28.6,代入上式,得到e?28.629.912841.31284其余依此类推。标准残差即残差的数据标准化结果,借助均值命令average和标准差命令stdev容易验证,残差的算术平均值为0,标准差为1.337774。利用求平均值命令standardize(残差的单元格范围,均值,标准差)立即算出表4中的结果。当然,也可以利用数据标准化公式*ziz zi zzit一fvar(Zj)i逐一计算。将残

18、差平方再求和,便得到残差平方和即剩余平方和,即有nnSSee2(yi ?)2 16.10676i 1i 1利用Excel的求平方和命令 sumsq容易验证上述结果。以最大积雪深度Xi为自变量,以残差 ei为因变量,作散点图,可得残差图( 图3)。残 差点列的分布越是没有趋势(没有规则,即越是随机),回归的结果就越是可靠。用最大积雪深度Xi为自变量,用灌溉面积yi及其预测值?为因变量,作散点图,可得线性拟合图(图4)。最大积雪深度x(米)Residual Plot0图3残差图最大积雪深度x(米)Line Fit Plot*灌溉面积y(千亩)预测灌溉面积 y(千亩)最大积雪深度x(米)图4线性拟合

19、图第五部分,概率输出结果在选项输出中,还有一个概率输出( Probability Output )表(表5 )。第一列是按等 差数列设计的百分比排位,第二列则是原始数据因变量的自下而上排序(即从小到大)一 选中图1中的第三列(C列)数据,用鼠标点击自下而上排序按钮1: I,立即得到表5中的第二列数值。当然,也可以沿着主菜单的“数据 (D) 排序(S)”路径,打开数据排序 选项框,进行数据排序。用表5中的数据作散点图,可以得到 Excel所谓的正态概率图(图5 )。表5概率输出表百分比排位權溉面积y (干亩);519.315 28.6)2529.235 如114535.65537. 46540.

20、5458546. 79548. 9.Normal Probability Plot60)50亩千40 y积30面溉20 灌1020406080 100Sample Perce ntile图5正态概率图【几点说明】第一,多元线性回归与一元线性回归结果相似,只是变量数目m工1 , F值和t值等统计量与R值也不再等价,因而不能直接从相关系数计算出来。第二, 利用SPSS给出的结果与 Excel也大同小异。当然, SPSS可以给出更多的统计量,如DW 值。在表示方法上,SPSS也有一些不同,例如P Value ( PExcel的回归值)用Sig.(显著性)表征,因为二者等价。只要能够读懂 摘要,就可以读懂 SPSS回归输出结果的大部分内容。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!