回归分析实验程序-SAS版

上传人:hjk****65 文档编号:172182065 上传时间:2022-12-01 格式:DOC 页数:10 大小:47KB
收藏 版权申诉 举报 下载
回归分析实验程序-SAS版_第1页
第1页 / 共10页
回归分析实验程序-SAS版_第2页
第2页 / 共10页
回归分析实验程序-SAS版_第3页
第3页 / 共10页
资源描述:

《回归分析实验程序-SAS版》由会员分享,可在线阅读,更多相关《回归分析实验程序-SAS版(10页珍藏版)》请在装配图网上搜索。

1、proc import out= xt49 /*使用import过程导入数据并输出到数据集xt4.9*/datafile=E:xt49.xlsdbms=excel2000 replace;getnames=yes; /*首行为变量名*/run;proc plot data=xt49;/*对xt49绘图*/plot y*x=*;/*以x为横坐标,y为纵坐标,以*为各点,画散点图*/run;proc corr pearson data=xt49;/*对xt49运行相关分析过程*/var y x;/*计算y和x的Pearson相关系数*/run;proc reg data=xt49;/*对xt4.9

2、运行回归分析过程*/model y=x;/*建立以y为因变量,以x为自变量的线性回归方程*/model y=x/p r dw;/*建立以y为因变量,以x为自变量的线性回归方程,p是要求输出拟合值,r是要求输出残差值, dw是要求输出DW检验统计量的值*/model y=x1-x4/vif;/*建立以y为因变量,以x1-x4为自变量的线性回归方程,vif是要求输出各自变量的VIF值*/output out=res p=yhat r=residual;/*输出拟合值和残差值至数据集res,以便绘制残差图*/run;-以下是绘制残差图的程序,data res_new;/*创建新数据集res_new*

3、/set res;/*先把res数据集复制过来*/lag1residual=lag1(residual);/*lagn(n自定)函数可把一变量的各观测值移后n位;residual即,lag1residual即*/t=_n_;/*_n_是data步内读取观测值的计数器变量,从1开始,每读取一观测值自加1,因此变量t的观测值即为期数1,2,.,n*/run;proc plot data=res_new;/*绘制残差图*/plot residual*lag1residual=*;/*以residual即残差值为纵坐标,以residual2即拟合值为横坐标*/plot residual*t=*;/*以

4、residual即残差值为纵坐标,以t即拟合值为横坐标*/run;- -以下是进行一阶差分后建立回归模型以及其自相关检验的程序data et49_new;/*创建新数据集ch4_new*/set xt49;/*先把ch4数据集复制过来*/difx=x-lag1(x);/*lagn(n自定)函数可把一变量的各观测值移后n位;对x各观测值作一阶差分*/dify=y-lag1(y);/*lagn(n自定)函数可把一变量的各观测值移后n位;对y各观测值作一阶差分*/run;proc reg;/*对ex4.9_new运行回归分析过程*/model dify=difx/p r dw;/*建立以y为因变量,

5、以difx为自变量的线性回归方程,p是要求输出拟合值,r是要求输出残差值,dw是要求输出DW检验统计量的值*/output out=res p=yhat r=residual;/*输出拟合值和残差值至数据集res,以便绘制残差图*/run;data res_new;/*创建新数据集res_new*/set res;/*先把res数据集复制过来*/lag1residual=lag1(residual);/*lagn(n自定)函数可把一变量的各观测值移后n位;residual即 ,lag1residual即 */t=_n_;/*_n_是data步内读取观测值的计数器变量,从1开始,每读取一观测值自

6、加1,因此变量t的观测值即为期数1,2,.,n*/run;proc plot data=res_new;/*绘制残差图*/plot residual*lag1residual=*;/*以residual即残差值为纵坐标,以residual2即拟合值为横坐标*/plot residual*t=*;/*以residual即残差值为纵坐标,以t即拟合值为横坐标*/run;_ _ _ _ _ _ _ _ _ 异常值的的识别 假定有一数据集ch,因变量为y,自变量为x1-x2(或x)。 1. 求各观测体的学生化残差值的程序:proc reg;/*对ch运行回归分析过程*/model y=x1-x2;/*

7、建立以y为因变量,以x1-x2为自变量的线性回归方程*/output out=abnormal student=sre;/*输出各观测体的学生化残差值至数据集abnormal*/run;proc print data=abnormal;/*打印出abnormal数据集中的数据,查看各观测体的学生化残差值*/run; 运行程序后查看数据集abnormal,Studentized Residual列即为各观测体的学生化残差值。 2. 求各观测体的库克距离统计量值的程序:proc reg;/*对ch运行回归分析过程*/model y=x1-x2;/*建立以y为因变量,以x1-x2为自变量的线性回归方

8、程*/output out=abnormal cookd=cookd;/*输出各观测体的库克距离统计量值至数据集abnormal*/run;proc print data=abnormal;/*打印出abnormal数据集中的数据,查看各观测体的库克距离统计量值*/run;自变量的选择_ _ _ _ _ _ _ _ _最优子集 假定有一数据集ch,因变量为y,自变量为x1-xp(p自定)。 求各选模型的、和AIC的程序:proc reg data=ch;/*对ch运行回归分析程序*/model y=x1-xp/selection=adjrsq cp aic;/*建立以y为因变量,以x1-xp为

9、自变量的线性回归方程*/*selection=adjrsq是要求输出所有选模型的 值,selectioncp是要求输出所有选模型的 值,aic是要求输出所有选模型的AIC值,这三个可以同时用*/run; 输出结果中Adjusted R-Square Selection Method表格的每一行都是其中一个选模型的数据,Variables in Model列各值即该选模型所含的自变量,Adjusted R-Square列各值即该选模型的,C(p)列各值即该选模型的,AIC列各值即该选模型的AIC值。_ _ _ _ _ _ _ _ 逐步回归假定有一数据集ch,因变量为y,自变量为x1-xp(p自定

10、)。 1. 使用逐步回归的“前进法”建模的程序:proc reg data=ch;/*对ch运行回归分析程序*/model y=x1-xp/selection=forward;/*建立以y为因变量,以x1-xp为自变量的线性回归方程,selection=forward是要求使用逐步回归的前进法*/run; 输出结果中Forward Selection:Step x(x1,2,3,p)表格即前进法第x步的工作成果,每一步中的Variable xi Entered(i=1,2,p)即自变量xi被引入模型。也可以看最后总结的Summary of Forward Selection,其Step列即各步

11、骤序号,Variable Entered列即各步骤中被引入的自变量。建立的线性回归方程各回归参数的估计值正是最后一步的表格中Parameter Estimate列的各值。 2. 使用逐步回归的“后退法”建模的程序:proc reg data=ch;/*对ch运行回归分析程序*/model y=x1-xp/selection=backward;/*建立以y为因变量,以x1-xp为自变量的线性回归方程,selection=backward是要求使用逐步回归的后退法*/run; 输出结果中Backward Elimination:Step 0表格即后退法第0步的工作成果,该步骤中的All Varia

12、bles Entered表示首先把所有自变量引入模型;Backward Elimination:Step x(x1,2,3,p-1)表格即后退法第x步的工作成果,每一步中的Variable xi Removed(i=1,2,p)即把自变量xi从模型中删除。也可以看最后总结的Summary of Backward Elimination,其Step列即各步骤序号,Variable Removed列即各步骤中被删除的自变量。建立的线性回归方程各回归参数的估计值正是最后一步的表格中Parameter Estimate列的各值。 3. 使用逐步回归的“逐步回归法”建模的程序:proc reg data

13、=ch;/*对ch运行回归分析程序*/model y=x1-xp/selection=stepwise;/*建立以y为因变量,以x1-xp为自变量的线性回归方程,selection=stepwise是要求使用逐步回归的逐步回归法*/run; 输出结果中Stepwise Selection:Step x(x1,2,3,p)表格即逐步回归法第x步的工作成果,每一步中的Variable xi Entered(i=1,2,p)即自变量xi被引入模型。也可以看最后总结的Summary of Stepwise Selection,其Step列即各步骤序号,Variable Entered列即各步骤中被引入

14、的自变量。建立的线性回归方程各回归参数的估计值正是最后一步的表格中Parameter Estimate列的各值。主成份回归假定有一数据集ch,因变量为y,自变量为x1-xp(p自定)。 对样本数据进行主成分分析的程序:proc princomp data=ch;/*对ch运行主成分分析过程*/var x1-xp;/*分析x1-xp的主成分*/run; 输出结果中Eigenvalues of the Correlation Matrix表格即对标准化数据的相关矩阵的说明,Eigenvalue列各值即各特征值,Cumulative列各值即累计贡献率,由此可决定要删除贡献率最小的主成分的个数m。pr

15、oc reg data=ch outest=pcr;/*对ch运行回归过程,把主成分回归的建模结果输出到数据集pcr*/model y=x1-xp/pcomit=m;/*建立回归方程,pcomit=m是要求使用主成分回归法并删除贡献率最小的m个主成分,剩下p-m个主成分累计贡献率应该在95以上,m可为列表即多个值,如:pcomit=1,2*/run;proc print data=pcr;/*打印出主成分回归建模的结果*/run; 输出结果中_MODEL_列表示各模型名称,_PCOMIT_列各值表示该模型删除的贡献率最小的主成分的个数,与其同一行的对应Intercept和x1-xp的值表示该模

16、型中的回归常数和各自变量的系数估计值,可据此写出主成分回归方程。岭回归proc reg data=ch10 outest=rid;/*outest选项要求把岭回归分析的结果输出至数据集rid*/model y=x1-x6/ridge=0.1 to 1 by 0.1;/*noint要求删除截距,ridge=0.1 to 1 by 0.1要求分别取岭回归的k为0.1,0.2,0.9,1建立岭回归方程*/plot/ridgeplot;/*绘制岭迹图以选择k值*/run;proc print data=rid;/*打印岭回归分析结果*/run; 上面程序中的“0.1 to 1 by 0.1”可随时变更起始点或步长,如“0.05 to 1 by 0.2”即要求分别取岭回归的k为0.05,0.25,0.45,0.85建立岭回归方程。 观察输出结果的岭迹图,若当时各自变量的岭迹趋于稳定,则可取k=x,从打印出的岭回归结果表中找到_RIDGE_列值为x的那一行,便可知道对应各自变量的岭回归系数。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!