分位回归模型在R环境下的实现

上传人:无*** 文档编号:161777747 上传时间:2022-10-15 格式:PPT 页数:31 大小:2.72MB
收藏 版权申诉 举报 下载
分位回归模型在R环境下的实现_第1页
第1页 / 共31页
分位回归模型在R环境下的实现_第2页
第2页 / 共31页
分位回归模型在R环境下的实现_第3页
第3页 / 共31页
资源描述:

《分位回归模型在R环境下的实现》由会员分享,可在线阅读,更多相关《分位回归模型在R环境下的实现(31页珍藏版)》请在装配图网上搜索。

1、分位数回归模型在R环境下的实现中国人民大学统计学院 左辰 潘岚锋大纲o 引言o 分位回归模型的基本结构o 回归系数的渐进分布o 参数估计o 残差形态的检验o 一个实例一、引言o 传统回归模型的缺陷:1 只反映均值变化2 Gauss-Markov假设条件太强o 分位回归模型1 拟合在不同分位数水平下的估计值,可以反映更多的信息o 2 对残差分布放松假设o R package:quantreg by Roger Koenker二、模型的构造o 其中:因变量 相互独立自变量残差项o 回归系数 表示分位数水平 的回归系数()12,.,nY YY12,.,pnx xxR12,.,n(|)()iYiiQx

2、x rq(yx,tau=,method=br)o 以quantreg包中的engel为例:自变量:income-年收入因变量:foodexp-食品消费额 o fit1=rq(foodexpincome,data=engel)#tau值缺省为0.5,表示中位数回归o fit2=rq(foodexpincome,data=engel,tau=c(0.1,0.25,0.75,0.9)#对0.1,0.25,0.75,0.9四个分位数水平进行回归10002000300040005000500100015002000regression of engelincomefoodexpmedian regres

3、sionmean regressionquantiles of 0.1,0.25,0.75,0.9中位数回归和均值回归的差异均值回归受到离群点影响稳健性的试验o 目的:比较均值回归、中位数回归系数的稳定性o 方法:1 计算原模型的预测值、残差2 从残差中抽样加入到预测值中,重新作均值回归和中位数回归3 统计两种回归系数的分布结果三、回归系数的渐进分布o 考虑独立同分布的场合o 模型:o 残差分布:双尾指数(Laplace)o 随机生成1000次,统计在0.1,0.2,0.9水平上的分位回归系数:rq(yx,tau=seq(0.1,0.9,length=9)iiiyx1()exp(|)2f xx

4、此外,可以观察回归系数的误差在不同分位数水平上的变化四、参数估计o 给出一个分位回归模型fit=rq(yx)后,命令summary(fit,se=)可以查看参数估计的结果o se选项用于选择参数估计的不同方法,主要有o 1 se=ker:核函数估计法o 2 se=boot:Bootstrap方法o 3 se=rank:秩检验1 核函数估计法o 因为残差分布未知,无法直接求出o Powell给出如下估计方法:()iif 11(|)2niniiinHIucx xc n()nH2 秩检验o 秩检验是R中进行参数估计的默认方法。o 该方法绕开了对未知变量的非参数估计,o Jurekova,Gutten

5、brunner(1992)通过对偶规划问题的解,构造出一组秩统计量,渐进服从T分布o summary(fit,se=nid)o结果:oCall:rq(formula=foodexp income)tau:1 0.5Coefficients:Value Std.Error t value Pr(|t|)(Intercept)81.48225 19.25066 4.23270 0.00003income 0.56018 0.02828 19.81032 0.00000秩检验(续)Koenker,Machado(1994)推广了秩检验的思路,构造出非渐进分布意义下的参数估计方法osummary(fi

6、t)o结果:oCall:rq(formula=foodexp income)tau:1 0.5Coefficients:coefficients lower bd upper bd(Intercept)81.48225 53.25915 114.01156income 0.56018 0.48702 0.6019 o 注意:置信区间不是关于估计值对称的3 Bootstrapo 通过放回抽样的Monte-Carlo试验,得到回归系数的均值和标准差o 运用T统计量的方法,构造置信区间o summary(fit,se=boot,bsmethod=xy)o结果:Call:rq(formula=food

7、exp income)tau:1 0.5Coefficients:Value Std.Error t value Pr(|t|)(Intercept)81.48225 26.62421 3.06046 0.00247income 0.56018 0.03399 16.48263 0.00000五、残差形态的检验o 分位数回归模型的一个重要应用就是对两种残差分布的如下两种形态作检验:o 1 位置漂移模型(location shift model)o 2 位置-尺度漂移模型(location-scale shift model)iiiyxuiiiiyxxu检验的思路:观察 随 的变化情况o 位置漂

8、移模型:o 除常数项分量 之外,与分位数水平 无关o 反映在图上,不同分位数水平上的回归直线相互平行(1)()n()n()()(2,3,.,)inip2468100246810location shift modelxy对分位数回归过程(regression quantile process)作图o 分位数回归过程:对一簇分位数水平作回归得到的一组模型o例子rqpr=rq(yx,tau=1:99/100)oplot(summary(rqpr)0.00.20.40.60.81.0-1.0-0.50.00.51.0(Intercept)0.00.20.40.60.81.00.970.991.011

9、.03x位置-尺度漂移模型o 由表达式可以看出,向量 的各分量随 变化的规律是一致的o 模拟实例:x1-seq(1,10,length=1000)x2=rnorm(1000,mean=0,sd=10)x3=rexp(1000,rate=0.1)u=runif(1000,min=-2,max=2)y=x1+2*x2-x3+u*(-2*x1+x2-x3)rqpr=rq(yx1+x2+x3,tau=10:90/100)plot(summary(rqpr)iiiiyxxu()()n ()n 0.20.40.60.8-50510(Intercept)0.20.40.60.8-2-101234x10.20

10、.40.60.81.01.52.02.53.03.5x20.20.40.60.8-2.5-1.5-0.50.5x3回归系数的变化情况基本一致,是位置-尺度漂移模型的典型特征检验方法o Khmaladze检验Koenker&肖志杰(2002)引入Khmaladze鞅变换技术,计算统计量o R:KhmaladzeTest(yx1+x2+x3,nullH=location/location-scale)#nullH:零假设(null hypothesis),默认为location,表示位置漂移模型六、一个例子:barroo该数据记录了世界各国GDP的增长率和相关因子,共有161个观测;其中前71个观

11、测在1965年1975年取得;后90个观测是19851987年间取得。o因子包括::GDP年增长率lgdp2:人均GDPmse2:男性高中教育情况 fse2:女性高中教育情况fhe2:女性高等教育情况mhe2:男性高等教育情况lexp2:人均期望寿命lintr2:人均资本占有gedy2:教育投入占GDP的比重Iy2:投资占GDP的比例gcony2:公共设施建设占GDP的比例lblakp2:黑市借贷佣金率pol2:政治稳定性指数ttrad2贸易增长率。1、中位数回归o library(quantreg)o data(barro)o attach(barro62:161,)o rqm=rq(lgd

12、p2+mse2+fse2+fhe2+mhe2+lexp2+lintr2+gedy2+Iy2+gcony2+lblakp2+pol2+ttrad2)o summary(rqm,se=nid)2 分位数回归过程orqa=rq(lgdp2+mse2+fse2+fhe2+mhe2+lexp2+lintr2+gedy2+Iy2+gcony2+lblakp2+pol2+ttrad2,tau=10:90/100)orqas=summary(rqa)oplot(rqas)0.20.6-0.40.00.3(Intercept)0.20.6-0.04-0.01lgdp20.20.6-0.020.02mse20.2

13、0.6-0.030.00fse20.20.6-0.20.0fhe20.20.6-0.100.10mhe20.20.60.000.10lexp20.20.6-0.0060.002lintr20.20.6-0.8-0.20.4gedy20.20.6-0.050.10Iy20.20.6-0.4-0.1gcony20.20.6-0.100.00lblakp20.20.6-0.05-0.01pol20.20.6-0.10.10.3ttrad2红色区域:最小二乘回归的参数图中看出各参数显著性3 剔除自变量的影响o rrs.test(lgdp2+lexp2+lblakp2+mse2+fse2,pol2+fh

14、e2+mhe2+lintr2+gedy2+Iy2+gcony2+ttrad2,)o结果:$sn ,11,4.66242$ranks 1 0.335536739 0.326554008 0.295262752 0.303839348 0.398400879o待检验的自变量个数为8个o查表知,可见剔除这些自变量对模型无显著影响 20.1(8)2.8334.662对剩余自变量作分位数回归过程rqa=rq(lgdp2+lexp2+lblakp2+mse2+fse2,tau=10:90/100)rqas=summary(rqa)plot(rqas)0.20.40.60.8-0.4-0.20.0(Inte

15、rcept)0.20.40.60.8-0.03-0.01lgdp20.20.40.60.80.000.050.10 0.15lexp20.20.40.60.8-0.100.000.05lblakp20.20.40.60.80.000.020.04mse20.20.40.60.8-0.05-0.03-0.01fse24 残差分布形态的检验位置漂移模型:KhmaladzeTest(lgdp2+lexp2+lblakp2+mse2+fse2)位置-尺度漂移模型:KhmaladzeTest(lgdp2+lexp2+lblakp2+mse2+fse2,nullH=location-scale)变量位置漂

16、移模型位置-尺度漂移lgdp21.2290.636*lexp21.7440.309*lblakp20.631*1.080mse21.0180.895*fse20.9100.763*总计3.0932.532*查表可知,在0.1的显著性水平下,两种模型都不能被拒绝但从统计量数值看,位置尺度漂移模型相对更合理八、总结o 线性分位数回归模型中的应用,quantreg中的基本函数和分析流程o 分位数模型与传统回归模型相比,回归参数更加稳健,同时可以反映更多的信息o 通过不同分位数水平的残差分布,可以对位置-漂移模型和位置-尺度漂移模型做出检验o quantreg包中还包括非参数统计的分位数估计,此外,分位数回归在时间序列方面也逐渐有更多的应用

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!