《OLS的渐进性》PPT课件

上传人:sha****en 文档编号:22121412 上传时间:2021-05-20 格式:PPT 页数:40 大小:280.48KB
收藏 版权申诉 举报 下载
《OLS的渐进性》PPT课件_第1页
第1页 / 共40页
《OLS的渐进性》PPT课件_第2页
第2页 / 共40页
《OLS的渐进性》PPT课件_第3页
第3页 / 共40页
资源描述:

《《OLS的渐进性》PPT课件》由会员分享,可在线阅读,更多相关《《OLS的渐进性》PPT课件(40页珍藏版)》请在装配图网上搜索。

1、第 五 章 : O LS的 渐 进 性(O LS Asymptotics ) 5.1 一 致 性 5.2 渐 近 正 态 和 大 样 本 推 断 5.3 OLS的 渐 进 有 效 性 第 一 节 一 致 性 (consistency)一、一致性的含义 令Wn是基于样本y1,y2yn的关于参数的估计量,如果对任意0,当n时,Pr(|Wn|)0,Wn就是的一个一致估计量(consistent estimator)。当Wn具有一致性时,我们也称为Wn的概率极限(probability limit of W n),记作Plim(Wn)=。1.定义 2.为什么要考虑一致性 我们已经讨论了有限样本(fin

2、ite sample),也就是小样本(small sample)中OLS估计量(OLS estimators )和检验统计量(test statistics)具有的如下性质:u在MLR. 1-4下 O LS估计量具有无偏性(Unbiasedness)u在MLR. 1-5下 O LS估计量是最优线性无偏无计量(BLUE)u在MLR. 1-6下 O LS估计量是最小方差无偏估计量(MVUE)uT统计量的分布为t分布样本容量为任意n时,这些性质都成立。 由于在很多情形下误差项可能呈现非正态分布,了解OLS 估计量和检验统计量的渐近性,即当样本容量任意大时(when the sample size g

3、rows without bound)的特性就是重要的问题。 虽然在高斯马尔可夫假定下OLS 是最优线性无偏估计量,但在别的情形下不一定能找到无偏估计量。因此,在那些情形下,我们只要找到一致的估计量,即n 时, 这些估计量的分布退化为参数的真值即可。 u当n增加时样本的分布(Sampling Distributions as n increases) b 1 n1n2n3 1的样本分布例:n1:每次从班上抽取10人, 抽若干次后,平均身高的分布; n2:每次从班上抽取100人, 抽若干次后,平均身高的分布; n3:每次从班上抽取200人, 抽若干次后,平均身高的分布。 的一致估计量、是、方法得

4、到的下,通过可以证明,在假定的分布紧缩成一个点趋于无穷大时,当的周围。的分布越来越集中在样本容量的增加,随着估计量是一致的,那么概率分布。如果都有一个,估计量,对于每一个的是kk jj jj jjj OLS.MLRn OLS nOLS bbbbbb bb bb bbb 1010 41 3.一致性和无偏性的关系(Consistency v.s. unbiasedness)u一个估计量是否有可能在有限样本(小样本)中是有偏的但在大样本条件下又具有一致性? 假设Z的真值为0,一个随机变量X以(n-1)/n的概率取值为Z,而以1/n的概率取值为n。那么,X的期望为1,也就是:记plim(x) 为n趋向

5、无穷大时x的取值,则有:plim(x)=z=0 111 nnnnZXE u是否有可能一个估计量是无偏的但又不具备一致性? 依然假设Z的真值为0,一个随机变量X以0.5的概率取0.5,而以0.5的概率取-0.5,那么X的期望为0,也就是说,X是Z的无偏估计量。 但是,X总是在X=0这条线上下摆动,当n趋向无穷大时,它的方差并不会趋于0。因此,X并不是Z的一致估计量,也就是说X不具备一致性。 无偏估计量未必是一致的,但是那些当样本容量增大时方差会收缩到零的无偏估计量是一致的。 二、O LS估计量的一致性1.定理5.1 在假设MLR.1到MLR.4下,OLS截距估计量和斜率估计量都是一致的估计量。2

6、.证明一致性在简单回归中,斜率的估计量为: 2111 1111 211 111211 111 xxn uxxn xx uxxxx yxx i ii i iii iib bb n时,分子趋近于0,但分母却不趋近于0,因此,当n时, Plim( )=1b 1b 3.一个更弱的假定 要获得估计量的无偏性(unbiasedness),我们假定零条件期望(zero conditional mean):E(u|x1, x2,xk) = 0 而要获得估计量的一致性(consistency),我们可以使用更弱的假定:零期望和零相关性假定,即:E(u) = 0,Cov(xj,u) = 0, j = 1, 2,

7、, k。 如果连这个较弱的假定也不成立,OLS将是有偏(biased)而且不一致的(inconsistent)。上述讨论表明:如果O LS估计量是无偏的,那么它一定是一致的; 但是如果O LS估计量是一致的,却不能保证它是无偏的。 u推导不一致性定义渐近偏差(asymptotic bias)为: , 并考虑下面的真实模型和待估计模型。1 1plimb b vxxy 22110 bbb uxy 110 bbvxu 22b真实的模型为:实际进行估计的模型为:显然: 1121 lim0)( p,,xxCov 则此时,如果 1 2121 1 122111 2211 1 111 , , ,lim xVa

8、r xxCov xVar vxCovxxCovxVar vxxCov xVar uxCovp bb bbbb bb 则: 因此,考虑渐近偏差的方向就像是考虑存在一个遗漏变量时偏差的方向。主要的区别在于渐近偏差用总体方差和总体协方差表示,而遗漏变量时的偏差则是基于它们在样本中的对应量。bbb 211lim p 1 21 ,xVar xxCov 1211 bbb E 211 2111 xx xxx i ii1102 xx 值得注意的是,不一致性是一个大样本问题。因此,当数据增加时候这个问题并不会消失。也就是说,即使样本容量再大,O LS估计的偏误也不会消失,而且会收敛到一个有偏误的值。 4.存在内

9、生性时的一致性考虑真实模型为y = b0 + b1x1 + b2x2 + u ,但u和x1相关,即cov(u , x1)0。则OLS估计量的不一致性(inconsistency)为: 111 111 1111 lim0),( lim0),( )( ),(lim bb bbbb puxCov puxCov xVar uxCovp,则如果,则如果 u若x1 和x2相关,即cov(x1 , x2 ) 0,而u和x2不相关,即cov(u , x2 )=0时,则对b1和b2的OLS估计量都是不一致的。u若x1 和x2不相关,即cov(x1 , x2 )=0,且u和x2不相关,即cov(u , x2 )=

10、0时,则只有对b1的OLS估计量是不一致的。u存在内生性时对其他参数估计量的一致性的影响)( ),(lim 1111 xVar uxCovp bb 5.渐近有效性 我们知道,如果总体回归模型满足MLR.1-5,那么OLS估计量是最优线性无偏估计量。 事实上,可以证明在这些假定下, OLS估计量是渐近有效的(asymptotic efficient)。也就是说,随着样本容量无限增大, OLS估计量具有最小的渐近方差。 第 二 节 渐 近 正 态 和 大 样 本 推 断(Asymptotic Normality and Large Sample Inference) 估计量的一致性是一条重要性质,

11、但我们并不能只靠它来进行统计推断。在经典线性模型假设下,样本的分布是正态分布,因而我们推出t分布和F分布用于检验。 这种准确的正态分布来自于总体误差(population error)的分布是正态分布的假定。这个正态误差的假定意味着当x给定时,y的分布也是正态分布。 为什么需要正态性假定?u为了证明无偏性?u为了证明最优线性估计量?u为了能够用t统计量和F统计量做精确的推断? 很容易碰到一些例子,其中严格的正态性假定并不能成立。因为正态分布是对称的,所以,任何一个明显不对称(clearly skewed)的变量,像拘捕次数,储蓄量等都不可能服从正态分布。 当样本容量变大时是否估计量会渐近地趋向

12、于正态分布?我们关注的O LS估计是否量满足渐近正态性。 中心极限定理(Central Limit Theorem) 基于中心极限定理,我们能够证明OLS估计量是渐近正态。渐近正态意味着当n 时,P(Zz) F(z) 或者P(Zz) (z) 。 中心极限定理指出任何一个均值为,方差为2的总体的标准化平均值的分布渐近趋同于N0,1,或者记作: 1,0 NnYZ aY 1.中心极限定理是研究独立随机变量和的极限分布为正态分布的问题。 2.定理5.2:O LS的渐近正态性(Asymptotic Normality of OLS)在高斯马尔科夫假设MLR.1 MLR.5前提下:1) 符合渐近正态分布,

13、也就是说:其中, 是 的渐近方差; ,而 是x j对其他解释变量进行回归所得到的残差。jb 22,0 jjj Nn bb 22 j jjn bb 212 lim ijj rnp ijr 2) 是 的一个一致性估计。3)随着样本容量n的扩大,对任意j,都有:2 2 1,0 Nse j jj bbb 的一致估计量是相应地, 22 11 iukn u在定理5.2中什么才是我们的假定u误差的分布具有有限的方差(finite variance)u零条件期望(Zero conditional mean)u同方差性(H omoskedasticity)u线性结构(Linear structure)u随机样本

14、(random sample)1)去掉了正态性假定(normality assumption)MLR.62)仍然保留以下假定: u对定理5.2的理解为什么在1)中考虑的是 ,而不是 jjn bb jj bb 因为 jjjj jjj SSRSSTSSRSST RSSTVar 22 221 b 2 jijj xxSST 2 ijj rSSR注意到 的样本方差为 的样本方差为 jx nSSTj ijr nSSRj 222 rjj nSSRVar b 其中, 是 的总体方差。 ijr2r令 ,那么有:cr 22 ncVar j b当 时, 以 的速度减小到零,因此,只有按照 的比例增大 ,才能讨论渐近

15、分布。n jVar b n1n jb 因为自由度很大的 t分布接近于正态分布,我们也可以得到: 1 knaj jj tse b bb注意到尽管我们在大样本中不再需要正态性假定,我们仍然需要同方差性(homoskedasticity)。 渐近标准误差(Asymptotic Standard Errors) ncse RSSTse jj jjj b b ,1 22所以,我们预计标准误差减小的速度与 成正比。如果u不是正态分布,我们有时把标准误差称作渐近标准误差,因为:n 大样本推断(Large sample inference)uOLS估计量的渐近正态性告诉我们,如果样本容量足够大,而且总体回归模

16、型满足MLR.1-5,那么t统计量近似地服从标准正态分布或t分布,从而可以进行t检验。此时,不必要求满足正态性假定。u如果样本容量足够大,而且总体回归模型满足MLR.1-5,那么通常的F检验也是适用的。u需要注意的是,进行大样本推断的前提是MLR.5(同方差假定)必须成立。 拉格朗日乘子统计量(Lagrange Multiplier statistic) 当我们使用大样本并且依靠渐近正态性(asymptotic normality)进行推断时,除了t和F统计量,我们还可以使用别的统计量。 拉格朗日乘子或LM统计量是检验多重限定性约束(multiple exclusion restriction

17、s)的另一种选择,LM统计量使用一个辅助性的回归(auxiliary regression),因此它有时也被叫做nR2统计量。 对于大样本数据,可以使用LM检验对多个线性假设进行检验,前提是高斯马尔科夫假定( MLR.1-5 )成立 假设我们有一个标准模型: y = b0 + b1x1 + b2x2 + . . . bkxk + u 而我们的零假设为: H 0: bk-q+1 = 0, . , bk = 0我们的备选假设为: H 1: bk-q+1, . , bk 中至少有一个不为零 p cLMc )q(nRLM)3( Reu)2( )1( 022u 2u110 qq110的显著性水平精确。当

18、然也可计算出,可以拒绝,如果临界值以及相应的平。对于给定的显著性水得到根据得到残差估计有约束模型HXX uuXXY kk kk bbb LM检验的特性(Characteristics of LM test)LM统计量有时被称作是nR2,或者得分统计量(score statistic)u约束q的个数(number of restrictions, q )u辅助R2的大小(the size of the auxiliary R-squared )u样本容量(the sample size)相关的因素只有:u未约束模型中自由度的个数u未约束模型和被约束模型的R 2不相关的因素有: LM检验与F检验和

19、t检验的优劣对比 LM test vs F test & t testu在大样本中,F检验和LM检验得到的结果相似。u只有一个约束时,F检验和t检验是等价的,然而LM检验和F检验并不等价。u主回归和辅助回归必须使用相同的一组观测值。 例5.3: Economic Model of Crime(crime1.raw)narr86= 0+1pcnv+2avgsen+3tottime+4ptime86+5qemp86+uH 0: 2= 3=0H 1: 2和3至少有一个不为0Steps(i)对约束模型进行回归,得到残差u(ii)用 对无约束模型的所有解释变量进行回归,得到R u2 u可知Ru2 =0.

20、0015,从而LM=nRu2 = 27250.0015=4.09Df=2,显著性水平为5%的2 分布临界值为5.99,显然有LM5.99,因此不能拒绝H 0. 渐近有效(Asymptotic Efficiency)u在高斯-马尔可夫假定下,OLS估计量以外的估计量可以具有一致性。u但是,在高斯-马尔可夫假定下,OLS估计量具有最小的渐近方差(asymptotic variances)。u我们说在高斯-马尔可夫假定下OLS估计量是渐近有效的估计量。值得注意的是如果同方差(homoskedastic)的假定不成立,上述结论也不能成立。 定理5.3: O LS估计量的渐近有效性 Asymptotic

21、 Efficiency of OLS Estimatorsb在高斯马尔科夫假定下,将 记为如下方程的估计量: kjxxyxg kkj .2,1,0110 bbb 其中, 为任何一个观测值i的所有自变量的函数 xg j进一步,让 为OLS估计量,那么,OLS有最小的渐近方差,即:jb jjjj nAVarnAVar bbbb 证明OLS估计量的渐近有效性简单回归模型yi = b0 + b1xi + ui中b1OLS估计量的方差为: 211 21 xxVar ib现在考虑一个新的估计量:其中,x i可以转化为z: zi=xi2 ii ii xzz yzz1b 我们首先证明 是一致的: ii ii

22、ii iiii ii xzzn uzzn xzz uzzxzz yzz111 11b bb 1b如果 ,我们就可以得到:因此有: 0 xuE 0 2 zuExuE 111 ,cov ,covlim bbb ux uzp 因为: ii ii xzzn uzzn 1111 bb根据附录中的推导,我们可以证明: 221 ,covlim xz zVarVarp b xVarxx xVarVarp 2221 ,covlim b 如果z=x,则有: 如果 ,则由柯西不等式,可得:xz xVarzVarxz 2,cov因此: xVarzVar zVarxz zVarVarp 2 221 ,covlim b 11 limlim bb VarpVarp 也就是: u本讲定性地讨论了OLS估计量的渐近性质,不要求同学们掌握证明过程和细节问题。重要的是希望大家记住:即便正态性假定不被满足,在大样本情况下,用OLS方法进行参数估计和假设检验仍然是适用的。u如此看来,样本容量越大,对OLS方法施加的限制就越少,因此我们应该使用容量足够大的样本。遗憾地是,并没有一个被广泛接受的标准用来判断样本容量到底应该多大才符合渐近性的要求小 结

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!