第一组-二阶段最小二乘讲义

上传人:沈*** 文档编号:141100051 上传时间:2022-08-23 格式:DOC 页数:6 大小:287KB
收藏 版权申诉 举报 下载
第一组-二阶段最小二乘讲义_第1页
第1页 / 共6页
第一组-二阶段最小二乘讲义_第2页
第2页 / 共6页
第一组-二阶段最小二乘讲义_第3页
第3页 / 共6页
资源描述:

《第一组-二阶段最小二乘讲义》由会员分享,可在线阅读,更多相关《第一组-二阶段最小二乘讲义(6页珍藏版)》请在装配图网上搜索。

1、精品文档,仅供学习与交流,如有侵权请联系网站删除2012-2013学年高级计量经济学分组名单第一组:潘琳、王超、倪远栋、叶寅、李畅、吴超、卿剑、李珊、刘春梅、王巍、马哲光、俞力群、田纪华题目:二阶段最小二乘法(2SLS)内容:适用的情况(或条件)估计原理步骤实例二阶段最小二乘计量方法讲义整理1.引例(引出问题和方法) 例一:有关工资收入和教育水平、个人能力之间的关系问题考虑成年劳动者的工资方程中存在未观测到的能力的问题。一个简单的模型为: (1)其中e是误差项。在某些假定下,如何用诸如IQ的代理变量代替能力,从而通过以下回归可得到一致性估计量 对 进行回归 然而,假定不能得到适当的代理变量(或

2、它不具备足以获取一致性估计量所需的性质)。这样一来,我们将abil放入误差项中,留下来的就是简单的回归模型: (2)其中u包含了abil。当然,可以用OLS估计此方程,但是,如果educ与abil (即educ与随机误差项u)相关,即educ为内生解释变量,则用OLS估计得到的结果将是的有偏、非一致性估计量。我们把简单回归模型写成: (3)其中我们认为x与u相关:此时,假如我们能找到一个变量z,满足两个条件:一是与变量x存在高度相关关系,即;二是与随机扰动项u不存在相关关系,即;从遗漏变量的角度看,这意味着z应当对y无偏效应,也不应当与其它影响y的因素相关,此时变量z就称作为变量x的工具变量(

3、IV),则我们就利用工具变量z可以根据上述方程(3)来进行估计,得到参数的无偏的一致估计,如劳动经济学家已在工资方程中使用的家庭背景变量作为教育的IV。例如,母亲的教育(motheduc)与孩子的教育是正相关的,这一点通过收集劳动者数据样本并做educ对motheduc的简单回归便可以看出来,因此,motheduc满足相关性条件,但是,母亲的教育也可能与孩子的能力相关(通过母亲的能力和可能通过孩子幼年所受的教养的质量)。另外,educ的另一个IV选择是成长过程中兄弟姊妹的数目(sibs)。一般地说,较多的兄弟姊妹与较低的平均教育水平相联系,而与个人能力的高低不存在直接关系,这样,它就可以充当e

4、duc的工具变量,进而进行工具变量发进行估计,得到参数的无偏、一致估计。我们利用方程(3):z与y之间的协方差为现在,在与的假定下,我们可以解出为:给定一个随机样本,我们用对应样本量来估计总体的量。在分子和分母中约去样本容量后,我们得到的工具变量(IV)估计量(instrumental variables (IV) estimator):例二:逃课对考试成绩的因果影响问题考虑逃课对期末考试平均成绩的因果影响的问题。在一个简单的回归框架中,我们有 (4) 其中,score是期末考试平均成绩,skipped是该学期逃课的总数目。此时,在用OLS估计方程时,我们担心skipped可能与u中其它因素相

5、关:比如,成绩较好(无法观测的能力变量)的学生可能逃课较少等情况,因而score对skipped的简单回归可能不会给我们一个对逃课的因果影响的好的估计,因此,我们需要找到一个好的工具变量进行估计。什么可能是skipped的好的IV?我们所需要的是对score无直接效应,且与学生能力不相关的IV,同时,该IV必须与skipped相关。一个选择是利用住宿区与教室之间的距离distance,这也许会增加逃课的可能性(由于恶劣的天气、睡过头等等)。因而,skipped可能与distance正相关;这一点可通过skipped对distance的回归并作一个t检验得以验证。 distance是否与u不相关

6、?在简单回归模型(4)中,假如u中的一些因素不与distance相关,那么,distance也许是skipped的一个好的IV,进而能良好估计模型(4)。如果学生能力有一个好的代理,例如以往学期的累积GPA,IV法可能根本就不需要。问题总结: 例子存在的共同问题:1. 在简单回归模型中存在遗漏重要变量问题,运用OLS估计导致其得到估计结果不一致。2. 遗漏变量没有良好的代理变量情况下,会导致解释变量与扰动项的存在相关关系,即出现内生解释变量情况,导致估计结果有偏。解决的可行方法:1.在没有良好代理变量情况下,通过寻找外生变量作为工具变量进行估计,解决了内生解释变量导致的有偏估计情况,得参数的到

7、无偏、一致估计。2二阶段最小二乘简单介绍(工具变量相关概念、使用的情况、解决的问题、主要的估计思想等)工具变量法:(1)由以上引例可以看出在解决内生解释变量问题时,通过需找一个满足一定条件的外生变量,即工具变量来获取无偏的一致估计,故为工具变量法。(2)何为工具变量(IV):在简单回归方程中,一个有效的工具变量应满足以下两个条件: A相关性:工具变量与内生解释变量相关,即 B外生性:工具变量与扰动项不相关,即现在我们来证明可得到的工具变量能够用于进行方程一致性参数估计。特别地,为了根据总体协方差写出,我们对方程两边求与z的协方差,得到:现在,在与的假定下,我们可以解出为:注意到如果z与x不相关

8、,即,该简单代数式不成立。 上式表明是z、y之间的总体协方差除以z、x之间的总体协方差的商,这说明了被识别。给定一个随机样本,我们用对应样本量来估计总体的量。在分子和分母中约去样本容量后,我们得到的工具变量(IV)估计量(instrumental variables (IV) estimator):给定x、y和z的样本数据,很容易获得IV估计量。的IV估计量就为:,除了其中的斜率估计量现在为IV估计量,它看起来就像OLS中的截距估计量 传统的工具变量法一般都通过“二阶段最小二乘法”(2SLS或TSLS)来实现,顾名思义,就是通过做两个回归来完成估计过程。 第一阶段:用内生解释变量对工具变量回归

9、,即,得到拟合值; 第二阶段:用被解释变量对第一阶段回归的拟合值进行回归,即。二阶段最小二乘法: 在前一节中,我们假定有单一的内生解释变量(),和的一个工具变量。可往往我们有不只一个的外生变量,它们被排斥在结构模型之外,且可能与相关,这意味着它们是的有效的IV。在本节中,我们讨论如何运用复工具变量。工具变量法作为矩估计方法,必须满足矩法估计的阶条件。一般的说,当我们在回归模型中有不只一个的内生解释变量时,在若干复杂的情况下仍可能不能识别。但是,我们可以容易地表述识别的一个必要条件,叫做阶条件(order condition)。根据是否满足阶条件分为三种情况:A 不可识别:工具变量的个数小于内生

10、解释变量的个数;B 恰好识别:工具变量的个数等于内生解释变量的个数;C 过度识别:工具变量的个数大于内生解释变量的个数。 以上介绍的工具变量法仅适用于“恰好识别的情形”,但在实际中存在多个内生解释变量和工具变量的情况,就会出现“过度识别”的情况,解决方法之一就是扔掉“多余”的工具变量,但这种方法不是有效的,因为丢掉的工具变量包含着有用的信息,导致估计的结果不充分,此时运用二阶段最小二乘为有效估计。 显然,多个工具变量的线性组合仍然是工具变量,仍满足工具变量的两条件,如果能生成工具变量的线性组合数等于内生解释变量个数,则又回到了恰好识别的情形。在球型扰动项的假定下,由二阶段最小二乘法所提供的工具

11、变量线性组合是所有线性组合中最渐进有效的。所以能良好解决过度识别问题,使工具变量法最终得到有效地一致估计。3二阶段最小二乘法估计的基本原理和主要步骤(重点思想和推到步骤)(1)估计的基本步骤:第一阶段:将每个解释变量分别对所有L个工具变量作OLS回归,得到拟合值为:其中,为的投影矩阵。写成矩阵形式,可以定义第二阶段:由于是的线性组合(参见第一阶段回归),故恰好包含K个工具变量,使用为工具变量对原模型进行工具变量法估计:因此,可以看出,可以将视为把对进行OLS回归而得到的,故名为“二阶段最小二乘”。需要注意的是,第二阶段回归得到的残差为,而原方程残差确是,因此在进行2SLS最好不要自己去进行两次

12、手工回归,而是直接使用软件(如STATA)进行回归分析。将代入方程,可得到2SLS的最终表达式:(2)二阶段最小二乘相关检验:在使用工具变量法估计的时候,必须对工具变量的有效性进行检验,否则,导致估计结果不一致或估计量的方差过大。A.检验工具变量与解释变量的相关性前面在使用工具变量进行估计的时候,工具变脸必须与内生解释变量完全不相关,否则就无法使用工具变量法估计,如果仅仅微弱的相关,成为“若工具变量”,其后果类似于样本容量较小,导致估计量性质变得很差,统计推断失效。判断弱工具变量的方法之一为,在第一阶段回归中,检验原假设“”,一个经验规则,如果次检验的F统计量大于10,则可拒绝“存在弱工具变量

13、”的原假设,不必担心弱工具变量问题。在多个内生解释变量的情况下,将有多个第一阶段回归,固有多个F统计量,此时运用“最小特征值统计量”。STATA提供了最小特征值统计量的临界值。B.检验工具变量的外生性举例说明,假定我们有单一的被怀疑的内生变量,其中和是外生的。我们有另外两个外生变量,和,它们不出现在方程中。我们在介绍简单的工具变量估计量时,我们强调IV必须满足两个必需条件:它必须与误差不相关,与内生解释变量相关。我们在相当复杂的模型中已看到,如何判断在诱导型回归中是否能用一个t或F检验来检验第二个必需条件。我们声称第一个必需条件不能被检验,因为它涉及到IV与未观测到的误差之间的相关。然而,如果

14、我们有不只一个的工具变量,我们就能有效地检验它们中的一部分是否与结构误差不相关。作为一个例子,在有另外两个工具变量和的条件下,重新考虑方程。我们知道仅用作为的IV,就能估计。给定IV估计值,我们就能计算残差。因为在估计中根本没用到,我们可以验证与在样本中是否相关。如果它们相关,不是的有效IV。当然,这并没有告诉我们与是否相关;实际上,因为它是个有用的检验,我们必须假定与不相关。然而,如果和是用相同的逻辑来选择的例如母亲的教育和父亲的教育发现与相关将使人对用作为IV产生怀疑。因为和的角色可以交换,若是假定与不相关,我们也可以检验与是否相关。我们该用哪个检验呢?结果是,我们对检验的选择是无关紧要的

15、。我们必须假定至少有一个IV是外生的。然后,我们可以对2SLS中所用的过度识别约束(overidentifying restrictions)进行检验。根据我们的用意,过度识别约束的数目简单地就是额外的工具变量的数目。假定我们只有一个内生解释变量。如果我们只有的单一个IV,而没有过度识别约束,也就没什么可检验的。如果我们有的两个IV,如同前面的例子中那样,则我们有一个过度识别约束。如果我们有三个IV,则有两个过度识别约束,等等。检验过度识别约束是相当简单的。我们必须获得2SLS残差,然后做一个辅助回归。检验(任意多个)过度识别约束(i)用2SLS估计结构方程,获得2SLS残差。(ii)将对所有

16、外生变量回归,获得,即。(iii)在所有IV都与不相关的虚拟假设下,其中q是模型之外的工具变量的数目减去内生解释变量的总数目。如果超过了分布中的(例如)5%临界值,我们拒绝:所有工具变量都是外生的,并推断出至少部分的IV不是外生的。C.究竟该用OLS还是工具变量法:对解释变量内生性的检验当解释变量是外生的时,2SLS估计量不如OLS有效;正如我们已看到的,2SLS估计值会有非常大的标准误。因此,检验一个解释变量的内生性是有用的,它说明了2SLS甚至是否必要。获取这样的检验相当简单。举例说明,假定我们有单一的被怀疑的内生变量, (1) 其中和是外生的。我们有另外两个外生变量,和,它们不出现在方程

17、(1)中。如果与不相关,我们该用OLS估计。对此我们如何检验呢?Hausman(1978)建议直接比较OLS和2SLS估计值,判断其差异是否在统计上显著。毕竟,如果所有变量外生,OLS和2SLS都是一致性的。如果2SLS与OLS的差异显著,我们断定必定是内生的(保持外生性)。计算OLS和2SLS,看估计值是否实际上有差异,这是个好主意。为了判断差异是否在统计上显著,用回归来检验更容易。这是以估计的诱导型为基础的,此时诱导型为 (2)现在,因为各个与不相关,所以与不相关当且仅当与不相关;这是我们希望检验的。写成,其中与不相关,且有零均值。那么,与不相关当且仅当。检验这一点最容易的方法是将作为添加

18、的回归元包括在(1)中,做t检验。这么做唯一的问题是:不能被观测到,因为它是(2)中的误差项。可是因为我们能用OLS估计的诱导型,我们可以获取诱导型残差。因此,我们用OLS估计 (3) 并用t统计量检验。如果我们以一个小的显著水平拒绝,我们因与相关推断出是内生的,进而运用2SLS估计比OLS估计更有效。附:广义距估计(GMM) 在扰动项存在异方差或自相关情况下,广义距估计(GMM)比二阶段最小二乘(2SLS)更有效率,即GMM之于2SLS,正如GLS之于OLS。4.软件选择和实例演示(1)软件以及操作步骤: 运用STATA 进行二阶段最小二乘估计 操作命令与步骤:主命令: ivregress

19、2sls depvar varlist1 (varlist2=instlist),r其中,“depvar”为被解释变量,“varlist1”为外生解释变量,“varlist2”为内生解释变量,而“instlist”为工具变量,“r”表示使用异方差稳健标准差。检验命令:A.相关性检验: estat firststage,all forcenonrobust 该命令将显示与弱工具变量有关的第一个阶段回归统计量及临界值。“all”表示显示每个内生解释变量的统计量而非仅仅是所有内生变量综合的统计量。“forcenonrobust”表示即使在进行工具变量法时使用了稳健标准差,也仍然允许计算“estate firststage”中的统计量。B外生性检验(过度识别检验):estat overidC解释变量内生性检验:豪斯曼检验 reg y x1 x2 estimates store ols (存储OLS估计的结果) ivregress 2sls y x1 (x2=z1 z2) (假设“x2”为内生变量)estimates store iv (存储2sls的结果)hausman iv ols,constant sigmamore (根据存储的结果进行豪斯曼检验)(2):实例演示:【精品文档】第 6 页

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!