第4讲面板数据模型

上传人:仙*** 文档编号:163853372 上传时间:2022-10-23 格式:PPT 页数:39 大小:3.56MB
收藏 版权申诉 举报 下载
第4讲面板数据模型_第1页
第1页 / 共39页
第4讲面板数据模型_第2页
第2页 / 共39页
第4讲面板数据模型_第3页
第3页 / 共39页
资源描述:

《第4讲面板数据模型》由会员分享,可在线阅读,更多相关《第4讲面板数据模型(39页珍藏版)》请在装配图网上搜索。

1、第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005李李 平平2006年年1月月第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005主要内容主要内容v面板数据(面板数据(Panel data)v固定效应固定效应v随机效应随机效应v固定效应和随机效应模型的比较固定效应和随机效应模型的比较第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005面板数据面板数据v常用的经济数据类型常用的经济数据类型横截面数据:空间横截面数据:空间时间序列数据:时间时间序列数据:时间面板数据(混合数据、

2、综列数据)面板数据(混合数据、综列数据)第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005面板数据面板数据v为什么使用面板数据?为什么使用面板数据?既能体现横截面上不同个体的差异性,又能反映出某既能体现横截面上不同个体的差异性,又能反映出某一个体的历史信息。一个体的历史信息。可以提供可以提供“更有价值的数据,变量之间增加了多变性更有价值的数据,变量之间增加了多变性而减少了共线性,并且提高了自由度和估计的有效性而减少了共线性,并且提高了自由度和估计的有效性”更好地检测和度量单纯使用横截面数据或时间序列数更好地检测和度量单纯使用横截面数据或时间序列数据无法

3、观测到的影响。据无法观测到的影响。通过使数据适用于多个单元,面板数据能够将累加数通过使数据适用于多个单元,面板数据能够将累加数据所引起的偏差降到最低。据所引起的偏差降到最低。例子:投资理论研究例子:投资理论研究为研究实际总投资(为研究实际总投资(I)对实际资本存量()对实际资本存量(CAP)和企业)和企业实际价值(实际价值(PL)的关系,收集了)的关系,收集了4个公司,即通用电气个公司,即通用电气(GE)、通用汽车()、通用汽车(GM)、美国钢铁()、美国钢铁(US)和西屋)和西屋(WEST),),20年(年(19351954)的数据,共)的数据,共80个观测值。个观测值。通用电气(通用电气(

4、GE)通用汽车(通用汽车(GM)美国钢铁(美国钢铁(US)西屋(西屋(WEST)123ICAPPLu考虑如下模型:考虑如下模型:关键是选取那些数据进行回归?关键是选取那些数据进行回归?也可在每一年都做一次横截面回归(也可在每一年都做一次横截面回归(20次)次)可对可对4个公司的时间序列数据分别做回归(个公司的时间序列数据分别做回归(4次)次)同时利用同时利用4个公司个公司20年的数据做年的数据做1次回归次回归1223321,2,3,4 1,2,.,20(0,)itititititYXXuituN第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005面板数据

5、回归面板数据回归v面板数据回归模型的估计面板数据回归模型的估计由于同时考虑时间和个体上的数据,对面板数据模型由于同时考虑时间和个体上的数据,对面板数据模型的估计方法取决于对截距、斜率和误差项在时间和个的估计方法取决于对截距、斜率和误差项在时间和个体上的假设:体上的假设:所有系数不随时间和个体的变化而变化所有系数不随时间和个体的变化而变化斜率不变而截距随个体变化而变化斜率不变而截距随个体变化而变化斜率不变而截距随时间和个体变化而变化斜率不变而截距随时间和个体变化而变化斜率和截距随个体变化而变化斜率和截距随个体变化而变化斜率和截距随个体和时间变化而变化斜率和截距随个体和时间变化而变化第第4 4讲讲

6、 面板数据模型面板数据模型 School of Management,2005混合回归混合回归(PLS)v所有系数都不随时间和个体的变化而变化所有系数都不随时间和个体的变化而变化12233YXXu直接用直接用OLS估计估计双击双击单击单击存在的问题:假设存在的问题:假设4家不同的公司的截距项和斜率系数家不同的公司的截距项和斜率系数都完全相同,这是相当严格的假设,很可能扭曲了都完全相同,这是相当严格的假设,很可能扭曲了4个个公司公司Y和和X之间关系的真实情况之间关系的真实情况第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005固定效应固定效应v放宽的假设放

7、宽的假设1:斜率系数不变但截距随个体斜率系数不变但截距随个体(或时间)而变化(或时间)而变化12233itiitititYXXu下标下标i 加到截距项上,表明加到截距项上,表明4个公司的截距是不相同的,个公司的截距是不相同的,这种差异可能是由于每个公司的特性所引起的。这种差异可能是由于每个公司的特性所引起的。虽然截距随个体变化,但不随时间变化,即在时间虽然截距随个体变化,但不随时间变化,即在时间上上4个公司的截距项是固定不变的,因此称该模型个公司的截距项是固定不变的,因此称该模型为为固定效应模型固定效应模型(Fixed Effect Model,FEM)现在的问题是,现在的问题是,是不可观测的

8、,怎样实现是不可观测的,怎样实现模型的估计?模型的估计?1i由于由于4个公司的截距项不同,一种直观的考虑是以其中一个公司的截距项不同,一种直观的考虑是以其中一个公司的截距项作为标准,其余个公司的截距项作为标准,其余3个公司的截距项在此基个公司的截距项在此基础上作比较,而这通过虚拟变量可以很容易地实现:础上作比较,而这通过虚拟变量可以很容易地实现:12233442233itiiiitititYDDDXXu 代表代表GE的截距项,而的截距项,而 就能够说明其就能够说明其它它3家公司的截距项相对于家公司的截距项相对于GE的截距项有多大的不同,的截距项有多大的不同,即即级差截距系数。级差截距系数。12

9、34,由于我们使用虚拟变量来刻画固定效应,并使用由于我们使用虚拟变量来刻画固定效应,并使用OLS来估计,因此上述模型也被称为来估计,因此上述模型也被称为最小二乘虚拟最小二乘虚拟变量模型变量模型(LSDV)这些截距上的差异这些截距上的差异可能由每个公司独可能由每个公司独特的性质引起。特的性质引起。那个模型更好呢?那个模型更好呢?从输出结果各项指标来看,从输出结果各项指标来看,LSDV较好。较好。也可从也可从F检验的角度来比较。事实上,检验的角度来比较。事实上,OLS是是LSDV的约束模型。的约束模型。H0:D2D3D4显著拒绝原假设。显著拒绝原假设。第第4 4讲讲 面板数据模型面板数据模型 Sc

10、hool of Management,2005固定效应固定效应放宽的假设放宽的假设2:斜率系数不变而截距随个体和时间变化斜率系数不变而截距随个体和时间变化其中其中 表示时间虚拟变量,表示时间虚拟变量,表示将表示将1954年的截距项作为基准年的截距项作为基准由于考虑了回归模型随时间的改变,因此称为由于考虑了回归模型随时间的改变,因此称为时间效时间效应模型应模型(一个问题:自由度的损失)(一个问题:自由度的损失)122334401192233DUM35.DUM53itiiiitititYDDDXXuDUM35,DUM36,.,DUM350第第4 4讲讲 面板数据模型面板数据模型 School of

11、 Management,2005固定效应固定效应放宽的假设放宽的假设3:所有系数都随个体而变化所有系数都随个体而变化12233442233122223332433542643()()()()()()itiiiititiitiitiitiitiitiititYDDDXXD XD XD XD XD XD Xu若所有的级差截距和基础斜率系数都显著,就可若所有的级差截距和基础斜率系数都显著,就可以得出结论:以得出结论:4家公司的投资函数各不相同,从而家公司的投资函数各不相同,从而说明这说明这4家公司的数据不能一视同仁,而要区别对家公司的数据不能一视同仁,而要区别对待,单独估计每家公司的待,单独估计每家

12、公司的X对对Y的影响关系的影响关系在在Eviews中可以通过菜单直接估计固定效应模型。中可以通过菜单直接估计固定效应模型。单击单击第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005固定效应固定效应v使用固定效应模型注意事项使用固定效应模型注意事项引进过多的虚拟变量会损失大量自由度。引进过多的虚拟变量会损失大量自由度。大量解释变量不可避免地会带来多重共线性问题大量解释变量不可避免地会带来多重共线性问题误差项服从经典假设的正态分布很值得商榷。误差项服从经典假设的正态分布很值得商榷。固定效应模型是建立在扰动项服从正态分布固定效应模型是建立在扰动项服从正态分布

13、假设的基础上。假设的基础上。2(0,)ituN假定:假定:以下几种情况可能违反假定:以下几种情况可能违反假定:1.同一时点上横截面数据造成的异方差。同一时点上横截面数据造成的异方差。2.同一个体的时间序列数据造成的自相关。同一个体的时间序列数据造成的自相关。3.不同时点上横截面数据造成的异方差。不同时点上横截面数据造成的异方差。4.不同个体在时间序列上的横截面相关。不同个体在时间序列上的横截面相关。由于面板数据要考察不同个体之间的差异,但是由于面板数据要考察不同个体之间的差异,但是这些差异单从数据本身是无法观测到的。这些差异单从数据本身是无法观测到的。固定效应方法引入虚拟变量将总体的未知信息差

14、固定效应方法引入虚拟变量将总体的未知信息差异化,从而异化,从而间接地间接地解决了这个问题。解决了这个问题。但是,当横截面单元较多是,由于自由度的原因,但是,当横截面单元较多是,由于自由度的原因,建立的模型将是代价高昂的。建立的模型将是代价高昂的。Kementa曾说曾说:与与LSDV模型相联系的一个明显的问题是,模型相联系的一个明显的问题是,引入虚拟变量是否确实有必要。包含虚拟解释变量是对我们引入虚拟变量是否确实有必要。包含虚拟解释变量是对我们无知的一种掩饰。无知的一种掩饰。第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005随机效应随机效应如果虚拟变量确

15、实代表了对于(真实)模型知识如果虚拟变量确实代表了对于(真实)模型知识的一种缺乏,那么为什么不通过干扰项来表达这的一种缺乏,那么为什么不通过干扰项来表达这种无知呢?种无知呢?基于干扰项的面板数据建模方法叫做基于干扰项的面板数据建模方法叫做随机效应模型随机效应模型(Random Effect Model,REM)或误差组成模型)或误差组成模型(ECM)。)。第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005随机效应随机效应vREM的基本思路的基本思路12233122331223322()(0,),(0,)itiitititiiititititititii

16、tuitiitYXXuEXXuXXwNuNwu第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005随机效应随机效应11()iiiEi个体的截距项表示为个体的截距项表示为 ,即这些个,即这些个体都来自于体都来自于同一个大样本同一个大样本,具有相同的均值和方,具有相同的均值和方差,并且每个个体的截距项的差异反映在误差项差,并且每个个体的截距项的差异反映在误差项 中。中。模型总的误差项是一个合成误差项,它由两个部模型总的误差项是一个合成误差项,它由两个部分的误差组成分的误差组成 ,前者是特定个体横截,前者是特定个体横截面误差部分,后者是时间序列和横截面混合误差

17、面误差部分,后者是时间序列和横截面混合误差部分。部分。itiitwu第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005随机效应随机效应v个体之间的误差部分是不相关的,并且个体之间的误差部分是不相关的,并且2222222(0,),(0,)()0()0,()()0()()0,var()(),()0iituiitijitisitjtitiitituitisitjtuNuNEuEE u uE u uE wEuwcorr w wcorr w w 第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005随机效应随机效应v注意:注

18、意:FEM中,每个横截面单元都有各自的固定截距值,中,每个横截面单元都有各自的固定截距值,N个横截面单元就有个横截面单元就有N个这样的值个这样的值REM中,截距中,截距 代表所有横截面截距的均值,而误差代表所有横截面截距的均值,而误差部分部分 则表示单个截距对这个平均值的随机偏离,如则表示单个截距对这个平均值的随机偏离,如果得到果得到 的估计值,就可以得到个体截距的估计值的估计值,就可以得到个体截距的估计值1ii11ii第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005随机效应随机效应同样,误差项同样,误差项 也是不可直接观测的,同时,总的误也是不可直

19、接观测的,同时,总的误差项差项 虽是虽是同方差同方差的,却明显存在的,却明显存在序列相关序列相关,但序列,但序列相关的结构已知并在时间上保持不变。相关的结构已知并在时间上保持不变。iitw222(),()0itisitjtucorr w wcorr w w 任意两个不同时间上的误差项相关系数值保持不变。任意两个不同时间上的误差项相关系数值保持不变。任意两个横截面单元的相关性结构保持不变。任意两个横截面单元的相关性结构保持不变。这两个系列相关的性质保证能够使用这两个系列相关的性质保证能够使用GLS进行估计。进行估计。随机效应随机效应固定效应固定效应11(1)(2)(3)()0iiiiE虽然两个模

20、型估计结果相似,但随机效应模型更虽然两个模型估计结果相似,但随机效应模型更简洁:方法只引进了一个参数就能够刻画面板数简洁:方法只引进了一个参数就能够刻画面板数据的个体差异。据的个体差异。第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005模型选择模型选择v 研究者经常面临的选择:研究者经常面临的选择:FEM还是还是REM?若扰动若扰动i项与项与X不相关,那么选不相关,那么选REM。若扰动若扰动i项与项与X相关,那么选相关,那么选FEM。REM的基本假设:的基本假设:i是一个非常大的总体是一个非常大的总体中提取的随机变量。中提取的随机变量。第第4 4讲讲

21、面板数据模型面板数据模型 School of Management,2005模型选择模型选择v估计效应与随机效应模型的选择估计效应与随机效应模型的选择若时间序列数据的数目(若时间序列数据的数目(T)很大而横截面单元数量)很大而横截面单元数量(N)较小,则)较小,则FEM和和REM估计的参数值之间的差别估计的参数值之间的差别不大,从计算方便角度选择不大,从计算方便角度选择FEM可能更好。可能更好。当当T较小而较小而N较大时,较大时,REM更可取,因为更可取,因为REM节省了节省了大量的自由度,从而使得估计量更有效。大量的自由度,从而使得估计量更有效。第第4 4讲讲 面板数据模型面板数据模型 School of Management,2005结束语结束语v面板数据回归模型的其它问题面板数据回归模型的其它问题建立面板数据模型是庞大而复杂的工作,我们所接触到建立面板数据模型是庞大而复杂的工作,我们所接触到的仅仅是最基本的内容,尚有大量问题要面对,如的仅仅是最基本的内容,尚有大量问题要面对,如面板数据的假设检验面板数据的假设检验REM中的异方差性中的异方差性动态面板数据模型动态面板数据模型定性因变量的面板数据模型定性因变量的面板数据模型非平衡面板数据非平衡面板数据

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!