计量经济学第八章 虚拟变量回归

上传人:liu****han 文档编号:117896234 上传时间:2022-07-10 格式:PPT 页数:39 大小:342.50KB
收藏 版权申诉 举报 下载
计量经济学第八章 虚拟变量回归_第1页
第1页 / 共39页
计量经济学第八章 虚拟变量回归_第2页
第2页 / 共39页
计量经济学第八章 虚拟变量回归_第3页
第3页 / 共39页
资源描述:

《计量经济学第八章 虚拟变量回归》由会员分享,可在线阅读,更多相关《计量经济学第八章 虚拟变量回归(39页珍藏版)》请在装配图网上搜索。

1、计量经济学计量经济学第第 八八 章章虚拟变量回归虚拟变量回归 2 问题的一般性描述问题的一般性描述在前面讨论的回归模型中,所遇的变量均为定量变量(可直接测度、数值性),例如GDP,工资,收入、受教育年数,销售额等。在实际建模中,一些定性变量具有不可忽视的重要影响。例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是定性描述的。在同时考虑定量和定性因素的条件下,依据现有的回归分析知识,如何对非定量因素进行回归分析?采用“虚拟变量”对定性变量进行量化是一种思路。3第

2、一节 虚拟变量一、基本概念定量因素:可直接测度、数值性的因素。定性因素:属性因素,表征某种属性存在与否 的非数值性的因素。基本思想:直接在回归模型中加入定性因素存在诸多的困难,是否可将这些定性因素进行量化,以达到定性因素能与定量因素有着相同作用之目的。4 对定性变量的量化可采用虚拟变量的方式实对定性变量的量化可采用虚拟变量的方式实现现计量经济学中,将取值为0 和 1的人工变量称为虚拟变量。虚拟变量的同位语有:哑元变量、定性变量等等。通常用字母 D或 DUM 加以表示(英文中虚拟或者哑元 Dummy 的缩写)。虚拟变量的定义虚拟变量的定义5虚拟变量的设置规则涉及三个方面:1、“0”和“1”选取原

3、则;2、属性(状态、水平)因素与设置虚拟变量数量的关系;3、虚拟变量在回归分析中的角色以及作用等方面的问题。二、二、虚拟变量虚拟变量设置规则设置规则61 1、虚拟变量的、虚拟变量的“0”0”和和“1”1”选取原则选取原则 虚拟变量取“1”或“0”的原则,应从分析问题的目的出发予以界定。从理论上讲,虚拟变量取“0”值通常代表比较的基础类型;而虚拟变量取“1”值通常代表被比较的类型。“0”代表基期(比较的基础,参照物);“1”代表报告期(被比较的效应)。7例如,比较收入时考察性别定性变量的作用。当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故有男性为“1”,女性为“0”。110D

4、男()女120D改革开放以后()改革开放以前8定性因素的属性既可能为两种状态,也可能为多种状态。例如,性别(男、女两种)、季节(4种状态),地理位置(东、中、西部),行业归属,所有制,收入的分组等。2 2、属性的状态(水平)数与虚拟变量数量的关系、属性的状态(水平)数与虚拟变量数量的关系9 其他其他东部非沿海地区东部非沿海地区011D 其他其他中部地区中部地区012D 其他其他西部地区西部地区013D 西部地区西部地区中部地区中部地区东部非沿海地区东部非沿海地区东部沿海地区东部沿海地区)1,0,0()0,1,0()0,0,1()0,0,0(),(321DDD101、若定性因素具有m 个(m=2

5、,3,4等)相互排斥属性(或几个水平),当回归模型有截距项时,只能引入 m-1 个虚拟变量;2、当回归模型无截距项时,则可引入 m 个虚拟变量;否则,就会陷入“虚拟变量陷阱”。为什么?虚拟变量数量的设置规则虚拟变量数量的设置规则11研究居民住房消费支出Yi和居民可支配收入 Xi 之间的数量关系。回归模型的设定为:011iiiYXu()现在要考虑城镇居民和农村居民之间的差异,如何办?一个例子(虚拟变量陷阱)为了对“城镇居民”、“农村居民”进行区分,分析各自在住房消费支出 Yi 上的差异,设110iD城镇农村(模型有截距,“居民属性”定性变量只有两个相互排斥的属性状态(m=2),故只设定一个虚拟变

6、量。)则模型为0111iiiYXDu(2)12则模型(1)为这时,对任一家庭都有:D1+D2=1,即 D1+D2 1=0产生完全共线,陷入了“虚拟变量陷阱”,。0111223iiiYXDDu()若对两个相互排斥的属性“居民属性”,仍然引入 m=2 个虚拟变量,则有110iD城镇居民农村居民210iD农村居民城镇居民“虚拟变量陷阱”的实质是:完全多重共线性。13 虚拟变量既可作为被解释变量,也可作为解释变量,分别称其为虚拟被解释变量和虚拟解释变量。虚拟被解释变量的研究是当前计量经济学研究的前沿领域,如MacFadden、Heckmen等人的微观计量经济学研究,大量涉及到虚拟被解释变量的分析。本课

7、程只是讨论虚拟解释变量的问题3 3、虚拟变量在回归模型中的角色、虚拟变量在回归模型中的角色14第二节第二节 虚拟解释变量的回归虚拟解释变量的回归在计量经济学中,通常引入虚拟变量的方式分为加法方式和乘法方式两种:即0tttYXu1D1tttYXu2tX D0112=iiiYXuDD原 模 型:加 法 方 式 引 入乘 法 方 式 引 入实质实质:加法方式引入虚拟变量改变的是截距;乘法方式引入虚拟变量改变的是斜率。15一、加法类型n 一个以性别为虚拟变量考察企业职工薪金的模型:iiiiDXY210其中:Yi为企业职工的薪金,Xi为工龄,Di=1,若是男性,Di=0,若是女性。iiiiXDXYE10

8、)0,|(企业男职工的平均薪金为:iiiiXDXYE120)()1,|(上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。在该模型中,如果仍假定E(i)=0,则 企业女职工的平均薪金为:16几何意义:n假定20,则两个函数有相同的斜率,但有不同的截距。即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差2。n可以通过传统的回归检验,对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。年薪 Y 男职工 女职工 工龄 X02iiiiDXY21017 又例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。教育水平考虑三个层次:高中以下,高中

9、,大学及其以上 011D 其他高中 012D 其他大学及其以上模型可设定如下:iiiDDXY231210 这时需要引入两个虚拟变量:18 在E(i)=0 的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:n高中以下:iiiXDDXYE1021)0,0,|(高中:iiiXDDXYE12021)()0,1,|(大学及其以上:iiiXDDXYE13021)()1,0,|(假定32,其几何意义:大学教育 保健 高中教育 支出 低于中学教育 收入19 还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。如在上述职工薪金的例中,再引入代表学历的虚拟变量D2:iiiDDXY231

10、210012D本科及以上学历本科以下学历职工薪金的回归模型可设计为:20女职工本科以下学历的平均薪金:iiiXDDXYE13021)()1,0,|(女职工本科以上学历的平均薪金:iiiXDDXYE132021)()1,1,|(iiiXDDXYE1021)0,0,|(iiiXDDXYE12021)()0,1,|(于是,不同性别、不同学历职工的平均薪金分别为:男职工本科以下学历的平均薪金:男职工本科以上学历的平均薪金:iiiDDXY23121021 基本思想基本思想 以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟解释变量与其它解释变量(或为 Xi 或为Di)的乘积,作为新的解释变量出现在模型

11、中,以达到其调整设定模型斜率系数的目的。或者将模型斜率系数表示为虚拟变量的函数,以达到相同的目的。二、乘法类型二、乘法类型乘法引入方式可分为两种情形讨论(1)截距不变;(2)截距和斜率均发生变化;22(1)截距不变的情形)截距不变的情形12121()1:0|,1()|,0ttttttttttttttYXD XYXDE Y X DXE Y X DX反常年份其中:消费支出;:收入;正常年份反常年份正常年份在正常年份的基础上进行比较,(只有斜率系数发生改变)。模型形式:12,tttttYf X D XuD 例:研究消费支出 Y 受到收入 X、年份状况 D 的影响。23(2)截距和斜率均发生变化)截距

12、和斜率均发生变化011201121()1:0|,1()|,0tttttttttttttttYXDD XYXDE YXDXE YXDX反常年份其中:消费支出;:收入;正常年份反常年份正常年份在正常年份基础上比较,(截距和斜率系数都改变,为什么?)。模型形式:0112,ittttYfXDD XDD例,同样研究消费支出 Y、收入 X、年份状况 D 间的影响关系。比较:发生了那些变化?24不同截距、斜率的组合图形重合回归:截距斜率均相同平行回归:截距不同斜率相同共点回归:截距相同斜率不同交叉(不同)回归:截距斜率均不同ttttttXDDXY)(2110002100210021002125三、虚拟解释变

13、量综合应用三、虚拟解释变量综合应用 所谓综合应用是指将引入虚拟解释变量的加法方式、所谓综合应用是指将引入虚拟解释变量的加法方式、乘法方式进行综合使用。乘法方式进行综合使用。本课主要讨论:本课主要讨论:(1)虚变量在模型结构稳定性检验中的应用;)虚变量在模型结构稳定性检验中的应用;(2)虚变量在分段回归中的应用;)虚变量在分段回归中的应用;(3)虚变量在季节调整中的应用;)虚变量在季节调整中的应用;26(1)虚变量在模型结构稳定性检验中的应用)虚变量在模型结构稳定性检验中的应用 结构变化的实质是检验所设定的模型在样本期内结构变化的实质是检验所设定的模型在样本期内是否为同一模型。显然,平行回归、共

14、点回归、是否为同一模型。显然,平行回归、共点回归、交叉回归三个模型均不是同一模型。交叉回归三个模型均不是同一模型。平行回归模型的假定是斜率保持不变(加法类型,平行回归模型的假定是斜率保持不变(加法类型,包括方差分析);包括方差分析);共点回归模型的假定是截距保持不变(乘法类型,共点回归模型的假定是截距保持不变(乘法类型,又被称为协方差分析);又被称为协方差分析);交叉回归模型的假定是截距、斜率均为变动的交叉回归模型的假定是截距、斜率均为变动的(加法、乘法类型的组合)。(加法、乘法类型的组合)。27n Philips在研究英国的劳动工资率和失业率之间的在研究英国的劳动工资率和失业率之间的关系时发

15、现:劳动工资率和失业率之间具有双曲线关系时发现:劳动工资率和失业率之间具有双曲线性质,即劳动工资增加,失业率就降低,劳动工资性质,即劳动工资增加,失业率就降低,劳动工资率减少,失业率增加,这些关系可用率减少,失业率增加,这些关系可用Philips曲线来曲线来描述。然而描述。然而,随着时间序列数据样本容量的增加随着时间序列数据样本容量的增加,经济经济学家发现劳动工资率与失业率之间的凸双曲线关系学家发现劳动工资率与失业率之间的凸双曲线关系被否定了被否定了,也就是说经典的也就是说经典的Philips曲线不能作为有效曲线不能作为有效政策制定的理论依据了。政策制定的理论依据了。28iiiiiiXDXDY

16、1*1*3210年间的观察值年间的观察值197719700196919581iD 根据根据19581977年期间美国小时收入指数变化的百年期间美国小时收入指数变化的百分比即小时劳动工资率与失业率的时间序列数据,建分比即小时劳动工资率与失业率的时间序列数据,建立以下回归模型:立以下回归模型:其中其中Y表示劳动工资率,表示劳动工资率,X表示失业率,表示失业率,D为虚拟变量为虚拟变量且其定义为且其定义为*290678.0)0572.4()1049.2()1314.6()1860.7()3999.9()3573.8()6859.1()4024.1(1*137.38)1(549.17337.10078.

17、102RtseXDXDYiiiii得到模型(得到模型(*)的回归结果如下:)的回归结果如下:回归方程的拟和非常低,但是回归模型的参数回归方程的拟和非常低,但是回归模型的参数t检验却检验却非常之显著。由此,得出数据结构复杂程度是非常明非常之显著。由此,得出数据结构复杂程度是非常明显的。显的。3019771970,)1(549.17078.1019691958,)1(588.20259.0iiiiXYXY根据根据Di的定义,可得的定义,可得3119691958,)1(588.20259.0iiXY19771970,)1(549.17078.10iiXYXYPhilips曲线结构分析曲线结构分析 (

18、1958-1977)32 从图就可看出回归模型(从图就可看出回归模型(*)是结构不稳定)是结构不稳定的,并且造成这个结构不稳定的主要原因是的,并且造成这个结构不稳定的主要原因是1970-1977年的时间序列数据并不支持经典的年的时间序列数据并不支持经典的Philips曲线,也就是说曲线,也就是说Philips曲线的结构发生曲线的结构发生了变化。由此告诉人们,根据了变化。由此告诉人们,根据1958-1977年期年期间 美 国 的 小 时 劳 动 工 资 年 均 变 化间 美 国 的 小 时 劳 动 工 资 年 均 变 化率和数据直接作回归分析是不可靠的,原因是率和数据直接作回归分析是不可靠的,原

19、因是回 归 模 型(回 归 模 型(*)存 在 结 构 不 稳 定 问 题。)存 在 结 构 不 稳 定 问 题。33作用作用:提高模型的描述精度。虚拟变量也可以用来代表数量因素的不同阶段。分段线性回归就是类似情形中常见的一种。一个例子 研究不同时段我国居民的消费行为。实际数据表明,1979年以前,我国居民的消费支出Yt呈缓慢上升的趋势;从1979年开始,居民消费支出为快速上升趋势。如何刻画我国居民在不同时段的消费行为?(2)虚变量在分段回归中的应用虚变量在分段回归中的应用34基本思路:采用乘法方式引入虚拟变量的手段。显然,1979年是一个转折点,可考虑在这个转折点作为虚拟变量设定的依据。若设

20、 X*1979,当 t X*时可引入虚拟变量。35(t1955,1956,2006)居民消费趋势方程:依据上述思路,有如下描述我国居民在不同时段消费行为模型:*012()ttYttXDu10tttXDtX其中:011979ttYtu年以前:*02121979()ttYXtu年以后:36分析分析:1979年之前,回归模型的斜率为1;1979年之后,回归模型的斜率为1+2;若统计检验表明,2 显著不为零,则我国居民的消费行为在1979年前后发生了明显改变。X*XY12*012()ttYttXDu37(3)虚变量在季节调整中的应用)虚变量在季节调整中的应用n 例如:啤酒销售量例如:啤酒销售量Y、人均收入、人均收入X、季节、季节D;其模其模型为:型为:其他三季度其他二季度其他一季度其中:0101013213322110DDDuDDDXYiiiiii38iiiXDDDXYE)()0,1,(10321一季度二季度三季度四季度比较的基础四季度iiiXDDDXYE)()0,1,(20312iiiXDDDXYE)()0,1,(30213iiiXDDDXYE0321)0,(39 运用运用 OLS 得到回归结果,再用得到回归结果,再用 t-检验讨论季节因素检验讨论季节因素是否对模型有影响。是否对模型有影响。EViews命令:命令:Ls y c x seas(1)seas(2)seas(3)

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!