离散选择模型举例122

上传人:d**** 文档编号:133770585 上传时间:2022-08-11 格式:DOCX 页数:15 大小:54.52KB
收藏 版权申诉 举报 下载
离散选择模型举例122_第1页
第1页 / 共15页
离散选择模型举例122_第2页
第2页 / 共15页
离散选择模型举例122_第3页
第3页 / 共15页
资源描述:

《离散选择模型举例122》由会员分享,可在线阅读,更多相关《离散选择模型举例122(15页珍藏版)》请在装配图网上搜索。

1、一.二元离散选择模型1二元响应模型(Binary response model)我们往往关心响应概率y 1x yx Go ixi. kxkG z,其中x表示各种影响因素(各种解释变量,包括虚拟变量)。根据不同的函 数形 式可以分为下面三类模型:线性概率模型( Linear probability model, LPM)、对数单位模型(logit)、概率单位模型(probit):三种模型估计的系数大约有以下的关系:logit 6 probit probitLPM2 偏效应(1) 如果解释变量是一个连续型变量, 可以通过求下面的偏导数得出来:p x g0x xjdz 号和该解释变量对应的系数的符号

2、一致; 各自的估计系数之比。(2) 如果解释变量是一个离散性变量,那么他对p(x) = p(y=1|x)的偏效应四ZdG z,偏效应的符两个解释变量偏效应之比等于它们则xk从ck变化到Ck+1时对概率影响大小为:1x1kCk1 G01x1上面的其他解释变量的取值往往取其平均值。3 .估计方法与约束检验 极大似然估计;三种常见的大样本检验:拉格朗日乘数检验、比检验。wald检验、似然4Stata程序语法(以Probit为例)probit depvar indepvars weight if exp in range , level(#) nocoef noconstant robust clus

3、ter(varname) score(newvar) asis offset(varname) maximize_options predict type newvarname if exp in range , statistic rules asif nooffset where statistic isppredicted probability of a positive outcome; the defaultxblinear predictionstdpstandard error of the prediction.具体的例子1 .数据:美国1988年的CPS数据2.模型:估计成

4、为工会成员的可能性,模:是U四4 四 白幻 -rz Trf潜在经验potexp、经验的平万项 married、工会化程度high);型形式如下:参加工会的概率=f ( potexp2、受教育年限grade、婚否unionCoef.Std. Err.zPz95% Conf.Intervalpotexp.0835091.01560875.350.000.0529166.1141016potexp2-.0015308.0003179-4.820.000-.0021538-.0009078grade-.042078.0189089-2.230.026-.0791388-.0050171married.

5、0622516.11258360.550.580-.1584083.2829115high.5612953.0996625.630.000.3659613.7566292cons-1.468412.2958112-4.960.000-2.048192-.8886332解释变量:Potexp=年龄-受教育年限-5;grade=完成的受教育年限; married: 1表示婚,0未婚;high: 1表示高度工会化的行业,否则为0。3估计的结果3.1 probit union potexp potexp2 grade married high3.2dprobit union potexp potexp

6、2 grade married high给出了 gx,如果要求偏效应还需要对其乘以估计的系?0?数beta ;uniondF/dxStd. Err. zPzx-bar 95% C.I.potexp.0226964.0041529 5.350.00018.884.014557. 030836potexp2-.000416.000085-4.820.000519.882 -.000583- .00025grade-.0114361 .0051379 -2.230.02613.014 -.021506-.001366married dF/dx is for discrete change of du

7、mmy variable from 0 to 1, 对离散变量。此 外,如果想针对某些解释变量的特定取值进行计算,可以用下面的语句: matrix myx= (8, 64,10,1, 1)dprobit, at ( myx.0167881.03011370.550.580.641 -.042234 .07581high*.1470987.02470055.630.000 .568 .098687 .195511obs. P.216pred. P.1904762 (at x-bar)uniondF/dxStd. Err.zPzx95%C.I.potexp.0261573.00443085.350

8、.0008.017473.034841potexp2-.0004795.0000978-4.820.00064-.000671-.000288grade-.0131799.0065759-2.230.02610-.026068-.000291married*.0190706.03458370.550.5801-.048712.086853high*.1389514.02660335.630.0001.08681.191093obs. P .216pred. P.1904762 (at x-bar)pred. P.2433575 (at x)3.3 logit(1)logistic union

9、potexp potexp2 grade married high, coef(给出回归系数)unionCoef.Std. Err.zPz95% Conf.Intervalpotexp.1474021.0280975.250.000.0923329.2024712potexp2-.0026869.0005654-4.750.000-.0037951-.0015787grade-.0703209.032142-2.190.029-.1333181-.0073236married.115463.1967790.590.557-.2702167.5011427high.9801411.1800495

10、.440.000.62725151.333031cons-2.581436.5186859-4.980.000-3.598041-1.56483等价于logit union potexp potexp2 grade married high2)给出发生比率(odds ratio )logistic union potexp potexp2 grade married high等价于logit union potexp potexp2 grade married high, orunionOddsRatioStd. Err.PzInterval95% Conf.potexp potexp21.1

11、5882.03255945.250.0001.096731.224425.9973167.0005639-4.750.000.9962121.9984225grademarried.9320947.0299594-2.190.029.8751866.99270311.122393.22086330.590.557.76321411.6506062.664832high如果存在异方差,可采用稳健估计,在上面命令后面加上robust.47980055.440.0001.8724573.79252其他命令:1.有序模型ologit, oprobit2-多重选择模型mlogit rrr给出发生比率;多

12、重probit模型设计复杂计算,目前尚无对应的命令。3-工具变量如果在probit模型中有内生变量,就要采用工具变量方法予以克服,ivprob命 令给出了结果。4.面板数据的离散选择模型xtlogit,xtprobit, xttobitsas 相关过程:logistic,logit,probit;多重 logit 模型:proc catmod 三托宾模 型(Tobit) 和赫克曼修正模型 (Heckit)一.tobit 模型( censored model 截取回归模型)实际上tobit模型是probit模型的推广,(tobit意即Tobin的probit);在 严格为正值的时候大致连续,但是

13、有相当部分取值为0。模型:y* 0 x u,u| x 0, 2 ,y max 0,y*隐变量y*满足经典的线性假定,服从具有线性条件均值的正态同方差分布。由于y*正态分布,所以y在严格正值上连续分布2.估计和检验极大似然估计,检验同上面的三种检验3 偏效应xj我们估计出的系数y|x,是隐变量做用)的偏效应,而我们关心的是对y (工作时间)的偏效应c ,if z 0,1 c这表明对于那些具有正值的观测值作OLS,由于忽略了逆米尔斯比0率 inverse yx p y 0x y y 0,x p(y 0|x)?0 z z0,x x ccyy x cxu/xxx称为逆米尔斯比率mills ratio)

14、可能导致估计结果的非一致性。从上面推导可以得出:yx x x x因此,当y服从一个tobit模型时,难以直接得出偏效应(1)如果xj是一个连续变量,可以通过微分求出偏效应:d dc x,大括号中为一个调整因子可以通y y 0,x首先 xj.1 x xjy y 0,x 对过代入,的估计值,而且必须带入解释变量的有意义的值,一般用均值。p y 0xyxP y 0x xj Xj y y 0,xp y 0x x偏效应p y 0xx jxyxxjTobit模型估计的结果并不能直接给出偏效应,但是估计系数的符号和偏效应 的符号是一致的,而且统计显著性也一致。如果要求具体的偏效应大小, 需要将估计的参数值和

15、解释变量的相应取值代入进行计算而得。Stata程序语法tobit depvar indepvar weightif exp in range,l1(#) u1(#)level(#) offset(varname) maximize_optionspredict type newvarname if exp in range,statistics nooffsetl1表示左截断,那些小于l1的y值被截断;那些大于u1的y值被右截 断。Tobit命令默认为他们分别为因变量的最小和最大值。其中 statistics:xb拟合值pr(a,b) Pr(ayj b)e(a,b) E(yj|a yjt95%

16、 Conf.Intervalnwifeinc-8.815554.470889-1.970.049-17.59257-0.0385257educ80.7085321.640413.73038.22519123.1919exper131.93117.330087.61097.90948165.9525expersq-1.87070.53915-3.470.001-2.929127-0.8122632age-54.57217.440187-7.330-69.17827-39.96588kidslt6-896.038112.1955-7.990-1116.294-675.7811kidsge6-16.

17、0338.74414-0.410.679-92.090560.03055cons968.154447.62822.160.03189.393151846.915se | 1124.914 41.77934(Ancillary parameter)Obs. summary: 325 left-censored observations at hours=4950Obs. summary:3 25 left-censoredobservations at hours=4950其他回归模型1 ,泊松回归模型poisson (又称为计数回归,count regression)主要针对的 因变量是计数变

18、量,可以取非负整数值0, 1,2,例如某人在 某年被捕的次数、一个企业在某年申请的专利个数、妇女生育子女人数等等。对这 些变量采用普通的线性模型往往不能给出很好的拟合。模型:y X1,X2,.Xkexp 0 1X1. kXkexp (X ) 0,取对数后是线性的;以X为 条件,Y=h的概率是:pY hX exp exp X exp X h / h!,h 0,1.2,利用极大似然估计估旦 量。计出参数值,然后带入上式就可以求出每一个条件概率值,无论泊松分布假 定成立与否,、仍然可以得到参数的一致和渐进正态的估计Stata中的语句是:Poisson ;l,不观测yi,2 截取正态回归模型(cens

19、ored Normal regression mode)模型:ys 0xiui,ui |xi,ci0, 2 , imin( 乂,q)只有在yi小于ci时才观测到它,上式还包括了 ui独立于ci的假定右端截取或从上截取的一个例子是顶端编码(top coding) o当一个变量超 过顶端编码时,我们只知道他达到了某个临界值,对高于这个临界值的回 答,我们只知道他和临界值至少一样大。例如调查家庭财富时,我们可以 观测到那些财富不足50万美元的受访者的实际财富,但不能观测到那些 财富高于50万美元的受访者的实际财富。此时,截取值ci对所有个体i 都一样。Stata 程序:cnreg3 持续期模型( d

20、uration model) 持续期间是一个度量某事件发生之前持续时 间的度量。例如一个下岗工人再度 失业前的失业时间;一个从监狱释放的 罪犯下次被捕前持续的天数。Stata 程序 streg。4断尾回归(truncated regression)与截取模型类似,有一点不同:断尾模型 中,不能观测到总体某一段的所有信息包括解释变量和被解释变量;截取 模型只是观测不到被解释变量。Stata 程序:trunreg5附录:间模型:开关模型(sas过程(1)截取模型包括tobit模型:proc lifereg; 比例风险模型.cox|刈小1 也 1 天主 ;proc phregswitch model

21、)上面分析的选择模型有这样的特点:(2)持续期有关的观测之要么观测得到,要么观测 不到。这里兼具可观测两种的情形,在这种条件 下的选择模型称为开关模型(switch model)。x1 1%; y2X2 2U2模型形式:y表示两种体制yi,若y*2,若,引入虚拟变量d1,若0,若yi或写作:V *若 y1* ,0,若 尸2*,若 0,若,其中 u 0, ,v 0,1 ,corr u,v , 0 直接采0*;yx1 1 u10*0;y*2x2 2u2仍然利用极大似然估计方法估计(分两种情况:一种d已知;另一种d 未知。)二.赫克曼两步修正模型理性的经济人往往从效用极大化出发而做 出有意识的决策,

22、比如选择不同的教育水平、接受培训、参加工作、移民、 进入不同所有制的企业等等。由于研究 所用的样本中只包括这些已经做出了 决策的个体而不包括那些没有作出这些选择的个体,因此样本就不是随机 的,基于这样的样本作出的任何结论只能代表这部分作出相应决策的个体行 为,而不是整个总体的行为,这就是样本的选择性误差(Sample selectionbias) (Heckman,1979)。模型在总体回归方程中加入行为选择方程(selection equation):y x u, ux 0 s 1z v 0用回归方程估计是有偏的;而heckman模型提供了一致和渐进有效的估计。如果观测到y,则s=1,否则s

23、=0;样本选择校正步骤:(1) 利用所有的观测值,估计一个si对zi的probit模型,并得到估计值?,并计算逆米尔斯比率? z。从lamda的显著性可以判断 样本选择性偏误的严重程度。(2) 利用选择样本,即si = 1的观测,作如下的回归Yi对xi,则得到的参数估计?是一致的,并近似服从正态分布。注意:x应该是z的一个严格子集。Stata 程序:heckman 语法:(1)基本语法 heckman depvar varlist, select(varlist_s) twostep或 heckman depvar varlist, select(depvar_s=varlist_s) two

24、steppredict type newvarname if exp in range,statistics nooffset,其中 statistics 是:xb拟合值(默认项) ycond E(yj|yj observed)(又称为米尔斯比率)yexpected E(yj*),观测不到的y取零。nshazard or mills nonselection hazard psel p yj observed p(z v 0)xbsel选择方程的线性估计stdpsel选择方程线性估计值的标准差pr(a,b) p a xj b u be(a,b) E(yj|a yjz95% Conf.Inter

25、vallwageeduc.1090655.0155237.030.000.0786411.13949exper.0438873.01626112.700.007.0120163.0757584expersq-.0008591.0004389-1.960.050-.00171941.15e-06cons-.5781032.3050062-1.900.058-1.175904.019698selecteduc.1309047.02525425.180.000.0814074.180402exper.1233476.01871646.590.000.0866641.1600311expersq-.0

26、018871.0006-3.150.002-.003063-.0007111nwifeinc-.0120237.0048398-2.480.013-.0215096-.0025378age-.0528527.0084772-6.230.000-.0694678-.0362376kidslt6-.8683285.1185223-7.330.000-1.100628-.636029kidsge6.036005.04347680.830.408-.049208.1212179cons.2700768.5085930.530.595-.72674731.266901millslambda.032261

27、9.13362460.240.809-.2296376.2941613rho0.04861sigma.66362875lambda.03226186.1336246通过观测.的显著性得知样本选择性偏误不是很明显,所以我们可以比 较放心地使用回归方程。(2)极大似然估计要求知道y和s的联合分布,更为复杂,如果采用前面的程序检验发现 样 本选择问题不大,就没有必要继续;否则采用两步估计值或是极大似然估 计同时估计回归和选择方程。heckman lwage educ exper expersq,select(educ exper expersq nwifeinc age kidslt6 kidsge

28、6)Coef.Std. Err.zPz95% Conf.Intervallwageeduc.1083502.01486077.290.000.0792238.1374767exper.0428369.01487852.880.004.0136755.0719983expersq-.0008374.0004175-2.010.045-.0016556-.0000192cons-.5526973.2603784-2.120.034-1.06303-.0423651selecteduc.1313415.02538235.170.000.0815931.1810899exper.1232818.018

29、72426.580.000.0865831.1599806expersq-.0018863.0006004-3.140.002-.003063-.0007095nwifeinc-.0121321.0048767-2.490.013-.0216903-.002574age-.0528287.0084792-6.230.000-.0694476-.0362098kidslt6-.8673988.1186509-7.310.000-1.09995-.6348472kidsge6.0358723.04347530.830.409-.0493377.1210824cons.2664491.5089578

30、0.520.601-.73108981.263988/athrho.026614.1471820.180.857-.2618573.3150854/lnsigma-.4103809.0342291-11.990.000-.4774687-.3432931rho.0266078.1470778-.2560319.3050564sigma.6633975.0227075.6203517.7094303lambda.0176515.0976057-.1736521.2089552LR test of indep. eqns. (rho = 0): chi2(1) = 0.03 Prob chi2 =

31、 0.8577从 的显著性可以发现,不显著,说明样本选择性偏误不是很大,而且 我们不能拒绝0,接下来我们看直接回归的结果:lwageCoef.Std. Err.tPt95%Conf.Intervaleduc.1074896.01414657.600.000.0796837.1352956exper.0415665.01317523.150.002.0156697.0674633expersq-.0008112.0003932-2.060.040-.0015841-.0000382cons-.5220406.1986321-2.630.009-.9124667-.1316144差别很小,除了教育回报率的估计相差大约0.1个百分点其他命令:1 Heckprob: maximum likelihood probit estimation with selection;2. Hetprob:maximum likelihood heteroskedastic probit estimation.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!