应届毕业生报考研究生人数变动的计量分析
《应届毕业生报考研究生人数变动的计量分析》由会员分享,可在线阅读,更多相关《应届毕业生报考研究生人数变动的计量分析(55页珍藏版)》请在装配图网上搜索。
1、应届毕业生报考研究生人数变动的计量分析应届毕业生报考研究生人数变动的计量分析穆利勇40420029物流管理引言部分改革开放以来,中国的教育事业取得了长足的发展,各项教育指标都较以往有了很大提高,受教育的人数也是逐年上升,文盲比例直线下降。随着有知识、有文化的人数的不断增加,中国的经济也随之高速发展,众多毕业生们在各行各业上表现都十分出色,取得了一系列令人瞩目的成就。但是,经济的发展也要求更多高学历、高素质人才的不断涌现;再加上由于最近几年本科就业压力越来越大,据参考消息报道,预计今年的将会有60%的高校毕业人数面临失业的状态。所以,由于上述因素的存在,越来越多的本科生选择进一步深造读研,为的是
2、今后在就业市场上更能凸显自身优势,同时也能为我国今后的经济建设发展注入新的活力。二、研究目的本文主要对中国在校研究生学生总数(应变量)进行多因素分析(具体分析见下图),并搜集相关数据,建立模型,对此进行数量分析。在得到在校研究生学生总数与各主要因素间的数量关系后,据模型方程中的各因素系数大小,分析各因素的重要性,究竟是什么因素在对在校研究生人数变动方面起着关键作用,并以此针对未来研究生人数变动走向来提出我们的建议。影响在校研究生学生总数变动的主要影响因素如下图:人均GDP 这是影响在校研究生学生总数的一个重要因素(读研是一个不小的成本,只有拥有了一定的经济基础才有更多的机会深造)人口总数 这也
3、是影响在校研究生学生总数的一个重要因素(可以说是影响它的基础源泉)失业人口数 这是影响在校研究生学生总数的一个直接因素(正是由于失业率高,才会有更高的人选择考研,将强自身就业砝码)普通高等学校数 这是影响在校研究生学生总数的一个不小的相关因素(正是有了更多的高等学校的出现,才可以允许更多的人参与考研)注:1.由于其他因素或是不好量化,或是数据资料难于查找,故为了分析的简便,这里仅用此四个因素来进行回归分析。 2我们觉得失业率的高低更能说明问题,但是由于失业率是个比较敏感的数字,所以在数据上根本找不到,我们就只能采取失业人口数来代替失业率。三、建立模型 Y=+1X1+2X2+3X3+4X4 +u
4、其中,Y在校研究生总数(应变量) X1人均GDP (解释变量) X2 人口总数 (解释变量) X3 失业人口数 (解释变量)X4普通高等学校数(解释变量)四、数据搜集数据说明在这里,使用同一地区(即中国)的时间序列数据进行拟合。 数据的搜集情况采用19986年到2005年的时间序列数据,具体情况见表一。表一:年度YX1X2X3X41986110371963107507264.4105419871201911112109300276.6106319881127761366111026296.2107519891013391519112704377.910751990930181644114333
5、383.210751991881281893115823352.210751992941642311117171363.9105319931067712998118517420.1106519941279354044119850476.4108019951454435046121121519.6105419961633225846122389552.8103219971763536420123626576.81020199819888567961247615711022199923351371591257865751071200030123978581267435951041200139325
6、686221276276811225200250098093981284537701396200365126010542129227800155220048198961233612998882717312005978610140401307568391792五、模型的参数估计、检验及修正1.模型的参数估计及其经济意义、统计推断的检验利用EVIEWS软件,用OLS方法估计,得:(见表二)表二:Dependent Variable: YMethod: Least SquaresDate: 06/22/07 Time: 12:23Sample: 1986 2005Included observati
7、ons: 20VariableCoefficientStd. Errort-StatisticProb. X4621.334846.7225613.298390.0000X3-366.8774157.9402-2.3228890.0347X2-7.1586023.257541-2.1975480.0441X159.224556.3522889.3233410.0000C270775.2369252.80.7333060.4747R-squared0.996048 Mean dependent var275872.5Adjusted R-squared0.994994 S.D. dependen
8、t var261975.3S.E. of regression18535.27 Akaike info criterion22.70506Sum squared resid5.15E+09 Schwarz criterion22.95399Log likelihood-222.0506 F-statistic945.1415Durbin-Watson stat1.596173 Prob(F-statistic)0.000000Y = 59.22454816*X1- 7.158602346*X2- 366.8774279*X3+621.3347694*X4 (6.352288) (3.25754
9、1) (157.9402) (46.72256) t= (9.323341) (-2.197548) (-2.322889) (13.29839) + 270775.151 (369252.8)(0.733306)R2=0.996048 Adjusted R-squared =0.994994 F=945.1415 DW=1.596173可见,X1, X2, X3, X4的t值均是显著的,表明人均GDP、人口总数、城镇登记失业人口数、普通高等学校数都是影响在校研究生学生总数的主要因素。模型可决系数为0.996048,修正可决系数为0.994994,都比较大,说明模型的拟合程度较高,而F值为94
10、5.1415,说明模型总体是显著的。另外,X1, X4的系数符合经济意义,但X2, X3,的系数不符合经济意义,因为从经济意义上讲,在校研究生的总人数应该都是随着人口总数(X2)增加而增加的,而且由于失业人数的增多,也会有越来越多的人选择读研,所以说失业人口总数与研究生人数应该是正相关的关系。由于X2, X3的系数符号与预期相反,这表明可能存在着严重的多重共线性。2.计量经济学检验 (1)多重共线性检验用EVIEWS软件,得相关系数矩阵表:x1x2x3x4x110.9421990.980840.802095x20.94219910.9592980.616487x30.980840.959298
11、10.776181x40.8020950.6164870.7761811由上表可以看出,解释变量X1与X2, X3, X4之间高度正相关,X2与X1, X3之间高度正相关,可见存在严重的多重共线性。下面用逐步回归法进行修正:用OLS法逐一求Y对各个解释变量的回归:Y对X1回归结果如下:Dependent Variable: YMethod: Least SquaresDate: 06/22/07 Time: 12:54Sample: 1986 2005Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X
12、160.219776.3119449.5406060.0000C-61096.2542959.23-1.4221910.1721R-squared0.834897 Mean dependent var275872.5Adjusted R-squared0.825725 S.D. dependent var261975.3S.E. of regression109364.9 Akaike info criterion26.13741Sum squared resid2.15E+11 Schwarz criterion26.23698Log likelihood-259.3741 F-statis
13、tic91.02316Durbin-Watson stat0.129358 Prob(F-statistic)0.000000Y = 60.21976901*X1 - 61096.25048(6.311944) (42959.23) t = (9.540606) (-1.422191)Adjusted R-squared=0.825725 F=91.02316Y对X2回归结果如下:Dependent Variable: YMethod: Least SquaresDate: 06/22/07 Time: 12:57Sample: 1986 2005Included observations:
14、20VariableCoefficientStd. Errort-StatisticProb. X227.058785.6227914.8123400.0001C-2993786.680596.9-4.3987660.0003R-squared0.562668 Mean dependent var275872.5Adjusted R-squared0.538371 S.D. dependent var261975.3S.E. of regression177994.6 Akaike info criterion27.11153Sum squared resid5.70E+11 Schwarz
15、criterion27.21111Log likelihood-269.1153 F-statistic23.15862Durbin-Watson stat0.151849 Prob(F-statistic)0.000140Y = 27.05878289*X2 - 2993786.354 ( 5.622791) (680596.9)t = (4.812340) (-4.398766)R-squared=0.562668 F=23.15862Y对X3回归结果如下:Dependent Variable: YMethod: Least SquaresDate: 06/22/07 Time: 12:5
16、7Sample: 1986 2005Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X31231.660161.90457.6073240.0000C-371863.790051.37-4.1294610.0006R-squared0.762756 Mean dependent var275872.5Adjusted R-squared0.749576 S.D. dependent var261975.3S.E. of regression131098.7 Akaike info criterion2
17、6.49993Sum squared resid3.09E+11 Schwarz criterion26.59950Log likelihood-262.9993 F-statistic57.87138Durbin-Watson stat0.253065 Prob(F-statistic)0.000000Y = 1231.659997*X3 - 371863.6509 (161.9045) (90051.37)t = (7.607324) (-4.129461)Adjusted R-squared=0.749576 F=57.87138Y对X4回归结果如下:Dependent Variable
18、: YMethod: Least SquaresDate: 06/22/07 Time: 12:58Sample: 1986 2005Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X41053.52065.8594815.996480.0000C-964699.879072.71-12.200160.0000R-squared0.934280 Mean dependent var275872.5Adjusted R-squared0.930628 S.D. dependent var261975.3
19、S.E. of regression69000.33 Akaike info criterion25.21625Sum squared resid8.57E+10 Schwarz criterion25.31582Log likelihood-250.1625 F-statistic255.8874Durbin-Watson stat0.485113 Prob(F-statistic)0.000000Y = 1053.519847*X4 - 964699.7964 (65.85948) (79072.71)t = (15.99648) (-12.20016)Adjusted R-squared
20、=0.930628 F=255.8874经分析可见,在四个一元回归模型中,在校研究生总数Y对普通高校 X4的线性关系强,拟合程度好,即:Y = 1053.519847*X4 - 964699.7964 (65.85948) (79072.71)t = (15.99648) (-12.20016)Adjusted R-squared=0.930628 F=255.887逐步回归。将其余解释变量逐一带入上式中,得如下几个模型:Dependent Variable: YMethod: Least SquaresDate: 06/22/07 Time: 13:53Sample: 1986 2005In
21、cluded observations: 20VariableCoefficientStd. Errort-StatisticProb. X4714.169448.4570814.738180.0000X125.582382.9300538.7310290.0000C-708247.745496.23-15.567180.0000R-squared0.988016 Mean dependent var275872.5Adjusted R-squared0.986606 S.D. dependent var261975.3S.E. of regression30318.49 Akaike inf
22、o criterion23.61438Sum squared resid1.56E+10 Schwarz criterion23.76374Log likelihood-233.1438 F-statistic700.7988Durbin-Watson stat1.093701 Prob(F-statistic)0.000000Y = 714.1694264*X4 + 25.58237739*X1 - 708247.7381 (48.45708) (2.930053) (45496.23)t = (14.73818) (8.731029) (-15.56718)Adjusted R-squar
23、ed=0.986606 F=700.7988Dependent Variable: YMethod: Least SquaresDate: 06/22/07 Time: 14:00Sample: 1986 2005Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X4886.358455.5267015.962740.0000X28.9740911.8377224.8832690.0001C-1852247.189180.7-9.7908860.0000R-squared0.972648 Mean de
24、pendent var275872.5Adjusted R-squared0.969430 S.D. dependent var261975.3S.E. of regression45804.80 Akaike info criterion24.43965Sum squared resid3.57E+10 Schwarz criterion24.58901Log likelihood-241.3965 F-statistic302.2581Durbin-Watson stat0.872463 Prob(F-statistic)0.000000Y = 886.3583756*X4 + 8.974
25、091045*X2 - 1852246.686(55.52670) (1.837722) (189180.7)t = (15.96274) (4.883269) (-9.790886)Adjusted R-squared=0.969430 F=302.2581Dependent Variable: YMethod: Least SquaresDate: 06/22/07 Time: 14:05Sample: 1986 2005Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X4791.519369.6
26、425311.365460.0000X3436.750290.108994.8469100.0002C-885870.155171.66-16.056620.0000R-squared0.972409 Mean dependent var275872.5Adjusted R-squared0.969163 S.D. dependent var261975.3S.E. of regression46004.46 Akaike info criterion24.44835Sum squared resid3.60E+10 Schwarz criterion24.59771Log likelihoo
27、d-241.4835 F-statistic299.5666Durbin-Watson stat1.019792 Prob(F-statistic)0.000000Y = 791.519267*X4 + 436.7502136*X3 - 885870.134(69.64253) (90.10899) (55171.66)t = (11.36546) (4.846910) (-16.05662)Adjusted R-squared=0.969163 F=299.5666通过上述数据分析,经比较,新加入的X1人均GDP的方程Adjusted R-squared=0.986606,改进最大,且各参数
28、的T检验显著,所以选择保留X1。再加入其他新的变量逐步回归:Dependent Variable: YMethod: Least SquaresDate: 06/22/07 Time: 14:15Sample: 1986 2005Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X4570.375846.5753512.246300.0000X153.538636.6181528.0896650.0000X2-12.189022.747500-4.4364030.0004C777507.8336370.
29、12.3114660.0345R-squared0.994626 Mean dependent var275872.5Adjusted R-squared0.993619 S.D. dependent var261975.3S.E. of regression20927.12 Akaike info criterion22.91234Sum squared resid7.01E+09 Schwarz criterion23.11148Log likelihood-225.1234 F-statistic987.1753Durbin-Watson stat1.409957 Prob(F-stat
30、istic)0.000000Y = 570.3757921*X4 + 53.53863254*X1 - 12.18901747*X2 + 777507.8381(46.57535) (6.618152) (2.747500) (336370.1)t = (12.24630) (8.089665) (-4.436403) (2.311466)Adjusted R-squared=0.994626 F=987.1753通过分析,我们可以发现:在加入新的变量X2后,X2的系数为- 12.18901747,说明X2与Y呈负相关关系,但是在现实的经济意义上,X2表示总人口数,它与Y 研究生人数呈正相关关
31、系,一般的经济意义为总人口越多,就读研究生的人数的绝对量会越多。所以说,X2应该被剔除。Dependent Variable: YMethod: Least SquaresDate: 06/22/07 Time: 14:23Sample: 1986 2005Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X4700.511333.1156421.153490.0000X153.638056.4807078.2765740.0000X3-597.6141131.3478-4.5498610.0003C-
32、534866.249101.16-10.893150.0000R-squared0.994776 Mean dependent var275872.5Adjusted R-squared0.993796 S.D. dependent var261975.3S.E. of regression20634.40 Akaike info criterion22.88416Sum squared resid6.81E+09 Schwarz criterion23.08331Log likelihood-224.8416 F-statistic1015.535Durbin-Watson stat1.52
33、4814 Prob(F-statistic)0.000000 Y = 700.5113451*X4 + 53.63805156*X1 - 597.614061*X3 - 534866.1749 (33.11564) (6.480707) (131.3478) (49101.16)t = (12.24630) ( 8.089665) (-4.436403) (2.311466)Adjusted R-squared=0.994626 F=987.1753同样的,加入新变量X3后,它的参数估计仍为负数,X3表示的是城镇失业人员数,经济意义上,城镇失业人员越多,将会促使越来越多的人去考研,以实现自身素
34、质的提高,就业能力和机会增加。所以,现实中,二者应该是正相关的,应该剔除X3。(2)异方差检验(ARCH检验)ARCH Test:F-statistic0.194195 Probability0.665000Obs*R-squared0.214590 Probability0.643193Test Equation:Dependent Variable: RESID2Method: Least SquaresDate: 06/22/07 Time: 14:51Sample(adjusted): 1987 2005Included observations: 19 after adjusting
35、 endpointsVariableCoefficientStd. Errort-StatisticProb. C8.10E+083.05E+082.6613420.0164RESID2(-1)-0.1105050.250763-0.4406760.6650R-squared0.011294 Mean dependent var7.33E+08Adjusted R-squared-0.046865 S.D. dependent var1.06E+09S.E. of regression1.08E+09 Akaike info criterion44.54382Sum squared resid
36、2.00E+19 Schwarz criterion44.64323Log likelihood-421.1663 F-statistic0.194195Durbin-Watson stat1.955264 Prob(F-statistic)0.665000根据检验的基本原理,由于(n-p)R2=180.011294=0.203293,查 X2 分布表,给定=0.05,自由度为P=1,得临界值 X20.05(1)= 3.84146,因为(n-p)R2=0.203293< X20.05(1)= 3.84146,所以接受H0,表明模型中随机误差项不存在异方差。(3)自相关检验(DW检验)De
37、pendent Variable: YMethod: Least SquaresDate: 06/22/07 Time: 15:11Sample: 1986 2005Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X4714.169448.4570814.738180.0000X125.582382.9300538.7310290.0000C-708247.745496.23-15.567180.0000R-squared0.988016 Mean dependent var275872.5Adjus
38、ted R-squared0.986606 S.D. dependent var261975.3S.E. of regression30318.49 Akaike info criterion23.61438Sum squared resid1.56E+10 Schwarz criterion23.76374Log likelihood-233.1438 F-statistic700.7988Durbin-Watson stat1.093701 Prob(F-statistic)0.000000DW=1.093701,给定显著性水平=0.05,查Durbin-Watson表,n=20,k(解释
39、变量个数)=2,得下限临界值dL=1.1, 得上限临界值dU=1.537,因为DW=1.093701dL=1.1,表明该模型中的随机误差项存在一阶自相关。修正:通过科克伦奥克特迭代法,得的值:Dependent Variable: EMethod: Least SquaresDate: 06/22/07 Time: 15:30Sample(adjusted): 1987 2005Included observations: 19 after adjusting endpointsVariableCoefficientStd. Errort-StatisticProb. E(-1)0.93333
40、30.1104918.4471150.0000R-squared0.798269 Mean dependent var-5.322877Adjusted R-squared0.798269 S.D. dependent var145.4314S.E. of regression65.31981 Akaike info criterion11.24766Sum squared resid76800.21 Schwarz criterion11.29737Log likelihood-105.8528 Durbin-Watson stat0.909130利用广义差分法进行修正Dependent V
41、ariable: Y-0.9333*Y(-1)Method: Least SquaresDate: 06/23/07 Time: 11:40Sample(adjusted): 1987 2005Included observations: 19 after adjusting endpointsVariableCoefficientStd. Errort-StatisticProb. C-51055.459052.520-5.6399160.0000X1-0.9333*X1(-1)66.530709.4434387.0451780.0000X4-0.9333*X4(-1)382.168078.
42、778334.8511820.0002R-squared0.930033 Mean dependent var61630.51Adjusted R-squared0.921287 S.D. dependent var73271.99S.E. of regression20557.06 Akaike info criterion22.84374Sum squared resid6.76E+09 Schwarz criterion22.99286Log likelihood-214.0155 F-statistic106.3395Durbin-Watson stat1.627477 Prob(F-
43、statistic)0.000000Y-0.9333*Y(-1) = -51055.44688 + 66.53070046*(X1-0.9333*X1(-1) + (9052.520)(9.443438)382.1680346*(X4-0.9333*X4(-1)(78.77833)t = (-5.639916) (7.045178) (4.851182)Adjusted R-squared=0.921287 F=106.33951.627477经过广义差分后,样本容量减少了一个,n=19查显著水平的统计表可知dL=1.074. dU=1.536。由于1.627477dU=1.536,所以,现在
44、此模型已无自相关不必再进行迭代同时可见,可决系数R2,统计量也均达到了理想水平六、模型的分析及结论进行一系列检验和修正后得最终结果:Y = -51055.44688 + 66.53070046*X1 + 382.1680346*X4(9052.520)(9.443438)(78.77833)t = (-5.639916) (7.045178) (4.851182)Adjusted R-squared=0.921287 F=106.33951.627477从模型中可看出:模型表明:在校研究生总数仅与高校总数和人均GDP有明显的相关关系X1、X4是符合经济意义的检验的。因为从经济意义上讲,在校研究生总数随人均GDP的增加而增加,随高校总数的增加而增加。且高校总数是影响在校研究生总数的最重要的因素。模型的修正可决系数及F值均很高,模型的拟合优度不错。模型可能存在的问题:从模型可以看出在校研究生总数X2 人口总数, X3 失业人口数没有明显的相关关系;这一点值得我怀疑,但是由于时间问题,在此没有能把这个问题搞清楚,我下来之后会找出这个问题的真正原因。我通过了计量中所讲的步骤去做了,但是为什么结果却与实际情况有这样大的差距呢?希望老师给些建议。参考文献:中国统计年鉴2004
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。