现代地理学中的数学方法9课件

上传人:痛*** 文档编号:232567202 上传时间:2023-09-21 格式:PPT 页数:45 大小:1.78MB
收藏 版权申诉 举报 下载
现代地理学中的数学方法9课件_第1页
第1页 / 共45页
现代地理学中的数学方法9课件_第2页
第2页 / 共45页
现代地理学中的数学方法9课件_第3页
第3页 / 共45页
资源描述:

《现代地理学中的数学方法9课件》由会员分享,可在线阅读,更多相关《现代地理学中的数学方法9课件(45页珍藏版)》请在装配图网上搜索。

1、第2节 空间计量模型空间滞后与空间误差模型地理加权回归模型应用实例:研发与创新的空间计量模型空间计量模型的基本思想,是引入区域间的相互关系,通过空间权重矩阵W,对线性回归模型进行修正。空间计量模型有很多种。本节主要探讨空间滞后模型(SLM)与空间误差模型(SEM),以及空间变系数回归模型地理加权回归模型(GWR)及其应用问题。空间滞后模型(spatiallagmodel,SLM),主要是用于研究相邻机构或地区的行为对整个系统内其它机构或地区的行为存在影响的情况。该模型的数学表达式为:式中:y为因变量;X为阶的外生解释变量矩阵;W是阶的空间权重矩阵,即n个地区之间相互关系结构矩阵;为空间滞后因变

2、量;是空间自回归系数,反映了样本观测值中的空间依赖作用,即相邻区域的观测值对本地区观测值y的影响方向和程度;为X的参数向量;为白噪声。一、空间滞后与空间误差模型一、空间滞后与空间误差模型 (一)空间滞后模型(6.2.1)(二)空间误差模型(二)空间误差模型 在空间误差模型(SEM)中,机构或地区间的相互关系通过误差项来体现。当机构或地区间的相互作用因所处的相对位置不同而存在差异时,则需要采用这种模型。空间误差模型(SEM)的数学表达式为:式中,为随机误差项向量,为 的的截面因变量向量的空间误差系数,为正态分布的随机误差向量。(6.2.2)参数衡量了样本观察值中的空间依赖作用,即相邻地区的观察值

3、y对本地区观察值y的影响方向和程度,参数反映了自变量X对因变量y的影响。SEM的空间依赖作用存在于扰动误差项之中,度量了邻接地区关于因变量的误差冲击对本地区观察值的影响程度。(三)估计技术(三)估计技术n空间滞后模型空间滞后模型的估计过程如下的估计过程如下:对模型作OLS估计;对模型作OLS估计;分别计算上述两个OLS估计的残差和;由和值,通过极大化集中对数似然函数得到的参数的估计值;由值计算其余参数估计值,极大对数似然函数如果SLM模型设定正确,那么解释变量在重复抽样过程中的变动将会导致OLS估计产生有偏且不一致的结果。n空间空间误差误差模型模型的估计过程如下的估计过程如下:对模型进行OLS

4、估计,得到的无偏估计值;计算OLS估计的残差为;由值,通过对数极大似然函数得到参数的估计值;由计算其余参数的估计值,极大对数似然函数如果SEM模型设定正确,那么误差项的空间依赖将会导致OLS估计产生无偏但不一致的结果。判断地区间经济行为的空间相关性是否存在,一般通过包括 Morans I 检验、两个拉格朗日乘数(Lagrange Multiplier)形式的LMERR、LMLAG和稳健(Robust)的R-LMERR、R-LMLAG等来进行。由于事先无法根据先验经验推断在SLM和SEM模型中是否存在空间依赖性,有必要构建一种判别准则判别准则,以决定哪种空间模型更加符合客观实际。(四)空间自相关

5、检验与(四)空间自相关检验与SLMSLM、SEMSEM的选择的选择Anselin,etal.(2004)提出了如下判别准则判别准则:如果在空间依赖性的检验中发现,LMLAG较之LMERR在统计上更加显著,且R-LMLAG显著而R-LMERR不显著,则可以断定适合的模型是空间滞后空间滞后模型模型;相反,如果LMERR比LMLAG在统计上更加显著,且R-LMERR显著而R-LMLAG不显著,则可以断定空间误差模型空间误差模型是恰当的模型。除了拟合优度R2检验以外,常用的检验准则还有:自然对数似然函数值(LogL),似然比率(LR)、赤池信息准则(AIC),施瓦茨准则(SC)。对数似然值的越大,似然

6、率越小,AIC和SC值越小,模型拟合效果越好。这几个指标也用来比较OLS估计的经典线性回归模型和SLM、SEM,似然值的自然对数最大的模型最好。二、地理加权回归模型二、地理加权回归模型当用横截面数据建立计量经济模型时,由于这种数据在空间上表现出的复杂性、自相关性和变异性,使得解释变量对被解释变量的影响在不同区域之间可能是不同的。假定区域之间的经济行为在空间上具有异质性的差异可能更加符合现实,空间变系数回归模型中的地理加权回归模型(GWR)是一种解决这种问题的有效方法。n全域线性回归模型全域线性回归模型假定我们有、的系列解释变量观测值及系列被解释变量,经典的全域(Global)线性回归模型为:式

7、中:是整个回归模型的随机误差项,满足球形扰动假设;回归系数被假定是一个常数。模型参数的估计一般采用普通最小二乘(OLS)法。(6.2.3)nGWRGWR模型模型地理加权回归模型是一种相对简单的回归估计技术,它扩展了普通线性回归模型(6.2.3)式。在扩展的GWR模型中,特定区位i 的回归系数不再是利用全部信息获得的假定常数,而是利用邻近观测值的子样本数据信息进行局域(Local)回归估计而得的、随着空间上局部地理位置i 变化而变化的变数。GWR模型可以表示为:式中:系数的下标表示与观测值联系的阶待估计参数向量,是关于地理位置的元函数。(6.2.4)n估计函数估计函数GWR可以对每个观测值估计出

8、k个参数向量的估计值,是第i个区域的随机误差,满足零均值、同方差、相互独立等球形扰动假定。实际上,模型(6.2.4)可表示为在每个区域都有一个对应的估计函数,其对数似然函数可以表示为:式中:为常数,。(6.2.5)实际研究中常用的空间距离权值计算公式有3种:高斯距离权值(Gaussiandistance)指数距离权值(exponentialdistance)三次方距离权值(tricubedistance)在以上3个公式中,为第i个区域与第j个区域间的地理位置距离,为标准正态分布密度函数,q为观测值i到第q个最近邻居之间的距离,为距离向量的标准差,为衰减参数(窗宽)。在空间权值矩阵中,d和非常关

9、键。如果d较大,则局域模型的解越趋向于全域模型的解;如果d等于所研究空间任意两点间的最大距离,则全域和局域两个模型将相等,反之则相反。若趋于无穷大,任意两点的权重将趋于1,则被估计的参数变成一致时,GWR就等于以OLS估计的经典线性回归;反之,当带宽变得很小时,参数估计将更加依赖于邻近的观测值。三、应用实例:研发与创新的空间计量模型三、应用实例:研发与创新的空间计量模型 为检验研发与创新的空间效应,建立双对数线性的知识生产函数模型如下:式中:被解释变量为十万人专利授权数(I),代表专利创新产出;以大学(U)、企业(E)研发投入占GDP的比例为解释变量;为回归参数,i代表以省域为单元的空间样本(

10、),为随机误差项。模型实证分析所用的数据样本数据样本,包括了中国大陆地区31个省(自治区、直辖市,简称为省域),数据来源于20012004年的中国统计年鉴,而创新投入则来源于2001年的中国统计年鉴。建模的目的目的,是检验大学、企业与区域创新产出活动的相互关系和决定因素,尤其是通过合适的估计方法考察省域创新产出的决定因素和局域溢出效应。一般来说,创新从投入到产出需要经过一定时期的滞后。为了验证创新投入产出的滞后性假设,以2000年、2001年、2002年、2003年的lnI分别为被解释变量,以2000年的lnU、lnE分别作为解释变量。原始如表6.2.1所示。省(市、区)lnIlnUlnEEa

11、stNorth北京3.79754.25405.274240.2454116.4612天津2.89832.82064.606239.4110117.3670河北1.60511.83183.555639.3319116.6502山西1.04221.31633.687037.6339112.3684内蒙古1.04880.65122.669145.3714118.6004辽宁2.38211.65034.076341.0984122.3033吉林1.71981.70423.675143.5791126.4700黑龙江1.69801.79203.464448.4869127.9865上海3.71842.7

12、9274.529731.2719121.3750江苏2.33121.97164.117334.5834119.2828浙江3.11571.70743.760829.1651120.4278安徽0.80602.54333.481532.0130117.2704福建2.44611.24703.801525.9394118.1813江西0.90530.50383.225927.2826116.0300山东2.08320.59573.964136.3235118.7490表 6.2.1 建模数据准备注:表中East表示经度,North表示纬度。省(市、区)lnIlnUlnEEastNorth河南0.9

13、9110.17503.426433.8764113.4785湖北1.30542.32233.785731.1431112.2643湖南1.26432.09543.578527.3794111.5150广东3.36601.33344.590322.8704113.4299广西0.78201.52253.391723.6987108.2706海南0.9075-1.57812.020119.1595109.8278重庆1.73482.24073.654930.1855107.7399四川1.36702.11223.542330.1869102.9485贵州0.47180.05623.548626.9

14、189106.5654云南0.95681.02082.661925.1822101.8580西藏-1.33881.4722-2.058131.667688.7492陕西1.42263.28364.734235.6432109.5561甘肃0.42601.26273.537337.6833102.8971青海0.47420.68903.503435.427796.2286宁夏1.32870.29873.953037.3259105.9582新疆1.1913-0.37262.728341.747284.9648表 6.2.1 建模数据准备(续)注:表中East表示经度,North表示纬度。首先检测

15、2002年中国大陆地区31个省级行政区创新产出在地理空间上的相关性即空间相互依赖性。根据表1中的数据计算得到专利产出的Moran指数为0.360 0,其正态统计量Z值大于正态分布函数在0.002 0水平下的临界值,表明中国31个省、直辖市和自治区的专利数在空间分布上具有正正的的自自相相关关性性,说明全国各省域创新的空间分布并非表现出完全随机状态,而是表现出相似值之间的空间集群相似值之间的空间集群(clustering)。(一)空间自相关性检验(一)空间自相关性检验 因此,从整体上讲,省域之间的创新是存在空间相关性的,也就是说存在着空间上明显的集群现象。因此,有必要在使用空间计量经济模型进行估计

16、。(二)空间计量估计与分析(二)空间计量估计与分析 空间相关分析已经定量证明了中国大陆地区省级行政区创新产出具有空间相关性,需要采用空间计量经济模型进行估计。为此,以下的思路是:以中国大陆31个省级行政区为空间单元,进行省级行政区创新的空间计量经济检验和估计。为了比较,先进行OLS估计。首先进行普通最小二乘(OLS)法的估计,以及通过Moran指数检验、两个拉格朗日乘数来判断空间计量经济学模型SLM和SEM的形式,利用极大似然法(ML)估计参数,利用Anselin(2004)的空间计量经济学软件GeoDa 0.9.5-I计算,结果如表6.2.2所示。表 6.2.2 OLS估计结果模型回归系数标

17、准差统计值小概率值C-0.7795*0.3998-1.94960.0613U0.17920.12561.42620.1649E0.5926*0.11815.01880.00000.58520.5556F19.7496*0.0000LogL-32.3352AIC70.6704SC74.9724空间依赖性检验MI/DF统计值小概率PMoransI(error)0.2778*2.80460.0050LMLAG13.9817*0.0460R-LMLAG10.14300.7054LMERR15.1085*0.0238R-LMERR11.26970.2598注:*、*、*分别表示通过10%、5%、1%水平

18、下的显著性检验。由表6.2.2中结果可知,OLS估计的31个省级行政区创新函数的拟合优度达到55.56,F值为19.749 6,模型整体上通过了1水平的显著性检验。由于前述的空间统计的Moran指数检验已经证明了31个省级行政区的创新产出之间具有明显的空间自相关性,这说明忽视空间自相关性直接采用OLS法建立模型进行估计分析存在一定问题,出现这种问题的原因可能有两个:一是遗漏了重要的变量,二是模型设定有问题,如未能考虑截面单元(省域)之间的空间相关性。为了进一步验证空间自相关性的存在,由表6.2.2中的Moran指数检验、两个拉格朗日乘数的空间依赖性检验结果显示:Morans I(error)检

19、验表明经典回归误差的空间依赖性(相关性)非常明显(显著性水平为0.1)。同时为区分是内生的空间滞后还是空间误差自相关,根据前面介绍的判别准则,拉格朗日乘子误差和滞后及其稳健性检验表明,LMLAG通过了4.60水平下的显著性检验,LMERR通过了2.38水平下的显著性检验,而R-LMERR、R-LMLAG均未能通过10水平下的显著性检验。比较SLM和SEM模型对数似然函数值LogL、AIC和SC值、LogL、LR,相对而言,SEM模型相对更好一些。当然,这种判断不是特别严格,为此给出了SLM和SEM的估计结果见表6.2.3。表 6.2.3 SLM和SEM估计结果注:*、*、*分别表示通过10%、

20、5%、1%水平下的显著性检验。变量Std.Et 统计值P值Std.Et统计值P值C-0.9607*-2.54810.37700.0108-0.41870.3991-1.04920.2941U0.07180.61090.11760.54130.10520.10361.01550.3099E0.5470*0.10695.11550.00000.5627*0.09815.73530.0000/0.3518*0.17382.02390.04300.5686*0.17143.31860.0009统计检验DF统计值P值DF统计值P值0.64260.6840LogL-30.4866-29.4660LR13.

21、6971*0.054515.7383*0.0166AIC68.973364.9321SC74.709269.2340 比较表6.2.2和表6.2.3中的检验结果发现,空间滞后模型和空间误差模型的拟合优度检验值均高于OLS模型,由于采用ML法估计参数,基于残差平方和分解的拟合优度检验的意义不是很大。为此,比较对数似然函数值LogL,发现SEM的LogL值(-29.466 0)最大,极大似然比率通过了5水平的显著性检验,而AIC和SC值最小,因此SEM模型均比OLS和SLM估计的模型要好。由此可见,基于OLS法的经典线性回归模型由于遗漏了空间误差自相关性而设定的模型不够恰当。这也验证了这样的观点:

22、省域之间的创新产出都不可能没有关系。以往的研究大多假定地区之间相互独立,导致了基于OLS法估计结果及推论可能不够可靠,需要通过引入空间差异性和空间依赖性对经典的线性模型进行修正。由于OLS、SLM和SEM模型均为全域(global)估计,这些模型给出的回归系数在整体上被假定为一个常数,无法揭示局域(local)各个省域的因素对局域创新产出的影响。为了解决解决这个问题,基于地理加权回归模型,采用LeSage(1998)的计算程序,运用加权最小二乘法(WLS)来进行局域估计。以高斯(Gaussian)、指数(exponential)和三次方(tricube)距离为权值,估计GWR模型的参数估计值。

23、其中,高斯距离权值和指数距离权值的衰减参数(窗宽)为1.189 3和4.472 1,三次方距离权值的q最邻近邻居为10。图6.2.1给出了高斯、指数和三次方距离为权值的GWR模型的参数估计值。图6.2.1 Gaussian、exponential和tricube 距离权值的GWR参数估计值 在高斯距离估计的GWR模型中,调整后的 =0.728 2,高 于 全 域 估 计 值 OLS、SLM、SEM(0.555 6、0.642 6、0.684 0)。这表明考虑了地理空间位置的地理加权回归模型的整体拟合效果要优于OLS、SLM、SEM全域估计模型,假定回归系数固定不变是不完全符合空间和地理邻近性发

24、挥作用的区域创新实践的。即中国大陆地区31个省域的创新产出能力在空间上具有异质性的差异。R2省(市、区)CtUtEt北京2.08202.64820.09670.65600.97043.9841天津2.12072.67860.08520.57380.98994.0387河北2.12162.66980.08760.59090.98584.0126山西2.18742.62220.09240.64130.96943.8177内蒙古1.91322.60310.12310.84360.92473.9799辽宁2.12972.74950.07590.50571.01234.1779吉林2.10222.788

25、70.07700.51371.01264.2556黑龙江1.98632.77400.09660.65460.97574.2567上海2.53072.93110.01460.09341.16224.3697江苏2.40162.84620.02370.15431.10114.2382浙江2.50672.90240.02890.18451.16184.3675安徽2.44442.83900.00220.01431.11644.2301福建2.32052.77580.04290.27781.11564.3164江西2.20172.67950.02130.14001.06444.2019山东2.3193

26、2.79970.04400.28941.06714.1773表 6.2.4 基于高斯距离权值的GWR估计结果省(市、区)CtUtEt河南2.32302.71150.03950.26631.04183.9978湖北2.07802.53970.03240.22250.97793.9226湖南1.68392.31090.02640.18610.88263.9349广东1.69782.36620.01480.10280.92294.1274广西1.10041.95460.05490.42390.70634.0588海南1.20202.04580.00740.05620.76984.1735重庆1.23

27、431.99570.10750.83510.69263.6981四川0.77611.97970.15761.39740.52294.5640贵州0.98921.88880.09620.77040.63984.0121云南0.68781.88850.11391.00870.53354.9463西藏0.55062.71560.10971.11540.46028.8541陕西1.83642.34330.12050.89540.83843.5616甘肃0.92552.28290.22892.18080.50054.3172青海0.67042.76080.17341.71830.45747.1339宁夏

28、1.23972.09130.20261.75200.61143.5020新疆0.44722.48450.04050.44200.45029.4281表 6.2.4 基于高斯距离权值的GWR估计结果(续)表6.2.4给出了31个省级行政区以高斯距离估计的局域回归系数估计值,结果显示:整体来看,在影响中国大陆地区31个省级行政区创新产出的因素中,U未能通过5水平的变量显著性检验,表明大学研发对区域创新产出虽然具有正的贡献但不明显;所有省级行政区的企业研发变量均通过了5水平下的变量显著性检验,其中上海、浙江、安徽、福建、江苏、山东、江西、河南、吉林、辽宁、天津、河北等东中部地区的研发投入对创新的贡献更大,其弹性系数基本上在1以上。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!