高维面板数据降维与变量选择方法研究

上传人：h****4 文档编号：203731117 上传时间：2023-04-25 格式：DOC 页数：21 大小：390KB

收藏版权申诉举报下载

第1页 / 共21页

第2页 / 共21页

第3页 / 共21页

下载文档到电脑，查找使用更方便

15 积分

下载资源

资源描述：

《高维面板数据降维与变量选择方法研究》由会员分享，可在线阅读，更多相关《高维面板数据降维与变量选择方法研究（21页珍藏版）》请在装配图网上搜索。

1、高维面板数据降维与变量选择方法探讨张波方国斌2012-12-14 14:35:56来源：统计与信息论坛(西安)2012年6期第2128页内容提要：从介绍高维面板数据的一般特征入手，在总结高维面板数据在实际应用中所表现出的各种不同类型及其探讨理论与方法的同时，主要介绍高维面板数据因子模型和混合效应模型；对混合效应模型随机效应和边际效应中的高维协方差矩阵以及经济数据中出现的多指标大维数据的探讨进展进行述评；针对高维面板数据将来的发展方向、理论与应用中尚待解决的一些关键问题进行分析与展望。关键词：高维面板数据降维变量选择作者简介：张波，中国人民高校统计学院（北京100872）；方国斌，中国人

2、民高校统计学院，安徽财经高校统计与应用数学学院（安徽蚌埠233030）。一、引言在社会现象观测和科学试验过程中常常会产生面板数据。这类数据通过对多个个体在不同时间点上进行重复测度，得到每个个体在不同样本点上的多重观测值，形成时间序列和横截面相结合的数据，也就是所谓的“面板数据”。由于应用背景的不同，面板数据有时也称作纵向数据（longitudinal data）。面板数据广泛产生于经济学、管理学、生物学、心理学、健康科学等诸多领域。随着信息技术的高速发展，数据采集、存储和处理实力不断提高，所谓的高维数据分析问题不断涌现。对于多元统计分析而言，高维问题一般指如下两种情形：一种是变量个数p较大而样

3、本量n相对较小，例如药物试验中有成千上万个观测指标而可用于试验观测的病人个数较少；另一种是变量个数户不大但是样本个数n较多，例如一项全国调查牵涉到大量的调查对象，而观测指标个数相对较少。面板数据高维问题较多元（时序）高维问题更为困难，因为面板数据至少包括两个维度：时间和横截面。在实际应用中，不同个体在不同时间进行观测时可以获得多个指标值。为了以下论述的便利，用p表示指标个数，T表示观测期长度，N表示个体（individual）或主题（subject）个数。数理统计中所提到的高维（大维）问题，通常是指个体数N、时期长度T或指标个数p这三个变量中的一个或多个可以趋向于无穷。详细应用中，只要N、T和

4、p中有一个或多个大于某个给定的临界值，都称为高维问题。本文主要探讨两种基本类型的高维面板问题：一类为面板数据分析中说明变量个数p特别多，超过个体数N和时期数T，比如零售商业网点成千上万种商品扫描数据，央行和国家统计部门得到的多个指标在不同个体宏观经济观测数据等；另一类是混合效应模型中随机效应和固定效应设定时方差协方差矩阵所需确定的参数个数较多，某些参数的值趋向于零，要对方差协方差矩阵进行变量选择，此时针对固定效应和随机效应可以采纳不同的变量选择策略。二、高维面板数据因子模型大型数据集构成的社会经济面板的特点是具有成百上千个观测指标，也就是具有所谓的高维特征。由于这种特征的存在，采纳经典统计计量

5、分析方法很难进行处理。因子模型（factor model）不仅可以有效降低数据的维度，而且可以充分体现面板数据内部的序列相依性和截面相依性，因此可以针对不同的应用领域建立相应的因子模型对高维面板数据进行分析。例如构建套利定价模型时，将多个证券的投资组合用公因子表示，进行收益率预料；探讨经济周期变动，尤其是重大事务对经济发展影响时，将各经济体的产出指标用几个公因子表示，用因子模型分析各经济体同步变动状况以及重大事务对各经济体的冲击大小，等等。面板数据因子模型是对说明变量或者误差成分项进行因子分解后所建立的模型。实际应用中，当模型中说明变量的个数较多，例如p大于N，就可以对说明变量进行因子分解，用

6、少数几个公因子和与之对应的因子载荷表示大量说明变量，从而起到降维的效果。对误差成分进行因子分解主要是为了体现个体或时间的共同趋势和交互效应，其中因子分解的方法一般采纳多元统计分析中的主成分法，为了进一步探讨的须要，有时候还要采纳极大似然法或者回来法计算因子得分，并将因子得分代入模型进行估计。因子模型中采纳较广泛的是动态因子模型（dynamic factor model），这主要是因为动态因子模型能够较好体现变量前后时期之间的相关性，便于进行外推预料，体现序列的内在结构。面板数据动态因子模型的一般形式如下：动态因子模型在对说明变量（协变量）进行降维的同时，尽可能用较少公因子体现说明变量的大部分信

7、息。对于社会经济现象中大量存在的高维面板数据而言，动态因子模型供应了高维问题降维的一种思路。相比较其他统计建模方法而言，动态因子模型充分考虑到横截面相关和序列相关对面板数据建模的影响，正确揭示了面板数据内部相依特征，能够更加合理地说明某些社会经济现象的改变规律。在动态因子模型估计和检验过程中，通过对统计量的渐近性和协方差矩阵的结构特征进行探讨，推动了诸如随机矩阵理论、谱分解理论、高维变量选择等理论的进一步发展。近年来，动态因子模型已渐渐运用于大型宏观数据集的分析中。探讨者分别从动态因子模型形式的设定、协方差结构和潜在因子的估计等方面进行了理论探讨，同时相关的应用探讨也正在逐步绽开。（一）动态因

8、子模型的设定和估计高维面板数据集普遍存在序列相关和（弱）截面相关，Stock和Watson提出在因子模型中加入观测变量的滞后项进行前向预料，从而充分考虑时间序列的相关性（动态性）1。他们在时齐因子模型的基础上采纳时变因子载荷刻画序列和截面相依。在对美国联邦储备委员会工业产品指数的预料中，该模型与自回来模型（AR）和向量自回来模型（VAR）相比预料误差（MSE）相对较小。Stock和Watson进一步将VAR和动态因子模型相结合，运用这种近似因子模型探讨货币政策冲击对宏观经济的影响，探讨动态因子个数估计和VAR基础上的因子约束检验问题2；Pesaran和Chudik在无限维向量自回来模型中采纳动

9、态因子，以体现具有显著效果的某个变量或截面单元对当期和滞后期其他变量的影响3；Song、Hrdle、Ritov考虑到时间序列中往往存在非平稳性和可能的周期性，提出了一种两步估计方法4：第一步，采纳分组LASSO（最小肯定收缩和选择算子）类型的技术选择时间基函数，运用平滑函数主成分分析选择空间基函数；其次步，运用动态因子模型获得一个去除趋势（又称退势）的低维随机过程，并将这种广义动态半参数因子模型应用于气温、核磁共振和隐含波动面数据的分析中。动态因子载荷的估计也得到了进一步的探讨。Forni等人提出了一种两阶段“广义主成分”估计方法，第一步估计公共成分的协方差，其次步确定主成分分析的权重，这种分

10、析放宽了对特性因子的结构约束5；Deistler和Zinner探讨了广义线性动态因子模型的结构特征，包括可识别性，模型估计等一系列问题6；因子载荷阵用随机游走表示明显缺乏实际证据，Banerjee和Marcellino探讨表明运用因子载荷中的时间变动进行预料效果较差，尤其是小样本情形7；传统的假设要求特性因子的结构为对角矩阵，然而由于因子载荷中可能存在结构突变，这一条件很难得到满意，Breitung和Eickmeier提出构造LR、LM和Wald统计量对静态和动态因子模型结构突变进行检验，并将其运用于美国和欧元区国家经济增长模式转变的探讨8。因子个数的选择是因子分析必需考虑的问题之一。在高维动

11、态因子模型中，因子个数的选择可以不依靠于困难的协方差矩阵；Bai和Ng提出了高维面板数据选择因子个数的一种准则，这种准则考虑由因子模型的类型来确定因子个数，而不是采纳数据驱动的方法9；Hallin和Liska运用谱密度矩阵的特征值识别广义动态因子模型的因子个数10；动态因子模型不仅要确定因子个数，还要确定说明变量的滞后阶数，Harding和Nair对传统的碎石图（scree plot）方法予以了推广，并运用随机矩阵理论和Stieltjes变换对特征值的分布进行分析，得出了基于矩的因子个数和滞后阶数的一样估计方法11。高维面板数据分析中，因子个数的多少确定了最终维数的大小，同时也确定了因子模型说

12、明实力的大小。在尽量削减原有信息损失的同时，选择合理的公因子个数将是一个长期探讨的问题。（二）因子载荷阵协方差结构和潜在因子估计在金融学的套利定价理论中，多因子模型可以用于削减维度和估计协方差矩阵。好的协方差矩阵估计量可以避开过度放大估计误差，协方差矩阵的最小和最大特征值对应于证券投资组合的微小和极大的方差，协方差矩阵的特征向量可用于优化投资组合。应用因子模型的协方差矩阵在进行证券投资组合选择时，所包含的统计含义和实际意义比较明显，而估计高维协方差矩阵则相对比较困难，Fan、Fan、Lv探讨了高维因子模型的维数对协方差矩阵估计的影响，并通过对样本协方差矩阵估计和基于因子模型估计进行比较，得出了

13、协方差矩阵的逆矩阵更有利于揭示因子结构的结论12；由于投资组合的优化配置和投资组合方差的削减都与协方差矩阵的逆矩阵有关，因此在优化投资组合配置中探讨因子结构具有重要意义，但其风险评价效果欠佳，Hautsch和Kyj基于已实现协方差多重标度谱分解（Multi-scale spetral decomposition）分析高维动态协方差，将该原理运用于标准普尔500股票全局最小方差（GMV）投资组合的构建，检验基于协方差矩阵的投资组合样本外预料的效果13。协方差矩阵结构的探讨目前主要运用于投资组合的构建，已有探讨主要从协方差矩阵的特征根和特征向量以及协方差矩阵的逆矩阵动身，而对于高维情形，协方差矩阵

14、的估计受维度影响。潜在因子（latent factor），又称隐性因子或公因子，潜在因子的估计主要是指因子载荷矩阵的估计。一般通过对说明变量（协变量）的NN阶非负定矩阵的特征分析进行因子载荷矩阵和因子过程的估计。说明变量的个数（N）和时期长度（T）之间长度往往不一样，对于高维数据而言，假如NT，可以采纳Bai提出的最小二乘法进行潜在因子的估计14；对于合适的变量个数N和非平稳因子估计，Pan和Yao通过求解几个非线性规划问题来解决15；Lam，Yao、Bathia探讨表明：当全部因子都比较强大并且因子载荷矩阵每一列的范数都是N的1/2次方阶数时，因子载荷矩阵估计的弱一样范数与N的收敛比率独立，

15、并运用这种估计方法进行了三支股票的隐含波动面建模分析16。潜在因子的估计主要基于因子载荷矩阵的分析。由于潜在因子既代表说明变量的共同行为，又是因子模型分析基础，高维数据分析中潜在因子的估计方法将确定协方差矩阵结构特征的刻画。三、高维面板数据内部相依性的刻画面板数据内部相依包括序列相依和截面相依。高维面板数据分析中，横截面相依对模型的估计和检验影响较大。近年来，截面相依的处理渐渐得到重视，包括相依类型刻画和度量等。由于序列相依和横截面相依常常同时出现，所以在探讨横截面相关时通常也会考虑序列相依。在空间相依存在的状况下，也就是存在个体的异质性，处理这种相依性的一般方法就是进行空间加权和引入空间滞后

16、算子建立空间滞后模型。假设对如下简洁的混合回来模型进行估计：y=X+（3）其中y是NT1向量，X是NTK矩阵，是K1向量，是NT1向量。在考虑横截面相依的条件下，各个个体的相依关系通过空间加权矩阵来表示。依据相依结构的不同，空间相依又可以分成两类：第一类是说明变量的个体相依，称之为空间滞后模型；其次类是误差项的空间相依，称之为空间误差模型。（一）空间权重的设定空间权重的设定是空间经济学中的一个重要问题，一般空间权重都是预先设定的。计量经济分析中，空间权重可采纳经济距离表示，也可采纳分块权重（block weights），例如将中国一个省内的多个地区各看做一个分块。Anselin提出一种空间滞后

17、模型，或称混合空间自回来模型17，其特点是在模型的右端项设置一个空间滞后说明变量，虽然这种方法针对的是截面情形，但是通过堆栈（stacked）的方法很简洁运用于面板建模，即用如下模型：空间滞后模型在一些社会或空间交互效应的文献中得到应用。Brueckner分别将其运用于空间反应函数（spatial reaction function）和社会乘子（social multiplier）的参数估计当中18；Anselin进一步提出所谓的空间乘子（spatial multiplier），并将其用于空间体系中设定被说明变量为说明变量和随机误差项的函数19。（二）空间误差模型与空间滞后模型相比，空间误差模

18、型并不要求建立一个空间交互作用的理论模型，而是考虑非球形误差项协方差矩阵。空间误差模型除了干脆表示协方差结构以外，还可以采纳空间误差过程、空间误差成分和公因子（common factors，或称共同因子）模型，其中公因子模型是当前正在发展的一种主流方法，尤其适用于高维面板数据的分析。空间误差模型运用加权矩阵来表示相对位置和近邻程度，模型中相邻关系的设定不同于协方差矩阵的空间相依范围的设定。通过对模型误差项结构的分析，Anselin、Bera和Anselin提出了两种常用的空间误差模型：空间自回来（SAR）模型和空间移动平均（SMA）模型。这两种模型分别运用于探讨误差项存在横截面误差自相关和共同

19、变动情形19-20。空间误差成分模型（SEC）由Kelejian和Robinson提出，与SAR和SMA不同，SEC的误差项被分解成局部效应（local effect）和溢出效应（spillover effect）两部分21。在异质性面板的误差成分模型中，时间成分被表示成不行观测的共同效应或因子（factor），它包含了全部的横截面单元。与标准的误差成分不同的是，每一个横截面单元在这个因子上有不同的因子载荷。最简洁的形式是所谓的单因子结构，这时误差项可以表示为：四、高维面板数据混合效应模型的变量选择（一）面板数据混合效应模型混合效应模型是面板数据探讨中最重要的模型之一，该类模型的探讨已比较充分

20、22。此类模型包括线性和非线性参数混合效应模型、半（非）参数混合效应模型、广义线性混合效应模型。线性和非线性参数混合效应模型是两种参数混合效应模型，从贝叶斯的角度看，这两种模型分别是分层线性和非线性模型。线性混合效应模型是指响应（被说明）变量和协变量（说明变量）为线性关系，线性混合效应模型（LME）一般可表示为：非线性混合效应模型（NLME）中响应变量和协变量是非线性形式，模型中非线性函数已知，只有非参数是未知的。分层非线性模型或NLME模型的一般形式可表示为2260-61：面板探讨中，通常认为来自不同个体的数据相互独立，而来自同一个体的数据是相关的，这种相关可能是由于个体问的异质性，也可能是

21、由于测度误差的序列相关所致，而忽视这些相关性可能导致估计结果并非有效。面板分析的核心问题就是选择合适的模型和正确估计方差协方差成分的方法，这也是面板数据分析与其他类型的数据分析都面临的主要问题。选择线性模型还是选择非线性模型，主要依据响应变量和协变量之间的关系，并须要依据不同的应用背景以及图形的直观说明，假如假定响应变量和协变量之间没有任何非线性关系，就可以采纳非参数方法进行探讨。在估计混合效应模型随机效应和固定效应方差协方差成分的时候，由于待估参数较多，所以有时须要进行变量选择，相对而言固定效应变量选择比较直观，随机效应变量选择难度稍大，因为其方差结构较为困难。Chen和Dunson提出了采

22、纳分层贝叶斯模型识别0方差的随机效应，通过再参数化混合模型使得随机效应分布的协方差参数函数与回来系数结合成标准正态潜变量，以选择随机效应方差的混合先验进行多个随机效应的变量选择23；Vaida和Blanehard提出了采纳条件赤池信息准则（cAIC）对混合效应模型进行变量选择的方法24；显著的随机效应选择依靠于协方差选择策略，Dziak等人对纵向数据的变量选择方法进行了综述25。（二）高维面板混合效应模型的变量选择面板数据分析中常常存在许多变量，这些潜在的预料子（potential predictors）个数可能很大，尤其是为了削减可能的建模偏差而引入非线性项和协变量的交互效应时。事实上通常在

23、模型中包含着一个重要变量的子集，也就是所谓的最优子集（best subset），它能够增加模型的可预料性，并且能够使得模型更加精简，变量选择的终极目标也就是找到这个最优子集。线性回来模型中存在许多子集选择准则，一些传统的变量选择方法（如Mallows信息准则（Cp）、赤池信息准则（AIC）、舒瓦茨信息准则（BIC）也已推广到面板数据中，而更多的Liang和Zeger提出了一种广义估计方程（GEE）的方法对聚类（clustered）或面板数据拟合回来模型，响应变量可以是连续的或离散的28，可将这种方法视为拟似然（quasi-likelihood）的一种推广，是一种伪似然（Pseudo-likel

24、ihood）方法。GEE不用假定变量的分布，克服了似然函数不能表示的问题，并且不须要方差独立假设，这些与传统的变量选择方法（比如Cp，AIC和BIC等）有很大区分，可运用交叉验证（CV）方法选择较小的广义残差平方和（GRSS）或者期望预报偏差（EPB）。SCAD和LASSO与GEE相结合，得出惩处广义估计方程（PGEE），Fu探讨了Lq惩处的PGEE的渐近性质以及详细实现，并建议采纳广义交叉验证（GCV）选择正则化参数29。混合效应模型中方差选择问题的探讨文献相对较少，大多数变量过程采纳参数或半参数方法探讨（不）具有随机效应或不行观测的数据。但是，这些过程主要用来选择显著的固定效应，与之不同的

25、是Bondell，Krishna、Ghosh的工作，他们考虑了线性混合效应的选择30；Ibrahim等人运用了一种新奇的再参数化方法，将混合效应的选择看做模型中具有许多缺失数据的分组变量选择，其中的缺失数据代表随机效应31；Ni等人提出了面板数据半参数混合模型中同时进行变量选择和模型估计的双惩处似然方法，这种方法将两种惩处相结合，考虑在一般对数似然上加入两类惩处：非参数基线函数的粗糙性惩处和获得模型稀疏性线性系数的非凹收缩惩处，Ni等人认为这种方法可以对缺失数据进行正确推断，假如模型设置正确，这种推断更为有效，而且易于计算32。五、探讨展望高维数据变量选择探讨的主要问题是说明变量的个数较多，超

26、过（甚至远大于）个体数情形。对于面板数据而言，这些协变量有可能是实际观测到的说明变量，也可能是模型设定过程中产生的成分（component）变量，例如随机效应成分和固定效应成分。针对这两种不怜悯形，主要采纳高维因子模型和混合效应模型的变量选择方法在此主要探讨高维面板数据分析和混合效应模型的变量选择问题。高维数据变量选择方法还在不断发展，半参数、贝叶斯统计等方法论已经广泛运用于这类问题中。从生物学和医学角度开展的探讨较多，因为大量变量和参数中存在所谓的稀疏性（sparsity），所以变量选择方法很适合于对这类问题的处理。无论是现有的哪种变量选择方法，都很难做到既不损失原有信息，又能正确地决策推断

27、。社会经济应用中，针对大规模数据集的处理，仅仅从降维角度去考虑明显不够，更多的还是要提高模型对数据的拟合效果。所以，高维变量选择技术在经济管理中的应用仍亟待开展。从将来的发展看，高维面板数据分析主要应当关注以下五个方面的问题：（一）变量选择技术的发展对于高维问题而言，首先要解决的问题就是降维。无论是变量选择还是变量替换，其目的都是为了降低数据的维度，然而在实际应用中，甄别各变量对总体的影响，仅从相关性学习的角度分析明显不够。例如大型宏观经济数据集中所探讨的各个指标之间可能满意同步关系，也可能是超前或者滞后关系，在对这些非同步关系进行相关分析时可能体现出较小的相关性，这也是了解宏观经济走向不行或

28、缺的重要指示器。（二）选择合适的模型通过降维和变量选择，使高维问题的维度得到了下降，此时还应考虑：采纳传统建模方法进行建模是否恰当？能否再建立一套新的建模方法？从现有的发展来看，采纳与经典方法不同的建模策略是比较好的选择。无论是惩处似然估计还是高维因子模型的主成分估计，建模过程依据降维的须要都进行了改进。依据实际应用背景选择合适的模型，不仅是高维问题，也是全部的统计建模过程中须要面对的问题。（三）改进模型的估计方法传统模型的估计方法已经有了比较完整的理论体系。对于高维问题而言，现有估计方法是对一些既有方法的改进。例如惩处似然、LASSO等方法。在将来的探讨中，有可能采纳更加困难的迭代方法，因选

29、择好的算法对于高维问题显得尤为重要。在混合效应模型的变量选择中，一些相对较为困难的方法须要解决的主要问题还是算法的实现与优化。当然，模拟结果还须要在实证探讨中予以验证。（四）估计和检验统计量的构建与实施对于一些相对比较困难的高维问题，如缺失数据，分类数据，分段数据等特别类型的高维数据，估计和检验统计量的构造还应进一步探究。在追求无偏性、有效性、一样性和充分性的同时，探讨稳健统计量是解决特别类型数据问题的必要条件。合适的统计量应当是能够得出正确结论的统计量，而不仅仅是追求形式上和分布上的一样。神谕（oracle）性质是估计量所要具备的较好特征。（五）大样本状况下的渐近性质由于高维问题所探讨的数据

30、量往往比较大，而样本容量相对不多，故其渐近性质的探讨与传统的大样本性质分析有肯定的区分。随着对高维问题探讨的深化，一些不行观测的大样本问题渐渐出现，如重复构造的数据结构、采纳再抽样（resampling）方法提取数据等等。这类问题引发的思索是：原始问题并非大样本，因模型转换和参数估计过程中产生的大样本问题，其渐近性质应如何考虑？参考文献：1Stock J H, Watson M W. Forecasting Using Principal Components from a Large Number of PredictorsJ. Journal of the American Statist

31、ical Association, 2002, 97(460).2Stock J H, Watson M W. Implications of Dynamic Factor Models for VAR AnalysisR. NBER Working Paper, 2005.3Pesaran M H, Chudik A. Econometric Analysis of High Dimensional VARs Featuring a Dominant UnitR. ECB Working Paper, 2010.4Song S, Hrdle, W, Ritov Y. Dynamic Fact

32、or Models for High Dimensional Nonstationary Time SeriesR. Forthcoming, 2010.5Forni M, Hallin M, Lippi M, Reichlin L. The Generalized Dynamic Factor Model: One-Sided Estimation and ForecastingJ. Journal of the American Statistical Association, 2005, 100(471).6Deistler M, Zinner C. Modelling HighDime

33、nsional Time Series by Generalized Linear Dynamic Factor Models: An Introductory SurveyJ. Communications in Information and Systems, 2007, 7(2).7Banerjee A, Marcellino M. Factor-Augmented Error Correction ModelsC/Caste J, Shepard N. The Methodology and Practice of Econometrics. Oxford: Oxford Univer

34、sity Press, 2008.8Breitung J, Eickmeier S. Testing for Structural Breaks in Dynamic Factor ModelsJ. Journal of Econometrics, 2011, 163(1).9Bai J, Ng S. Determining the Number of Factors in Approximate Factor ModelsJ. Econometrica, 2002, 70(1).10Hallin M, Liska R. Determining the Number of Factors in

35、 the General Dynamic Factor ModelJ. Journal of the American Statistical Association, 2007, 102(478).11Harding M, Nair K K. Estimating the Number of Factors and Lags in High Dimensional Dynamic Factor ModelsR. Mimeo, 2009.12Fan J, Fan Y, Lv J. High Dimensional Covariance Matrix Estimation Using a Fac

36、tor ModelJ. Journal of Econometrics, 2008, 147(1).13Hautsch N, Kyj L M. Forecasting Vast Dimensional Covariances Using a Dynamic Multi-scale Realized Spectral Components ModelR. Humboldt-Universitt zu Berlin, 2010.14Bai J. Inferential Theory for Factor Models of Large DimensionsJ. Econometrica, 2003

37、, 71(1).15Pan J, Yao Q. Modelling Multiple Time Series via Common FactorsJ. Biometrika, 2008, 95(2).16Lam C, Yao Q, Bathia N. Estimation of Latent Factors for High-Dimensional Time SeriesJ. Biometrika 2011, 98(4).17Anselin L. A Test for Spatial Autocorrelation in Seemingly Unrelated RegressionsJ. Ec

38、onomics Letters, 1988, 28(4).18Brueckner, Jan K. Strategic Interaction among Governments: An Overview of Empirical StudiesJ. International Regional Science Review, 2003, 26(2).19Anselin L. Bera A. Spatial Dependence in Linear Regression Models with an Introduction to Spatial EconometricsC/Ullah Amma

39、n, Giles David E A. Handbook of Applied Economic Statistics, New York: Marcel Dekker, 1998.20Anselin L. Spatial Externalities, Spatial Multipliers and Spatial EconometricsJ. International Regional Science Review, 2003, 26(2).21Kelejian Harry H, Robinson Dennis P. Spatial Correlation: A Suggested Alt

40、ernative to the Autoregressive ModelC/Anselin Luc, Florax Raymond J G M. New Directions in Spatial Econometrics, Berlin: Springer-Verlag, 1995.22Davidian M, Giltinan D M. Nonlinear Models for Repeated Measurement DataM. London: Chapman and Hall, 1995.23Chen Z, Dunson D. Random Effects Selection in L

41、inear Mixed ModelsJ. Biometrics, 2003, 59(4).24Vaida F, Blanchard S. Conditional Akaike Information for Mixed-Effects ModelsJ. Biometrika, 2005, 92(2).25Dziak, John J, Li R. An Overview on Variable Selection for Longitudinal DataC/Hong D. Quantitative Medical Data Analysis Using Mathematical Tools a

42、nd Statistical Techniques. World Scientific, 2010.26Fan J, Li R. Variable Selection via Nonconcave Penalized Likelihood and Its Oracle PropertiesJ. Journal of the American Statistical Association, 2001, 96(456).27Zou H. The Adaptive Lasso and Its Oracle PropertiesJ. Journal of the American Statistic

43、al Association, 2006, 101(476).28Liang K Y, Zeger S L. Longitudinal Data Analysis Using Generalized Linear ModelsJ. Biometrika, 1986, 73(1).29Fu W. Penalized Estimating EquationsJ. Biometrics, 2003, 59(1).30Bondell H D, Krishna A, Ghosh S K. Joint Variable Selection for Fixed and Random Effects in L

44、inear MixedEffects ModelsJ. Biometrics, 2010, 66(4).31Ibrahim J G, Zhu H, Garcia R I, Guo R. Fixed and Random Effects Selection in Mixed Effects ModelsJ. Biometrics, 2010, 67(2).32Ni X, Zhang D, Zhang H H. Variable Selection for Semiparametric Mixed Models in Longitudinal StudiesJ. Biometrics, 2010, 66(1).

展开阅读全文

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

备案号:蜀ICP备2024067431号-1 川公网安备51140202000466号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知装配图网，我们立即给予删除！

高维面板数据降维与变量选择方法研究

最新文档

相关资源

相关搜索