1、因子分析法(Factor Analysis)

上传人:无*** 文档编号:141357926 上传时间:2022-08-24 格式:DOC 页数:8 大小:114.50KB
收藏 版权申诉 举报 下载
1、因子分析法(Factor Analysis)_第1页
第1页 / 共8页
1、因子分析法(Factor Analysis)_第2页
第2页 / 共8页
1、因子分析法(Factor Analysis)_第3页
第3页 / 共8页
资源描述:

《1、因子分析法(Factor Analysis)》由会员分享,可在线阅读,更多相关《1、因子分析法(Factor Analysis)(8页珍藏版)》请在装配图网上搜索。

1、1、因子分析法(Factor Analysis)一、方法介绍基本思路:因子分析法是一种多元统计方法,它从研究相关矩阵内部的依赖关系出发,根据相关性大小把变量分组(使得同组内的变量之间相关性不高,而不同组内的变量之间相关性较低),这样,在尽量减少信息丢失的前提下,从众多指标中提取出少量的不相关指标,然后再根据方差贡献率确定权重,进而计算出综合得分的一种方法。理论模型:设m个可能存在相关关系的测试变量z1,z2,zm含有P个独立的公共因子F1,F2,Fp(mp),测试变量zi含有独特因子Ui(i=1m),诸Ui间互不相关,且与Fj(j=1p)也互不相关,每个zi可由P个公共因子和自身对应的独特因子

2、Ui线性表出: (1)用矩阵表示: 简记为 (2)且满足:(I) Pm; (II) COV(F.U)=0 (即F与U是不相关的); (III) E(F)=0 COV(F)= 。即F1,FP不相关,且方差皆为1,均值皆为0(IV) E(U)=0 COV(U)=Im 即U1,Um不相关,且都是标准化的变量,假定z1,zm也是标准化的,但并不相互独立。式中A称为因子负荷矩阵,其元素(即(7.2-1)中各方程的系数)aij表示第i个变量(zi)在第j个公共因子Fj上的负荷,简称因子负荷,如果把zi看成P维因子空间的一个向量,则aij表示zi在坐标轴Fj上的投影。因子分析的目的就是通过模型(1)或(2)

3、,以F代Z,由于一般有Pm,从而达到简化变量维数的愿望。二、使用软件和软件实现过程采用Eviews5.1、SPSS12.0、Stata5.1、SAS Release8.02 等计量软件均可完成上述因子分子模型,建议采用SPSS12.0操作。因子分析的基本步骤如下(事物可观测原始变量为x1,x2,xp): (1)对原始变量标准化。在因子分析求解时若采用主成分法,由于主成分分析在通过总体协方阵求主成分时,往往优先顾及方差较大的变量,受变量的计量单位影响较大,有时会造成不合理的结果,所以为了消除这种影响,需在分析之前,对原始变量标准化。标准化最常规的方法是将原变量数列化为均值为0、方差为1的数列,即

4、令; (2)求出标淮化数据zx1, zx2,zxp的协方差矩阵,或相关系数矩阵R(两者等价); (3)求R的特征值及相应的一组正交单位特征向量; (4)计算累计贡献率,确定公共因子个数及因子载荷矩阵A; (5)对A作因子旋转(常为方差最大正交旋转),使得能对公共因子给出合理的解释; (6)计算因子得分,根据得分对研究问题作比较分析。 上述计算步骤及作图可利用SPSS11.0软件来完成: (1)选择菜单中“Analyze-descriptive statistics-desctrptives.,对x l, x2,,xp指标进行标准化处理,并将标准化后的变量保存在数据编辑窗口; (2)选择菜单中“

5、Analyze-data reduction-factor,打开因子分析对话框,将标准化后的变量放人Variables中,进行主成分分析; (3)在主成分分析的基础上进行观察,发现提取几个公共因子较佳,在“factor-extract-numbers of facto中输人公共因子的个数; (4)在“factor-rotation”中选择varimax,对因子进行方差最大旋转; (5)在“factor-score”中选regression,计算因子得分。三、一个简单例证:重庆城镇居民消费结构变动的因子分析 本文运用数理统计中的因子分析法,对重庆直辖后城镇居民消费结构的变动情况进行分析,认为居民

6、消费主要受生存型消费和享受型消费两大因子的影响,分析表明这两型因子所占比重近几年来都稳定在8:2 的水平上,并未发生大的变化。1、资料来源消费结构是人们在生活中消费的消费资料和接受的服务种类及其比例关系,也就是指各类消费支出在总消费支出中的比重。对居民消费支出按照人们实际支出的去向分类可分为食品、衣着、家庭设备及服务、医疗保健、交通通讯、文教娱乐及服务、居住、杂项商品及服务。分别记为X1 , X2 , , X8。根据重庆市统计年鉴19982003 年各卷,得重庆市城镇居民消费结构变化如表1 所示。由表1 中资料可知,食品、衣着所占比重从1998 年开始是下降的。联合国提出的恩格尔系数(食品在总

7、消费支出中的比重) 判定生活发展阶段的一般标准:60%以上为贫困, 50%60%为温饱,40%50%为小康,40%以下为富裕,可见重庆城镇居民消费水平已从小康迈向了富裕。家庭设备所占比重也是下降的,这说明居民对一般家庭设备的需求已经基本饱和,且由于总收入的增加,杂项支出所占比重也逐年下降。另一方面,表1 说明:医疗保健、交通通讯、文教娱乐和住房消费所占比重在逐年上升。这是因为随着社会的发展,居民的保健意识增强,更关注自身的身心健康,再加上医保制度的改革,所以医疗保健所占比重逐年上升;由于城镇居民家庭拥有小汽车的比例增加,移动通讯的普遍使用,网络通讯进入家庭,因而交通和通讯所占比重也是上升的;由

8、于居民对自身进一步发展和子女教育的投入力度加大,并且在物资享受已经得到满足的情况下更加注重精神享受,所以文教和娱乐方面的支出增多;随着我国住房制度的改革,居民在居住上面的支出也出现了大幅增加。为了进一步研究消费结构的变化情况,下面用因子分析法,对表1 的数据进行统计分析。表1 重庆城镇居民消费结构变化(%)年份食品(X1)衣着(X2)家庭设备(X3)医疗保健(X4)交通通讯(X5)文教娱乐(X6)居住(X7)杂项(X8)1988 45.52 12.179.83.39612.926.094.111999 44.50 11.79.43.86.912.47.24.12000 40.40 10.18.

9、75.47.414.494.62001 38.70 10.28.85.87.714.79.84.32002 38.00 9.87.16.89.716.79.32.62、消费结构的因子模型由表1 中资料得样本均值向量: X = (41.42 ,10.79 ,8.76 ,5.04 ,7.54 ,14.22 ,8.27 ,3.94) ,且用软件SPSS 计算变量的相关系数矩阵的特征值和贡献率见表2。由表2 可以看出变量相关系数矩阵有两个大的特征根为6.6721 和1.142 ,其累计贡献率达到98.292%,又根据图1 ,前两个公因子变化最大,说明前两个公因子提供了原始数据8 个指标所能表达的足够的

10、信息。表2 相关矩阵的特征值与贡献率变量序列号因子分析初始解对变量的描述提取共因子后对变量的描述特征值方差贡献率累计方差贡献率特征值方差贡献率累计方差贡献率16.72084.01784.0176.72084.01784.01721.42014.27598.2921.14214.27598.29230.0831.03699.32940.0540.671100.00050.0000.000100.00060.0000.000100.00070.0000.000100.00080.0000.000100.000因此提取两个主因子,用主成份分析法和正交旋转法计算得旋转前后的因子载荷阵如表3 所示。表3

11、因子载荷阵原始因子载荷阵旋转后因子载荷阵变量公因子共同度公因子1212X1-0.96-0.260.989-0.9410.323X2-0.942-0.3180.987-0.9580.264X3-0.960.250.984-0.6550.745X40.9940.1030.9990.881-0.472X50.961-0.2350.9790.664-0.734X60.969-0.1120.9520.74-0.036X70.8760.4610.980.984-0.109X8-0.6110.7870.993-0.0650.994由表3 可得消费结构的因子分析模型为选用回归法估算因子得分系数如表4 所示。表

12、4 因子得分系数变量X1X2X3X4X5X6X7X8公因子序号1-0.246-0.2720.0040.1730.0030.6640.3340.3112-0.109-1.520.261-0.009-0.251-0.1620.2610.622由此计算5 年的因子得分如表5 所示。表5 各年份因子得分因子19981999200020012002F1-1-1.29601-0.83920.718780.927680.48875F2-10.122770.180810.770190.64263-1.716413、结果分析从表3 可以看出,第一个主因子在X1 , X2 , X4 , X6 ,X7 5 个方面有

13、较大载荷,这几项指标主要反映居民为了生存必需要消费支出的变化情况,因此命名为生存型消费因子;第二个主因子在X3 , X5 , X83 方面有较大载荷,这几项指标主要反映居民为了改善生活,提高生活效率如购买小汽车,使用移动通讯等方面的消费支出变化情况,因此命名为享受型消费因子。分类情况如表6 所示。表6主因子分析高载荷指标因子命名1食品,衣着,医疗保健,文教娱乐,居住生存型消费因子2家庭设备,交通通讯,杂项商品及服务享受型消费因子结合表1 ,根据分类将各年数据相加,得生存型消费因子与享受型消费因子在1998 - 2002 年这5 年中所占比重如表7 所示。表7 各年份两型因子所占比重(%)199

14、81999200020012002生存型消费因子80.1979.679.379.280.6享受型消费因子19.9120.420.720.819.4由表7 可知,这5 年来,生存型消费因子所占比重基本为80%左右,享受型消费因子所占比重为20%左右,各自的变化幅度不大。这说明虽然重庆市城镇居民的收入增加了,但是由于医疗、住房制度的改革和教育收费标准的提高,居民生存型消费支出在增加,但另一方面用于享受型消费支出也出现相应的增加,这两型因子所占比重基本维持在8:2 的水平上,说明重庆市城镇居民消费结构保持相对稳定,变化不大。四、评价及问题方法评价:因子分析法最大优势在于各综合因子的权重不是主观赋值而

15、是根据各自的方差贡献率大小来确定的,方差越大的变量越重要,从而具有较大的权重;相反,方差越小的变量所对应的权重也就越小。这就避免了人为确定权重的随意性,使得排行结果唯一,而且较为客观合理。此外,因子分析的整个过程都可以运用计算机软件方便快捷地进行,可操作性强。因此,与其他方法相比,因子分析法是一种科学、实用、简便的综合排行方法,适用于解决多指标的综合评价问题。需注意问题:(1)在利用因子分析法的开始阶段,应当尽可能多地选取与研究对象有关的指标,以免遗漏重要的评估指标。然后,就可以通过因子分析选择相对更为有效的指标,构建研究对象评估的指标体系,进而进行基于数据本身的相对客观的评估。(2)设定好因

16、子分析指标后,还要对因子分析法的可行性进行研究。因子分析法应用的前提是原有变量之间应具有较强的相关关系,否则根本无法从中综合出能够反映某些变量共同特性的几个较少的公共因子变量。(3)当然,因子分析法作为一种比较性的方法,也有其局限性。主要的局限性在于它需要较多的数据,只有这样才能根据这些数据分析出研究对象与各指标有关的不可观测的因子,进而进行评估计算。五、重要文献 1 胡瑞平. 因子分析在确立人才理想知识、能力结构中的应用J . 数理统计与管理,2002(1) :28230.2 于绣林, 任雪松. 多元统计分析M. 北京:中国统计出版社,1999.3 何晓群. 现代统计方法与应用M. 北京:中国人民大学出版社,1998.4 余建英. 何旭宏. 数据统计分析与SPSS 应用M. 北京:人民邮电出版社,2003.8

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!