一、主成分分析基本原理

上传人:jin****ng 文档编号:187993615 上传时间:2023-02-17 格式:DOCX 页数:10 大小:129.54KB
收藏 版权申诉 举报 下载
一、主成分分析基本原理_第1页
第1页 / 共10页
一、主成分分析基本原理_第2页
第2页 / 共10页
一、主成分分析基本原理_第3页
第3页 / 共10页
资源描述:

《一、主成分分析基本原理》由会员分享,可在线阅读,更多相关《一、主成分分析基本原理(10页珍藏版)》请在装配图网上搜索。

1、一、主成分分析基本原理概念:主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析 方法。从数学角度来看,这是一种降维处理技术。思路:一个研究对象,往往是多要素的复杂系统。变量太多无疑会增加分析 问题的难度和复杂性,利用原变量之间的相关关系,用较少的新变量代替原来较 多的变量,并使这些少数变量尽可能多的保留原来较多的变量所反应的信息,这 样问题就简单化了。原理:假定有n个样本,每个样本共有p个变量,构成一个nXp阶的数据 矩阵,xxx11121 pxxxX =21222 px x xn1n 2np记原变量指标为x, X,,X,设它们降维处理后的综合指标,即新变量12p为 z,z,z,z

2、(mWp),贝U123mz = lx + lx HF l x1 11 1 12 21 p pz = l x +1 x HF l xGDPX1:,$ 人均GDP X2初第三产业増加值斛固定资产投资旌砂基本建设投资X7;為卄仝消帝品嫁售$Selection Variable:3、把指标数据选入 Variables 框,Descriptives: Correlation Matrix 框组 中选中Coefficients,然后点击Continue,返回Factor Analysis对话框,单击OK。注意:SPSS在调用Factor Analyze过程进行分析时,SPSS会自动对原始数据进行标准化处理

3、,所以在得到计算结果后的变量都是指经过标准化处理后的变量 但SPSS并不直接给出标准化后的数据,如需要得到标准化数据,则需调用Descriptives过程进行计算。表3 相关系数拒阵Correlation NfatrixComponentInitial EigenvaluesExtraction Stuns of Squared LoadingsTotal% of VarianceCumulative %Total% of VananceCumulative %17.22072.20572.2057.22072.20572.20521.23512346845511.2351234684.551

4、30.8778.76993.319斗0.5475.46698.78650.0850.85499.64060.0210.21199.85070.0120.11999.97080.0020.01899.98890.0010.012100.000100.0000.000100.000表4方差分解主成分提取分析表Total Variance E?q)lamedExtinction Nfethod: Principal Conyonent Analysis.Component12GDP0.9490.195人均GDP0.112-0.824农业增加值-0.1090.677工业增加值0.978-0.005第三

5、产业增加值0.9860070固定资产投资0.983-0.068基本建设投资0.947-0 024社会消费品零售总额0.9770.176海关出口总额0.800-0.051地方财政收入0.954-0.128表5 初始因子载荷矩阵Conyoiient Nfetrix3Extraction Nfethod: Pruicipal Ccmponent Analysis, a. 2 compaieiits extracted.GDP人均GDP农业增加值工业增加值第三产业 增加值固宦 资产 投资丰设资 基建投社会消PT 口口 李售总额海关 出口 总额方政入地财收GDP1.000-0.094-0.0520.96

6、70.9790.9230.9220.9410.6370.826人均GDP-0 0941.000-0.1710.1130.0740.2140.093-0.0430.0810.273农业增加值-0.052-0.1711.000-0.132-0.050-0.098-0.1760.013-0.125-0.086工业增加值0.9670.113-0.1321.0000.9850.9630.9390.9350.7050.898第匚产业增加值0.9790.074-0.0500.9851.0000.9730.9400.9620.7140.913固定资产投资0.9230.214-0.0980.9630.9731.

7、0000.9710.9370.7170.934基本建设投资0.9220.093-0.1760.9390.9400.9711.0000.8970.6240.848社会消费品零售总额0.941-0.0430.0130.9350.9620.9370.8971.0000.8360.929海关出口总额0.6370.081-0.1250.7050.7140.7170 6240.83610000.882地方财政收入0.8260.273-0.0860.8980.9130.9340 8480.9290.8821.000从表3可知GDP与工业增加值,第三产业增加值、固定资产投资、基本建设 投资、社会消费品零售总额

8、、地方财政收入这几个指标存在着极其显著的关系, 与海关出口总额存在着显著关系。可见许多变量之间直接的相关性比较强, 证明 他们存在信息上的重叠。主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。特征值在某种程度上可以被看成是表示主成分影响力度大小的指标, 如果特征值小于1, 说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大, 因此 一般可以用特征值大于1作为纳入标准。通过表4( 方差分解主成分提取分析) 可 知,提取2个主成分,即m=2,从表5(初始因子载荷矩阵)可知GDP、工业增加 值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海 关出口总额、地

9、方财政收入在第一主成分上有较高载荷, 说明第一主成分基本反 映了这些指标的信息;人均GDP和农业增加值指标在第二主成分上有较高载荷, 说明第二主成分基本反映了人均GDP和农业增加值两个指标的信息。所以提取两 个主成分是可以基本反映全部指标的信息, 所以决定用两个新变量来代替原来 的十个变量。但这两个新变量的表达还不能从输出窗口中直接得到, 因为“Component Matrix”是指初始因子载荷矩阵,每一个载荷量表示主成分与对应 变量的相关系数。用表5(主成分载荷矩阵)中的数据除以主成分相对应的特征值开平方根便 得到两个主成分中每个指标所对应的系数。将初始因子载荷矩阵中的两列数据输 入(可用复

10、制粘贴的方法)到数据编辑窗口(为变量Bl、B2),然后利用“TransformCompute Variable” , 在Compute Variable对话框中输入“Al二B1/SQR(7.22)”注:第二主成分SQR后的括号中填1.235,即可得到特征向 量A (见表6)。同理,可得到特征向量A。将得到的特征向量与标准化后的数据相12乘,然后就可以得出主成分表达式注:因本例只是为了说明如何在SPSS进行 主成分分析, 故在此不对提取的主成分进行命名, 有兴趣的读者可自行命名。Fi =O.353ZXi -W.042ZX2.04IZX3 +0.364绥十0.367ZX, -KJ.366ZX, -

11、HJ.352ZX,代.箔4巫 +0.2987 十 0.355ZX1&F2 =O.175ZX1 -0.741ZX. +0.609奉-0.004ZX4 十0.063ZX. -0.061ZX,.022ZX7 P.1 免级 -0.046ZXp 0.115ZXltIjSiQL V&tiabhK pFiwxtions:AWrilevaij.vaje-. .I ?FS|N|pLrtntKpiJ Afi T AW-nurroMpr巾FIW讪阴I理.CDF EERNOUlIJN.i标准化: 通过AnalyzeDescriptive StatisticsDescriptives 对话框来 实现:弹出Descrip

12、tives对话框后,把XX 选入Variables框,在Save1 10standardized values as variables前的方框打上钩,点击“OK,经标准化 的数据会自动填入数据窗口中,并以Z开头命名。pGDriini;# .丄灼GD门凶卫川 fcthJezinrs 肚耳,工Ik曙加曲F-4i砧篇三产M加iB :;I g E!孟煮严1!&审卜兀 g產丰連谟ia贸曲严+ 石4-产 =1凸二 VedriiitjfcEL3O.Etafcs j3询:helD ;pticr泊董 7 Descriptives 对话框以每个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重计算主

13、成分综合模型,即用第一主成分F1中每个指标所对应的系数乘上第 一主成分F1所对应的贡献率再除以所提取两个主成分的两个贡献率之和,然后 加上第二主成分F2中每个指标所对应的系数乘上第二主成分F2所对应的贡献 率再除以所提取两个主成分的两个贡献率之和, 即可得到综合得分模型:FO.327ZX! 0.072Z5C-K).054ZX,-F0.310ZX4XI.323ZX-+0J04ZX,297ZX,4i334ZXs4i24SZJQ-Kl.286ZXlfl根据主成分综合模型即可计算综合主成分值, 并对其按综合主成分值进行排序, 即可对各地区进行综合评价比较, 结果见表8。表S 综合主成分值城市三成分F,排名第二主成分F排名综合主成分F排名r京5.2310.1164.4S1江苏2.2520.2351.962iif京1.9630.5021.753浙江1.164-0.1980.964上海0.305-2.3610-0.095辽于-1.2461.961-0.786-1.3570.414-1.107-1.978-0.077-1.708天絆-3.049-1.019-2.749r眩-3.29100.413-2.7510具体检验还需进一步探讨与学习

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!