主成分分析法及其在SPSS中的操作

上传人:彩*** 文档编号:74196026 上传时间:2022-04-13 格式:DOC 页数:8 大小:577.50KB
收藏 版权申诉 举报 下载
主成分分析法及其在SPSS中的操作_第1页
第1页 / 共8页
主成分分析法及其在SPSS中的操作_第2页
第2页 / 共8页
主成分分析法及其在SPSS中的操作_第3页
第3页 / 共8页
资源描述:

《主成分分析法及其在SPSS中的操作》由会员分享,可在线阅读,更多相关《主成分分析法及其在SPSS中的操作(8页珍藏版)》请在装配图网上搜索。

1、一、主成分分析基本原理概念:主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术。思路:一个研究对象, 往往是多要素的复杂系统。 变量太多无疑会增加分析问题的难度和复杂性, 利用原变量之间的相关关系, 用较少的新变量代替原来较多的变量,并使这些少数变量尽可能多的保留原来较多的变量所反应的信息, 这样问题就简单化了。原理:假定有n 个样本,每个样本共有p 个变量,构成一个np 阶的数据矩阵,x11x12x1px21x22x2 pXxn1xn2xnp记原变量指标为x1 ,x2, , xp ,设它们降维处理后的综合指标,即新变量为 z 1,z2, z

2、3, ,zm(m p) ,则z1l11x1l12 x2l1p xpz2l21x1l 22 x2l2 p xp.zmlm1 x1lm 2 x2lmp xp系数 l ij 的确定原则: zi 与 zj ( i j ; i , j=1 ,2, , m)相互无关; z1 是 x1,x2, ,xP 的一切线性组合中方差最大者, z2 是与 z1 不相关的 x1,x2 , ,xP的所有线性组合中方差最大者; z m是与 z1,z2, , zm 1 都不相关的 x1,x2, xP , 的所有线性组合中方差最大者。新变量指标 z1 ,z2, ,zm分别称为原变量指标x1,x2 , ,xP 的第 1,第 2,

3、,第 m主成分。从以上的分析可以看出,主成分分析的实质就是确定原来变量xj (j=1 ,2 , , p )在诸主成分 zi (i=1 , 2, , m)上的荷载 l ij ( i=1 , 2, , m;j=1 , 2 , , p)。从数学上可以证明,它们分别是相关矩阵m个较大的特征值所对应的特征向量。二、主成分分析的计算步骤1、计算相关系数矩阵r11r12r1 pRr21r22r2 prp1rp 2rppr ij ( i , j, , ,p)为原变量xi与 xj 的相关系数,r ijr ji ,其计算公=12=式为n( x kixi )( x kjx j )rijk1nn( xkixi )2(

4、 x kjx j )2k1k 1想解特征方程IR0,常用雅可比法( Jacobi )求出特征值,并使其按大小顺序排列12p0;p1,2, L , p),要求 ei =1eij2分别求出对应于特征值i的特征向量 ei ( i,即1其中 eij 表示向量 eij1的第 j个分量。3、计算主成分贡献率及累计贡献率i( i1,2, L , p)p贡献率:kik 1k累计贡献率:k1( i 1,2, L , p)pk1k一般取累计贡献率达85%-95%的特征值,1 , 2 , L , m 所对应的第1、第2、 、第 m(mp)个主成分。4、计算主成分载荷l ijp(zi , x j )i eij ( i

5、 , j1,2,L , p)5、各主成分得分z11z12z1mz21z22z2mZzn1zn 2znm三、主成分分析法在SPSS中的操作1、指标数据选取、收集与录入(表1)2、AnalyzeData ReductionFactor Analysis,弹出 Factor Analysis对话框:3、把指标数据选入Variables框, Descriptives: Correlation Matrix框组中选中 Coefficients,然后点击 Continue,返回 Factor Analysis对话框,单击 OK。注意: SPSS 在调用 Factor Analyze过程进行分析时, SPS

6、S会自动对原始数据进行标准化处理,所以在得到计算结果后的变量都是指经过标准化处理后的变量,但 SPSS 并不直接给出标准化后的数据,如需要得到标准化数据,则需调用Descriptives过程进行计算。从表 3 可知 GDP与工业增加值 ,第三产业增加值、 固定资产投资、 基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系,与海关出口总额存在着显著关系。 可见许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。主成分个数提取原则为主成分对应的特征值大于1的前 m个主成分 (1以上的)。特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于 1,

7、说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大 , 因此一般可以用特征值大于 1作为纳入标准。通过表 4( 方差分解主成分提取分析 ) 可知 , 提取 2个主成分 , 即m=2, 从表 5( 初始因子载荷矩阵 ) 可知GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、 地方财政收入在 第一主成分 上有较高载荷 , 说明第一主成分基本反映了这些指标的信息 ; 人均 GDP和农业增加值指标在第二主成分上有较高载荷 , 说明第二主成分基本反映了人均 GDP和农业增加值两个指标的信息。所以提取 两个主成分是可以基本反映全部指标的信息 ,

8、所以决定用两个新变量来代替原来的十个变量。 但这两个新变量的表达还不能从输出窗口中直接得到 , 因为“ ComponentMatrix ”是指初始因子载荷矩阵 , 每一个载荷量表示主成分与对应变量的相关系数。用表 5( 主成分载荷矩阵 ) 中的数据除以 主成分相对应的特征值开 平方根便得到两个主成分中每个指标所对应的系数。 将初始因子载荷矩阵中的两列数据输入 ( 可用复制粘贴的方法 ) 到数据编辑窗口 ( 为变量 B1、B2) , 然后利用 “ Transform Compute Variable ” , 在Compute Variable 对话框中输入“ A1=B1/SQR(7.22)” 注

9、:第二主成分 SQR后的括号中填 1.235,即可得到特征向量 A1( 见表 6) 。同理 , 可得到特征向量 A.35.40.41.39.18.40 -.34 -.15 -.02-.06-.15.17.03.042。将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分表达式 注 : 因本例只是为了说明如何在 SPSS进行主成分分析 , 故在此不对提取的主成分进行命名 , 有兴趣的读者可自行命名。标准化:通过 Analyze DescriptiveStatistics Descriptives对话框来实现 :弹出 Descriptives对话框后 ,把XX选入 Variables(大矩阵

10、标准110化)框 ,在Save standardizedvalues as variables前的方框打上钩 ,点击“ OK”,经标准化的数据会自动填入数据窗口中,并以 Z开头命名。.080.414-.048.216-.545-.016-.192.491-.004-.010.080.414.181.036.308.217-.086-.143-.011.527-.330.110.181.036-.365-.434-.018.162.326.162-.197.261-.207-.289-.365-.434.239.171-.128.118.537-.416-.268.031-.200.297.23

11、9.171.135.510.459.279.276-.317-.016.136.085.293.135.510.768-.088.109-.108.035.312-.069-.136-.143.138.768-.088.728-.016.143-.369-.068.128-.333.115.174.133.728-.016.812-.142.222-.004.108.362.101.025-.190.121.812-.142.227-.273.462-.019-.153-.230.420-.421-.287-.014.227-.273.002.431-.694-.121-.184.304-.0

12、91.043.040.243.002.431.117-.405.748.127.119-.218.085-.003-.126-.170.117-.405.814-.036.262-.101-.147.012-.174.048.120-.066.814-.036-.670.371-.011-.170-.329-.111-.089-.109-.070.002-.670.371-.478.182-.258-.069.129.412.010-.105-.325.222-.478.182-.031-.465-.366.383.003.016.132.087.347.350-.031-.465-.538-

13、.004-.367-.145-.172-.175-.087.293-.105.001-.538-.004-.369.390.232-.140-.173.437.055.149-.316.241-.369.390.558.337-.520.166.024-.248.189-.016.023-.251.558.337-.330-.351.645.153-.014.021-.156-.152.147.299-.330-.351.732.109-.570.112-.044-.245.072.022-.126-.078.732.109-.093.639.372.062.144.022.366.213.1

14、74.169-.093.639.717-.079-.517.156.041-.211-.102.142.068-.008.717-.079.044.315.384.269.501.163-.322.183.229-.019.044.315.350-.307.090-.389.211.391-.132.164.225-.009.350-.307-.006-.255.270-.696-.063-.268.185.299.074.114-.006-.255-.024-.098.054-.856.140-.326.078.214.055.008-.024-.098以每个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重计算主成分综合模型 , 即用第一主成分 F1 中每个指标所对应的系数乘上第一主成分 F1 所对应的贡献率再除以所提取两个主成分的两个贡献率之和 , 然后加上第二主成分 F2 中每个指标所对应的系数乘上第二主成分 F2 所对应的贡献率再除以所提取两个主成分的两个贡献率之和 , 即可得到综合得分模型 :根据主成分综合模型即可计算综合主成分值 , 并对其按综合主成分值进行排序 , 即可对各地区进行综合评价比较 , 结果见表 8。具体检验还需进一步探讨与学习

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!