第 主成分分析和因子分析学习教案

上传人:辰*** 文档编号:77038998 上传时间:2022-04-19 格式:PPTX 页数:63 大小:976.82KB
收藏 版权申诉 举报 下载
第 主成分分析和因子分析学习教案_第1页
第1页 / 共63页
第 主成分分析和因子分析学习教案_第2页
第2页 / 共63页
第 主成分分析和因子分析学习教案_第3页
第3页 / 共63页
资源描述:

《第 主成分分析和因子分析学习教案》由会员分享,可在线阅读,更多相关《第 主成分分析和因子分析学习教案(63页珍藏版)》请在装配图网上搜索。

1、会计学1第第 主成分主成分(chng fn)分析和因子分析分析和因子分析第一页,共63页。第第 12 章章 主成分主成分(chng fn)分析和因分析和因子分析子分析第1页/共63页第二页,共63页。yyyy-M-d第2页/共63页第三页,共63页。yyyy-M-d第3页/共63页第四页,共63页。yyyy-M-d第4页/共63页第五页,共63页。yyyy-M-d第5页/共63页第六页,共63页。yyyy-M-d第6页/共63页第七页,共63页。第7页/共63页第八页,共63页。第8页/共63页第九页,共63页。yyyy-M-d第9页/共63页第十页,共63页。yyyy-M-d第10页/共63

2、页第十一页,共63页。yyyy-M-d第11页/共63页第十二页,共63页。yyyy-M-d第12页/共63页第十三页,共63页。第13页/共63页第十四页,共63页。yyyy-M-dppppppppppxaxaxayxaxaxayxaxaxay22112222121212121111主成分主成分(chng fn)分析的数学模型分析的数学模型aij为第为第i个主成分个主成分yi和原来的和原来的第第j个变量个变量xj之间的线性相之间的线性相关 系 数 , 称 为 载 荷关 系 数 , 称 为 载 荷(loading)。比如,。比如,a11表示表示第第1主成分和原来的第主成分和原来的第1个变量之间

3、的相关系数,个变量之间的相关系数,a21表示第表示第2主成分和原来的第主成分和原来的第1个变量之间的相关系数个变量之间的相关系数第14页/共63页第十五页,共63页。yyyy-M-d第15页/共63页第十六页,共63页。yyyy-M-d第16页/共63页第十七页,共63页。第17页/共63页第十八页,共63页。yyyy-M-d第18页/共63页第十九页,共63页。yyyy-M-d第19页/共63页第二十页,共63页。yyyy-M-dn第第1步步 选择【选择【Analyze】下拉菜单,并选择【】下拉菜单,并选择【Data Reduction-n Factor】,进入主对话框】,进入主对话框n第第

4、2步步 在主对话框中将所有原始变量在主对话框中将所有原始变量(binling)选入选入【Variables】n第第3步步 点击【点击【Descriptives】,在【】,在【correlation Matrix】下选】下选择择n 【Coefficirnts】,点击【】,点击【Continue】回到主对话框】回到主对话框n第第4步步 点击【点击【Extraction】,在【】,在【Display】下选择【】下选择【Scree n Plot】,点击【】,点击【Continue】回到主对话框】回到主对话框n第第5步步 点击【点击【Rotation】,在【】,在【Display】下选择【】下选择【Lo

5、ading n Plot】,点击【】,点击【Continue】回到主对话框】回到主对话框n 点击【点击【OK】第20页/共63页第二十一页,共63页。yyyy-M-d变量之间的存在较强的相关关系,适合变量之间的存在较强的相关关系,适合(shh)作主成分作主成分分析分析 第21页/共63页第二十二页,共63页。yyyy-M-d该表是选则主成分该表是选则主成分(chng fn)的主要依据的主要依据第22页/共63页第二十三页,共63页。yyyy-M-d第23页/共63页第二十四页,共63页。yyyy-M-d第24页/共63页第二十五页,共63页。yyyy-M-dnSPSS还提供了一个更还提供了一个

6、更为直观的图形工具来帮为直观的图形工具来帮助选择主成分,即碎石助选择主成分,即碎石图图(Scree Plot)n从碎石图可以看到从碎石图可以看到6个个主轴长度主轴长度(chngd)变变化的趋势化的趋势n实践中,通常结合具体实践中,通常结合具体情况,选择碎石图中变情况,选择碎石图中变化趋势出现拐点的前几化趋势出现拐点的前几个主成分作为原先变量个主成分作为原先变量的代表,该例中选择前的代表,该例中选择前两个主成分即可两个主成分即可拐点拐点( u i din)第25页/共63页第二十六页,共63页。yyyy-M-dl表表1中的每一列表示一个主成分作为原来变量线性组合的系数,也就是主成分分析模型中的系

7、数中的每一列表示一个主成分作为原来变量线性组合的系数,也就是主成分分析模型中的系数aijl比如比如(br),第一主成分所在列的系数,第一主成分所在列的系数0.670表示第表示第1个主成分和原来的第一个变量个主成分和原来的第一个变量(人均人均GDP)之间的线性相关系数。这个系数越大,说明主成分对该变量的代表性就越大之间的线性相关系数。这个系数越大,说明主成分对该变量的代表性就越大第26页/共63页第二十七页,共63页。yyyy-M-d65432126543211263. 0721. 0728. 0351. 0055. 0725. 0950. 0674. 0633. 0896. 0976. 067

8、0. 0 xxxxxxyxxxxxxy注意:表达式中的不是注意:表达式中的不是(b shi)原始变量,而是标准化变量原始变量,而是标准化变量第27页/共63页第二十八页,共63页。yyyy-M-dn载荷图载荷图(Loading Plot)直观显示主成直观显示主成分对原始分对原始6变量的解释情况变量的解释情况n图中横轴表示第一个主成分与原始变图中横轴表示第一个主成分与原始变量间的相关系数;纵轴表示第二个主量间的相关系数;纵轴表示第二个主成分与原始变量之间的相关系数成分与原始变量之间的相关系数n每一个变量对应的主成分载荷就对应每一个变量对应的主成分载荷就对应坐标系中的一个点,比如,人均坐标系中的一

9、个点,比如,人均GDP变量对应的点是变量对应的点是(0.670,0.725)n第一个主成分很充分地解释了原始的第一个主成分很充分地解释了原始的6个变量个变量(与每个原始变量都有较强的与每个原始变量都有较强的正相关关系正相关关系),第二个主成分则较好,第二个主成分则较好地解释了居民消费水平、人均地解释了居民消费水平、人均GDP和年末总人口这和年末总人口这3个变量个变量(与它们的相与它们的相关关系较高关关系较高),而与其他,而与其他(qt)变量的变量的关系则较弱关系则较弱(相关系数的点靠近坐标相关系数的点靠近坐标轴轴)相关系数的点越远相关系数的点越远离坐标轴,主成分离坐标轴,主成分(chng fn

10、)对原始对原始变量的代表性就越变量的代表性就越大。这大。这3个点远离主个点远离主成分成分(chng fn)2的坐标的坐标第28页/共63页第二十九页,共63页。第29页/共63页第三十页,共63页。第30页/共63页第三十一页,共63页。yyyy-M-d第31页/共63页第三十二页,共63页。yyyy-M-d第32页/共63页第三十三页,共63页。yyyy-M-d第33页/共63页第三十四页,共63页。yyyy-M-d因子分析的数学模型因子分析的数学模型系数系数aij为第个为第个i变量与第变量与第k个因子之间的线性相关个因子之间的线性相关(xinggun)系数,反映变量与因子之间的相关系数,反

11、映变量与因子之间的相关(xinggun)程度,也称为载荷程度,也称为载荷(loading)。由于因子出现在每个原始变量与因子的线性组合中,因此也称为公因子。由于因子出现在每个原始变量与因子的线性组合中,因此也称为公因子。为特殊因子,代表公因子以外的因素影响为特殊因子,代表公因子以外的因素影响pkpkpppkkkkfafafaxfafafaxfafafax2211222221212112121111第34页/共63页第三十五页,共63页。yyyy-M-d)21(122piahkjiji, )21(122kjagpiijj, 变量变量(binling)xi的信息能够的信息能够被被k个公因子解释的程

12、度,用个公因子解释的程度,用 k 个 公 因 子 对 第个 公 因 子 对 第 i 个 变 量个 变 量(binling)xi的方差贡献率表的方差贡献率表示示第第j个公因子对变量个公因子对变量xi的的提供的方差总和,反映提供的方差总和,反映第第j个公因子的相对重要程个公因子的相对重要程度度第35页/共63页第三十六页,共63页。第36页/共63页第三十七页,共63页。yyyy-M-d第37页/共63页第三十八页,共63页。yyyy-M-d第38页/共63页第三十九页,共63页。yyyy-M-d第39页/共63页第四十页,共63页。yyyy-M-d第40页/共63页第四十一页,共63页。yyyy

13、-M-d第41页/共63页第四十二页,共63页。yyyy-M-d第42页/共63页第四十三页,共63页。yyyy-M-d第43页/共63页第四十四页,共63页。yyyy-M-d第44页/共63页第四十五页,共63页。yyyy-M-d因子得分因子得分(d fn)函数函数因子得分是各变量因子得分是各变量的线性组合的线性组合 第45页/共63页第四十六页,共63页。第46页/共63页第四十七页,共63页。yyyy-M-d第47页/共63页第四十八页,共63页。yyyy-M-dn第第1步步 选择【选择【Analyze】【Data Reduction-Factor】主对话框。将所主对话框。将所n 有原始

14、变量选入【有原始变量选入【Variables】n第第2步步 点击点击(din j)【Descriptives】【correlation Matrix】【KMO and n Bartletts test of sphericity】(其他选项根据需要其他选项根据需要) 【Continue】 n第第3步步 点击点击(din j)【Extraction】,在【】,在【Method】框中选择因子的提取方法】框中选择因子的提取方法(本例本例n 使用隐含的使用隐含的Principal components);在【;在【Extract】中输入选择因子】中输入选择因子 n 的最小特征根的最小特征根(隐含的是特

15、征根大于隐含的是特征根大于1);在【;在【Display】下选择】下选择 n 【Scree Plot】 【Continue】n第第4步步 点击点击(din j)【Rotation】,在【】,在【Method】框中选择因子旋转方法】框中选择因子旋转方法(隐隐含的不含的不n 旋转,本例选择【旋转,本例选择【Varimax】);在【;在【Display】下选择【】下选择【Loading n Plot】 【Continue】 n第第5步步 点击点击(din j)【Scores】,并选中【】,并选中【Display factor Score coefficient n matrix】(SPSS隐含的估计

16、因子得分系数的方法是隐含的估计因子得分系数的方法是Regression) n 【Continue】 【OK】第48页/共63页第四十九页,共63页。yyyy-M-dKMO检验检验(jinyn)和和Bartlett球度检验球度检验(jinyn) Bartlett球度检验统计量为球度检验统计量为277.025。检验的。检验的P值接近值接近0。表。表明明6个变量之间有较强的相关关系。而个变量之间有较强的相关关系。而KMO统计量为统计量为0.695,接近,接近0.7。适合作因子分析。适合作因子分析第49页/共63页第五十页,共63页。yyyy-M-d所有变量的共同度量都在所有变量的共同度量都在80%以

17、上,因此,提取出的以上,因此,提取出的公因子对原始变量的解释能力应该是很强的公因子对原始变量的解释能力应该是很强的第50页/共63页第五十一页,共63页。yyyy-M-d各因子所解释各因子所解释(jish)的原始变量的方差的原始变量的方差 除最后除最后3列外,其余部分与主成分分析中的表相同。列外,其余部分与主成分分析中的表相同。 “Rotation Sums of Squared Loadings”部分是因子旋转后对原始变量方差的解释情况。旋转后的累计方差没有改变,部分是因子旋转后对原始变量方差的解释情况。旋转后的累计方差没有改变,只是两个因子所解释的原始变量的方差发生了一些变化。只是两个因子

18、所解释的原始变量的方差发生了一些变化。第51页/共63页第五十二页,共63页。yyyy-M-d旋转后的因子载荷旋转后的因子载荷(zi h)矩阵矩阵 第一个因子与年末总人口、固定资产投资、社会消费品零售总额、财政收入这第一个因子与年末总人口、固定资产投资、社会消费品零售总额、财政收入这几个载荷系数较大,主要解释了这几个变量。从实际意义上看,可以把因子几个载荷系数较大,主要解释了这几个变量。从实际意义上看,可以把因子1姑且命名为姑且命名为“经济水平经济水平”因子。而第二个因子与人均因子。而第二个因子与人均GDP、居民消水平这两个变量、居民消水平这两个变量的载荷系数较大,主要解释了这两个变量,从实际

19、意义看,可以将因子的载荷系数较大,主要解释了这两个变量,从实际意义看,可以将因子2姑且命姑且命名为名为“消费水平消费水平”因子因子第52页/共63页第五十三页,共63页。yyyy-M-d因子分析的数学模型因子分析的数学模型表达式中的表达式中的xi已经已经(y jing)不是原始变量,不是原始变量,而是标准化变量而是标准化变量 216215214213212211349.0922.0980.0117.0213.0941.0247.0931.0622.0755.0981.0112.0ffxffxffxffxffxffx第53页/共63页第五十四页,共63页。yyyy-M-d旋转后的因子旋转后的因子

20、载荷系数更加载荷系数更加(gnji)接近接近于于1(如果旋转如果旋转后的因子载荷后的因子载荷系数向系数向01分分化越明显,说化越明显,说明旋转的效果明旋转的效果越好越好),从而使,从而使因子的意义更因子的意义更加加(gnji)清清楚了楚了 第54页/共63页第五十五页,共63页。yyyy-M-d因子因子(ynz)得分系数矩阵得分系数矩阵 根据因子得分系数矩阵可将因子表示为变量的线性组合根据因子得分系数矩阵可将因子表示为变量的线性组合第55页/共63页第五十六页,共63页。yyyy-M-d上面表达式中的上面表达式中的xi标准化变量。根据这一表达式便可以计算每个地区对应的第一个因子和第二个因子的取

21、值,也称为标准化变量。根据这一表达式便可以计算每个地区对应的第一个因子和第二个因子的取值,也称为(chn wi)因子得分因子得分(factor score)。有了因子得分,就可以对每个地区分别按照前面命名的。有了因子得分,就可以对每个地区分别按照前面命名的“经济水平经济水平”因子和因子和“消费水平消费水平”因子进行评价和排序因子进行评价和排序 65432126543211022. 0429. 0237. 0026. 0171. 0430. 0281. 0104. 0372. 0300. 0180. 0105. 0 xxxxxxfxxxxxxf因子得分函数因子得分函数第56页/共63页第五十七页

22、,共63页。yyyy-M-d行加权,然行加权,然后加总得到后加总得到每个地区的每个地区的总因子得分总因子得分按总得分的多少按总得分的多少进行排序,进行排序,以反映各地以反映各地区经济发展区经济发展的差异的差异要由要由SPSS得出各样本的不同因子得分,点击【得出各样本的不同因子得分,点击【Scores】【Save as variables】即可。】即可。SPSS会计算出每个因子的得分,并保存会计算出每个因子的得分,并保存(bocn)在工作表的在工作表的FAC1_1和和FAC2_1中中因子综合得分因子综合得分22121211FFF21308859. 0691141. 0FFF第57页/共63页第五

23、十八页,共63页。yyyy-M-d第58页/共63页第五十九页,共63页。yyyy-M-d因 子因 子 1 得 分得 分 ( d fn)最高的是广最高的是广东,最低的西藏东,最低的西藏,这说明广东是,这说明广东是经济发展水平较经济发展水平较高的地区,西藏高的地区,西藏是经济发展水平是经济发展水平较低的地区;因较低的地区;因子子2得分得分(d fn)最高的是上海,最高的是上海,最低的是贵州,最低的是贵州,说明上海是消费说明上海是消费水平较高的地区水平较高的地区,而贵州则是消,而贵州则是消费水平较低的地费水平较低的地区区 第59页/共63页第六十页,共63页。yyyy-M-d第60页/共63页第六十一页,共63页。yyyy-M-d第61页/共63页第六十二页,共63页。结结 束束第62页/共63页第六十三页,共63页。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!