因子分析实验报告
《因子分析实验报告》由会员分享,可在线阅读,更多相关《因子分析实验报告(10页珍藏版)》请在装配图网上搜索。
1、-电子科技大学政治与公共管理学院本科教学实验报告实验课程名称:数据分析技术系列实验电子科技大学教务处制表. z.-电子科技大学实验报告学生*:晨飞*:27指导教师:高天鹏一、实验室名称:电子政务可视化实验室二、实验工程名称:因子分析三、实验原理使用SPSS软件的因子分析对数据样本进展分析相关分析的原理:步骤一:将原始数据标准化。因子分析的第一步是主成分分析,将总量较多的因素通过线性组合的式组合成几个因素,且这些因素之间相互独立。步骤二:建立变量的相关系数矩阵RAnalyse-Dimention Ruduction- Fctor -E*traction-勾选Correlation matri*可
2、以输出相关系数矩阵,相关系数矩阵计算了变量之间两两的pearson相关系数。步骤三:适用性检验使用Bartlett球形检验或者KMO球形检验来检验样本是否适合进展因子分析。评价标准:KMO检验用于检验变量间的偏相关系数是否过小,一般情况下,当KMO大于0.9时效果最正确,小于0.5时不适宜做因子分析。Bartlett球形检验用于检验相关系数矩阵是否是单位阵,如果结论是不拒绝该假设,则表示各个变量都是各自独立的。步骤四:根据因子奉献率选取因子,特征值和特征向量构建因子载荷矩阵A。处于简化和抽取核心的思想,一般会按照*种标准选取前几个对观测结果影响较大的因素构建因子载荷矩阵,一般的标准是选取特征根
3、大于1的因子。并要求累积奉献率到达90%以上。步骤五:对A进展因子旋转因子旋转的目的是使因子载荷矩阵的构造发生变化,使每个变量仅在一个因子上有较大载荷。是将因子矩阵在一个空间里投影,使单个向量的投影在仅在一个变量的向有较大的值,这样做可以简化分析。步骤六:计算因子得分:计算因子得分是计算在不同样本水平下观测指标的水平的式。计算因子得分需要用到因子得分计算函数,这个计算的结果是无量纲的,仅表示各因子在这个水平下观测指标的值,这也是因子分析的目标,将不可观测的目标观测量用一个函数与可以观测的变量联系起来。四、实验目的理解因子分析的含义,以及数学原理,掌握使用spss进展因子分析的法,并能对spss
4、因子分析产生的输出结果进展分析。五、实验容及步骤本次实验包含两个例子:实验步骤:(0) 问题描述 实验一题目要求:对我国主要城市的市政根底设施情况进展因子分析。 实验二题目要求:主要城市日照数sav为例 ,其中的变量包括城市的名称city、各个月份的日照数(1) 实验二步骤:执行analyze-dimention reduction-factor-rotation如下勾选(2) 执行Analyse-Dimention Ruduction,翻开分析窗口翻开参数设置窗口参加变量(3)点击Descripitives,选择initial solution输出原始分析结果、coefficients输出相
5、关系数矩阵、勾选进展KMO和bartlett球形检验,完成之后点击continue回到参数设置窗口输出选项4点击E*traction输出碎图,完成之后点击continue回到参数设置窗口勾选输出碎图5勾选输出因子得分,完成之后点击continue回到参数设置窗口输出因子得分6选择缺失的值用均值代替,完成之后点击continue回到参数设置窗口均值代替缺失数据7点击OK,输出分析结果六、实验器材设备、元器件:计算机、打印机、硒鼓、碳粉、纸七、实验数据及结果分析(1) 实验一主要结果及分析:KMO and Bartletts TestKaiser-Meyer-Olkin Measure of Sa
6、mpling Adequacy.856Bartletts Test of SphericityAppro*. Chi-Square281.248df15Sig.000KMO and Bartletts球形检验的结果从表里的结果可以看出,KMO的检验值为0.856,一般KMO值大于0.9认为适合做因子分析,这个值为0.856接近0.9,适合做因子分析。Correlation Matri*年末实有道路长度公里年末实有道路面积万平米城市桥梁座城市排水管道长度公里城市污水日处理能力万立米城市路灯盏Correlation年末实有道路长度公里1.000.983.783.939.896.883年末实有道路面
7、积万平米.9831.000.738.940.853.867城市桥梁座.783.7381.000.759.873.719城市排水管道长度公里.939.940.7591.000.845.916城市污水日处理能力万立米.896.853.873.8451.000.822城市路灯盏.883.867.719.916.8221.000相关系数矩阵从这个表格中可以看出这六个变量之间有很高的相关度,需要标准化。munalitiesInitialE*traction年末实有道路长度公里1.000.954年末实有道路面积万平米1.000.919城市桥梁座1.000.742城市排水管道长度公里1.000.924城市污
8、水日处理能力万立米1.000.882城市路灯盏1.000.859E*traction Method: Principal ponent Analysis.变量共同度表这个表,表示提取公共因子之后各个变量的共同度,就是原始信息的保存度,例如第一个变量有95.4%的信息被保存下来了。Total Variance E*plainedponentInitial EigenvaluesE*traction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %15.28088.00188.0
9、015.28088.00188.0012.3906.50394.5043.2.70797.2114.1041.73898.9505.84999.7996.012.201100.000E*traction Method: Principal ponent Analysis.主成分表按照之前的设置,保存了一个特征值大于1的因子,这个因子的奉献率为88%特征值和变量的散点图可以看出,除了第一个因子之外其他的因子特征值都很小。ponent Matri*aponent1年末实有道路长度公里.977年末实有道路面积万平米.959城市桥梁座.862城市排水管道长度公里.961城市污水日处理能力万立米.939
10、城市路灯盏.927因子负荷矩阵这个可以用来表示因子的线性组合。ponent Score Coefficient Matri*ponent1年末实有道路长度公里.年末实有道路面积万平米.182城市桥梁座.163城市排水管道长度公里.182城市污水日处理能力万立米.城市路灯盏.176因子得分系数矩阵用主成分分析法得出的因子得分系数矩阵,可以计算因子得分函数。ponent Score Covariance Matri*ponent111.000因子之间关系的矩阵.这个只选择出一个因子,这个实际上没有意义(2)实验二结果及分析:munalitiesInitialE*traction一月日照时数1.00
11、0.915二月日照时数1.000.918三月日照时数1.000.896四月日照时数1.000.933五月日照时数1.000.882六月日照时数1.000.778七月日照时数1.000.617八月日照时数1.000.874九月日照时数1.000.754十月日照时数1.000.863十一月日照时数1.000.847十二月日照时数1.000.854变量共同度表.Total Variance E*plainedponentInitial EigenvaluesE*traction Sums of Squared LoadingsRotation Sums of Squared LoadingsTota
12、l% of VarianceCumulative %Total% of VarianceCumulative %Total% of VarianceCumulative %16.84557.04157.0416.84557.04157.0414.58138.38.21.96216.34773.3881.96216.34773.3882.88624.04762.22031.32411.03484.4211.32411.03484.4212.66422.20184.4214.7256.90.4665.3943.28393.7496.2502.95.8337.1711.42397.2568.104.
13、87098.1269.080.67098.79610.065.53999.33511.047.39599.73112.032.269100.000E*traction Method: Principal ponent Analysis.主成分表选取了前三个特征解大于1的值ponent Matri*aponent123一月日照时数.852-.435-.015二月日照时数.854-.419-.115三月日照时数.869-.275-.257四月日照时数.805-.-.528五月日照时数.888-.033-.303六月日照时数.764.439-.038七月日照时数.364.644-.265八月日照时数
14、.465.809.九月日照时数.794.295.192十月日照时数.800.251.400十一月日照时数.825-.275.300十二月日照时数.562-.164.715因子载荷矩阵显示提取出来的三个因子的线性组合Rotated ponent Matri*aponent123一月日照时数.837-.014.463二月日照时数.882.013.375三月日照时数.901.163.241四月日照时数.903.340-.049五月日照时数.834.392.179六月日照时数.405.730.285七月日照时数.128.763-.134八月日照时数-.917.九月日照时数.376.588.516十月日
15、照时数.297.528.704十一月日照时数.592.700十二月日照时数.140.018.913旋转之后的因子载荷矩阵使各因子的载荷不再集中,可以看出,第一个因子主要由前5个变量决定,中间的因子主要由中间三个因子决定,后面的一个因子主要由后四个因子决定ponent Transformation Matri*ponent1231.754.437.4912-.432.892-.1313-.495-.113.861因子转换矩阵八、实验结论因子分析可以有效降低维度,抽取对观测指标影响最大的几个变量的线性组合,简化研究的过程。九、总结及心得体会有了数据分析软件可以节省大量的数据分析的时间,但是根据数据分析的结果对样本数据进展评估还是需要人员操作,看不懂分析的结果,不懂得分析结果的意思就无法进展接下来的工作,所以我们不仅要熟练掌握数据分析的法,还要了解其中的原理,这样才能充分发挥软件给我们带来的好处,有意识地利用软件帮助我们进展计算,而不只是模仿教程上面的操作步骤,得出自己也看不懂的分析结果。十、对本实验过程及法、手段的改进建议可以选取不能进展因子分析的例子,体会因子分析使用的限制。教育之通病是教用脑的人不用手,不教用手的人用脑,所以一无所能。教育革命的对策是手脑联盟,结果是手与脑的力量都可以大到不可思议。. z.
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 七年级数学:平面直角坐标系中不规则图形面积的计算课件
- 地理环境的差异性课件——曲靖市麒麟区第一中学-郭金涛1
- 高考数学文科一轮复习(北京卷B)ppt课件102双曲线及其性质
- 剖宫产瘢痕妊娠课件
- 七年级《走进初中-享受学习》主题班会ppt课件
- 2020高端楼盘营销渠道拓客课件
- 七年级道德与法治下册第四单元走进法治天地第九课法律在我们身边第1框生活需要法律ppt课件2新人教版
- 七年级生物血管和心脏课件
- 高考数学一轮复习讲义-第一章-1.2-命题及其关系、充分条件与必要条件ppt课件
- 2021公司元旦跨年预售活动方案课件
- 高考数学一轮复习-第十八章-第2讲-极坐标与参数方程ppt课件-文
- 高考数学一轮复习-第二章第四节-幂函数与二次函数ppt课件-理-(广东专用)
- 北欧家具设计课件
- 高考数学一轮复习5.35特殊数列求和ppt课件理
- 高考数学浙江专用二轮培优ppt课件专题六第1讲排列组合二项式定理