主成分分析和因子分析课件

上传人:阳*** 文档编号:108630691 上传时间:2022-06-15 格式:PPT 页数:17 大小:48.50KB
收藏 版权申诉 举报 下载
主成分分析和因子分析课件_第1页
第1页 / 共17页
主成分分析和因子分析课件_第2页
第2页 / 共17页
主成分分析和因子分析课件_第3页
第3页 / 共17页
资源描述:

《主成分分析和因子分析课件》由会员分享,可在线阅读,更多相关《主成分分析和因子分析课件(17页珍藏版)》请在装配图网上搜索。

1、主成分分析和因子分析课件意义和作用:意义和作用:解决变量间多重共线性。在社会经济研究解决变量间多重共线性。在社会经济研究工作中经常会遇到多指标的问题,这些指工作中经常会遇到多指标的问题,这些指标间往往存在一定的相关,直接纳入分析标间往往存在一定的相关,直接纳入分析不仅复杂,变量间难以取舍,而且由于分不仅复杂,变量间难以取舍,而且由于分析前提不满足,得出错误结论。析前提不满足,得出错误结论。主成分分析和因子分析课件变量压缩。主成分分析通过线性变换,在尽可变量压缩。主成分分析通过线性变换,在尽可能能保留原始变量的信息保留原始变量的信息的基础,的基础,降低维度降低维度,将,将原来的多个变量组合成相互

2、原来的多个变量组合成相互独立独立的少数的、新的少数的、新的综合变量。的综合变量。变量解释。利用新变量进一步探讨变量内在联变量解释。利用新变量进一步探讨变量内在联系和结构,利于简化和解释问题。系和结构,利于简化和解释问题。 因子分析和主成分分析方法,往往是更复杂的因子分析和主成分分析方法,往往是更复杂的统计分析方法的基础。统计分析方法的基础。 Factor1.sav 、 Factor2.sav 主成分分析和因子分析课件l统计信息实际上是统计信息实际上是指数据变异信息指数据变异信息l右图中,在椭圆的右图中,在椭圆的长轴方向数据变异长轴方向数据变异明显大于短轴方向明显大于短轴方向主成分分析和因子分析

3、课件F1F2F1与F2不相关l沿长、短轴方向设沿长、短轴方向设定新坐标系,长轴定新坐标系,长轴变量承载大部分变变量承载大部分变异信息,短轴变量异信息,短轴变量承载少量变异信承载少量变异信息息l一个长轴新变量一个长轴新变量F就可以代表原来两就可以代表原来两个变量的主要信息,个变量的主要信息,从而起到降维作用从而起到降维作用l在主成分分析中,在主成分分析中,提取出的每个新变提取出的每个新变量量(主成分主成分)都是原都是原来多个变量的线性来多个变量的线性组合组合主成分分析和因子分析课件如由两个原始变量如由两个原始变量X1和和X2,可提取两个主成分,可提取两个主成分: F1 =a11X1 +a21X2

4、 F2 =a12X 1 +a22X2 依次类推:由依次类推:由N个原始变量可提取个原始变量可提取N个主成分,个主成分,但如果将它们全部提取出来就失去了该方法简但如果将它们全部提取出来就失去了该方法简化数据的实际意义化数据的实际意义一般情况下按贡献率由大到小,取累计贡献率一般情况下按贡献率由大到小,取累计贡献率达到达到85的前的前23个主成分,其他的忽略不计。个主成分,其他的忽略不计。在进行主成分回归时,提取出的主成分能包含在进行主成分回归时,提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。主要信息即可,不一定要有准确的实际含义。主成分分析和因子分析课件利用主成分进行综合评价:当进行

5、多指标的利用主成分进行综合评价:当进行多指标的综合评价时,应用主成分方法将多指标中的综合评价时,应用主成分方法将多指标中的信息集中为若干个主成分,然后加权求和,信息集中为若干个主成分,然后加权求和,得到综合评价指数。得到综合评价指数。利用主成分进行回归分析:通过对存在共线利用主成分进行回归分析:通过对存在共线性的自变量进行主成分分析,从而在提取多性的自变量进行主成分分析,从而在提取多数信息的同时解决共线性问题。数信息的同时解决共线性问题。主成分分析和因子分析课件与主成分分析相同,也是一种多变量化简、降与主成分分析相同,也是一种多变量化简、降维技术。维技术。在主成分分析时,要求提取出的主成分能包

6、含在主成分分析时,要求提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。主要信息即可,不一定要有准确的实际含义。但在因子分析中,目的是分解原始变量,从中但在因子分析中,目的是分解原始变量,从中归纳出潜在的归纳出潜在的“类别类别”,相关性较强的指标归,相关性较强的指标归为一类,每一类变量代表了一个为一类,每一类变量代表了一个“共同因子共同因子”,即一种内在结构。因子分析就是要寻找该结构。即一种内在结构。因子分析就是要寻找该结构。在实际应用中,有时两者不加区分在实际应用中,有时两者不加区分主成分分析和因子分析课件 为了找出变量间内在结构,要求因子分析满足为了找出变量间内在结构,要求因子分

7、析满足以下条件:以下条件:样本量样本量u样本量与变量数的比例应在样本量与变量数的比例应在5: 15: 1以上以上u总样本量最好大于总样本量最好大于100100,而且原则上越大越,而且原则上越大越好好各变量间必须有相关性各变量间必须有相关性uKMOKMO统计量统计量: :在(在(0 0,1 1)之间,大于)之间,大于0.90.9最佳,最佳, 0.9-0.70.9-0.7尚可,尚可, 0.7-0.60.7-0.6很差,很差,0.50.5以下放弃以下放弃uBartlettsBartletts球形检验:对变量间的独立性球形检验:对变量间的独立性进行检验,若变量间相互独立(进行检验,若变量间相互独立(S

8、ig.Sig.大于大于0.05)0.05),因子分析无效,因子分析无效主成分分析和因子分析课件判断数据是否符合要求,是否有必要进行主判断数据是否符合要求,是否有必要进行主成分成分/因子分析因子分析对原有变量标准化,以消除计量单位和数据对原有变量标准化,以消除计量单位和数据基数的影响基数的影响(SPSS会自动对原始变量标准化)会自动对原始变量标准化)根据标准化数据计算相关矩阵或协方差矩阵,根据标准化数据计算相关矩阵或协方差矩阵,及其特征根和特征向量及其特征根和特征向量进行分析,按一定标准确定提取的主成分进行分析,按一定标准确定提取的主成分/因因子数子数主成分分析和因子分析课件如果进行的是主成分分

9、析,步骤到此结束如果进行的是主成分分析,步骤到此结束如果进行的是因子分析,则考察因子的可解如果进行的是因子分析,则考察因子的可解释性,并在必要时进行因子旋转,使因子载释性,并在必要时进行因子旋转,使因子载荷向荷向0、1分化,以寻求最佳解释分化,以寻求最佳解释如有必要,计算因子得分等中间指标供进一如有必要,计算因子得分等中间指标供进一步分析使用步分析使用主成分分析和因子分析课件特征根特征根(Eigenvalue ):是因子影响力度的指标,):是因子影响力度的指标,其数值代表因子相当于原始变量平均解释力的其数值代表因子相当于原始变量平均解释力的多少。特征根大于多少。特征根大于1,表示引入的因子解释

10、力度,表示引入的因子解释力度大于一个原始变量平均解释力度。因此往往将大于一个原始变量平均解释力度。因此往往将特征根大于作为抽取因子的标准。特征根大于作为抽取因子的标准。方差贡献率:数值越大,表明该因子对原来变方差贡献率:数值越大,表明该因子对原来变量信息的综合能力越强。量信息的综合能力越强。累计贡献率累计贡献率主成分分析和因子分析课件变量变量Xi的变量共同度:也称公因子方差比,是的变量共同度:也称公因子方差比,是提取公因子后,各变量中信息被提取出的比例,提取公因子后,各变量中信息被提取出的比例,或者说原变量的信息量或者说原变量的信息量(方差方差)由公因子决定的比由公因子决定的比例例旋转前旋转前

11、/ /后因子载荷后因子载荷:反映因子和各个变量间的:反映因子和各个变量间的密切程度的指标,实质是两者间的相关系数密切程度的指标,实质是两者间的相关系数因子得分函数系数因子得分函数系数主成分分析和因子分析课件公因子数量的确定公因子数量的确定主成分的累积贡献率:主成分的累积贡献率:85%以上以上 特征根:大于特征根:大于1 综合判断。综合判断。 因子分析时更重要的是因子的因子分析时更重要的是因子的可解释性,必要时保留特征根小于可解释性,必要时保留特征根小于1的因子的因子利用碎石图帮助确定因子数量利用碎石图帮助确定因子数量主成分分析和因子分析课件例:在例:在Factor2.savFactor2.sa

12、v中,有重庆市中,有重庆市4040个区县的个区县的GDPGDP、工业总、工业总产值等九个指标数据,试根据这些指标对各区县经济发产值等九个指标数据,试根据这些指标对各区县经济发展状况进行综合评价。展状况进行综合评价。在在SPSSSPSS中的实现:中的实现: 分析分析(Analyze)-(Analyze)-数据降维数据降维(Data Reduction)-(Data Reduction)-因子因子分析分析(Factor Analyze)(Factor Analyze)u在因子分析对话框中,将原变量选入在因子分析对话框中,将原变量选入“变量变量”列表列表框中框中u在在“描述描述”按钮对话框,在按钮对

13、话框,在“相关矩阵相关矩阵”部分选择部分选择“系数系数”和和“KMOKMO和和BartlettBartlett球形度检验球形度检验”主成分分析和因子分析课件u在在“抽取抽取”按钮对话框,按钮对话框,“方法方法”设定设定为为“主成分主成分”u在在“旋转旋转”按钮对话框,按钮对话框,“方法方法”设定设定为为“最大方差法最大方差法”u在在“得分得分”按钮对话框,选择按钮对话框,选择“保存为保存为变量变量”、“方法方法”设定为设定为“回归回归”,选,选择择“显示因子得分系数矩阵显示因子得分系数矩阵”主成分分析和因子分析课件说明的总方差表:包括特征根,旋转前说明的总方差表:包括特征根,旋转前/ /后后的

14、方差贡献率、累计贡献率的方差贡献率、累计贡献率变量共同度变量共同度旋转前旋转前/ /后因子载荷矩阵后因子载荷矩阵因子得分模型系数:求出公因子后,可以用因子得分模型系数:求出公因子后,可以用回归估计方法求出因子得分数学模型(在因回归估计方法求出因子得分数学模型(在因子分析中,不能直接由载荷矩阵按列得到因子分析中,不能直接由载荷矩阵按列得到因子的表达式)子的表达式)主成分分析和因子分析课件 某市某市15个大中型企业经济效益数据见个大中型企业经济效益数据见“某市工业企业效益指标某市工业企业效益指标.sav”,利用因,利用因子分析方法对企业经济效益进行综合评子分析方法对企业经济效益进行综合评价及分析。价及分析。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!