SPSS因子分析法-例子解释

上传人:奇异 文档编号:62663191 上传时间:2022-03-15 格式:DOCX 页数:28 大小:308.39KB
收藏 版权申诉 举报 下载
SPSS因子分析法-例子解释_第1页
第1页 / 共28页
SPSS因子分析法-例子解释_第2页
第2页 / 共28页
SPSS因子分析法-例子解释_第3页
第3页 / 共28页
资源描述:

《SPSS因子分析法-例子解释》由会员分享,可在线阅读,更多相关《SPSS因子分析法-例子解释(28页珍藏版)》请在装配图网上搜索。

1、因子分析的根本概念和步骤一、因子分析的意义在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比拟全面、完整的把握和认识。例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、工程经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如根底课成绩、专业根底课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。虽然收集这些数据需要投入许多精力,虽然它们能够较为全面准确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入和“产出并非呈合理的正比,反而会给统计分析

2、带来很多问题,可以表现在:计算量的问题由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。虽然,现在的计算技术已得到了迅猛开展,但高维变量和海量数据仍是不容无视的。变量间的相关性问题收集到的诸多变量之间通常都会存在或多或少的相关性。例如,高校科研状况评价中的立项课题数与工程经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业根底课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方

3、程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。类似的问题还有很多。为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丧失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丧失。因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。因子分析的概念起源于20世纪初KarlPearson和CharlesSpearmen等人关于智力测验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富和完善。因子分析以最

4、少的信息丧失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。通常,因子有以下几个特点:因子个数远远少于原有变量的个数原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。因子能够反映原有变量的绝大局部信息因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丧失,并能够代表原有变量的绝大局部信息。因子之间的线性关系并不显著由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。因子具有命名解释性通常,因子分析产生的因子能够通过各种方式最终获得命

5、名解释性。因子的命名解释性有助于对因子分析结果的解释评价,对因子的进一步应用有重要意义。例如,对高校科研情况的因子分析中,如果能够得到两个因子,其中一个因子是对科研人力投入、经费投入、立项工程数等变量的综合,而另一个是对结项工程数、发表论文数、获奖成果数等变量的综合,那么,该因子分析就是较为理想的。因为这两个因子均有命名可解释性,其中一个反映了科研投入方面的情况,可命名为科研投入因子,另一个反映了科研产出方面的情况,可命名为科研产出因子。总之,因子分析是研究如何以最少的信息丧失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法。二、因子分析的根本概念1、因子分析

6、模型因子分析模型中,假定每个原始变量由两局部组成:共同因子monfactors和唯一因子uniquefactors。共同因子是各个原始变量所共有的因子,解释变量之间的相关关系。唯一因子顾名思义是每个原始变量所特有的因子,表示该变量不能被共同因子解释的局部。原始变量与因子分析时抽出的共同因子的相关关系用因子负荷factorloadings表示。因子分析最常用的理论模式如下:ZjajiFiaj2F2ajsFsajmFmUjj=1,2,31n,n为原始变量总数可以用矩阵的形式表示为ZAFU。其中F称为因子,由于它们出现在每个原始变量的线性表达式中原始变量可以用Xj表示,这里模型中实际上是以F线性表示

7、各个原始变量的标准化分数Zj,因此又称为公共因子。因子可理解为高维空间中互相垂直的m个坐标轴,A称为因子载荷矩阵,aji(j1,2,3n,i1,2,3m)称为因子载荷,是第j个原始变量在第i个因子上的负荷。如果把变量Zj看成m维因子空间中的一个向量,那么aj表示Zj在坐标轴Fi上的投影,相当于多元线性回归模型中的标准化回归系数;U称为特殊因子,表示了原有变量不能被因子解释的局部,其均值为0,相当于多元线性回归模型中的残差。其中,1Zj为第j个变量的标准化分数;2Fii=1,2,m为共同因素;3m为所有变量共同因素的数目;4Uj为变量Zj的唯一因素;5aji为因素负荷量。2、因子分析数学模型中的

8、几个相关概念因子载荷因素负荷量factorloadings所谓的因子载荷就是因素构造中,原始变量与因素分析时抽取出共同因素的相关。可以证明,在因子不相关的前提下,因子载荷aji是变量Zj和因子Fi的相关系数,反映了变量Zj与因子Fi的相关程度。因子载荷aji值小于等于1,绝对值越接近1,说明因子Fi与变量Zj的相关性越强。同时,因子载荷aji也反映了因子Fi对解释变量Zj的重要作用和程度。因子载荷作为因子分析模型中的重要统计量,说明了原始变量和共同因子之间的相关关系。因素分析的理想情况,在于个别因素负荷量aji不是很大就是很小,这样每个变量才能与较少的共同因素产生密切关联,如果想要以最少的共同

9、因素数来解释变量间的关系程度,那么Uj彼此间或与共同因素间就不能有关联存在。一般说来,负荷量为0.3或更大被认为有意义。所以,当要判断一个因子的意义时,需要查看哪些变量的负荷到达了0.3或0.3以上。变量共同度共同性,munality变量共同度也就是变量方差,就是指每个原始变量在每个共同因子的负荷量的平方和,也就是指原始变量方差中由共同因子所决定的比率。变量的方差由共同因子和唯一因子组成。共同性说明了原始变量方差中能被共同因子解释的局部,共同性越大,变量能被因子说明的程度越高,即因子可解释该变量的方差越多。共同性的意义在于说明如果用共同因子替代原始变量后,原始变量的信息被保存的程度。因子分析通

10、过简化相关矩阵,提取可解释相关的少数因子。一个因子解释的是相关矩阵中的方差,而解释方差的大小称为因子的特征值。一个因子的特征值等于所有变量在该因子上的负荷值的平方m总和。变量Zj的共同度h2的数学定义为:h2aji2,该式说明变量Zj的共同度是因子i1载荷矩阵A中第j行元素的平方和。由于变量Zj的方差可以表示成h2u21,因此变量Zj的方差可由两个局部解释:第一局部为共同度h2,是全部因子对变量Zj方差解释说明的比例,表达了因子全体对变量Zj的解释奉献程度。变量共同度h2越接近1,说明因子全体解释说明了变量Zj的较大局部方差,如果用因子全体刻画变量Zj,那么变量Zj的信息丧失较少;第二局部为特

11、殊因子U的平方,反响了变量Zj方差中不能由因子全体解释说明的比例,u2越小那么说明变量Zj的信息丧失越少。总之,变量d共同度刻画了因子全体对变量Zj信息解释的程度,是评价变量Zj信息丧失程度的重要指标。如果大多数原有变量的变量共同度均较高如高于0.8,那么说明提取的因子能够反映原有变量的大局部信息80以上信息,仅有较少的信息丧失,因子分析的效果较好。因子,变量共同度是衡量因子分析效果的重要依据。因子的方差奉献特征值eigenvaluen2因子的方差奉献特征值的数学定义为:Si2aji,该式说明,因子Fi的方差j1奉献是因子载荷矩阵A中第i列元素的平方和。因子Fi的方差奉献反映了因子Fi对原有变

12、量总方差的解释能力。该值越高,说明相应因子的重要性越高。因此,因子的方差奉献和方差奉献率是衡量因子重要性的关键指标。为了便于说明,以三个变量抽取两个共同因素为例,三个变量的线性组合分别为:ZiaiiFiai2F2U1Z2a21F1a22F2Z3a31 F1a32F2转换成因素矩阵如下:变量Fi共同因AF2共同因素二共同性h2唯一因素d2Xiaiiai222aiiai21h:X2a21a2222a21a221h22X3a3ia3222a3ia321h32特征值222aiia21a31222aiia2ia3i解释量222aiia2ia3i222aiia2ia3i33所谓共同性,就是每个变量在每个共

13、同因素之负荷量的平方总和一横列中所有因素负荷量的平方和,也就是个别变量可以被共同因素解释的变异量百分比,这个值是个别变量与共同因素间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因素之间关系程度。而各变量的唯一因素大小就是1减掉该变量共同性的值。在主成分分析中,有多少个原始变量便有多少个“ponent成分,所以共同性会等于1,没有唯一因素。至于特征值是每个变量在某一共同因素之因素负荷量的平方总和一直行所有因素负荷量的平方和。在因素分析之共同因素抽取中,特征值大的共同因素会最先被抽取,其次是次大者,最后抽取的共同因素之特征值最小,通常会接近0在主成分分析中,有几个题项,便有几个成分,因

14、而特征值的总和刚好等于变量的总数。将每个共同因素的特征值除以总题数,为此共同因素可以解释的变异量,因素分析的目的,即在因素构造的简单化,希望以最少的共同因素,能对总变异量作最大的解释,因而抽取的因素越少越好,但抽取因素之累积解释的变异量那么越大越好。3、社会科学中因素分析通常应用在三个层面:1显示变量间因素分析的组型pattern2侦测变量间之群组clusters,每个群组所包括的变量彼此相关很高,同构型较大,亦即将关系密切的个别变量合并为一个子群。3减少大量变量数目,使之称为一组涵括变量较少的统计自变量称为因素每个因素与原始变量间有某种线性关系存在,而以少数因素层面来代表多数、个别、独立的变

15、量。因素分析具有简化数据变量的功能,以较少层面来表示原来的数据构造,它根据变量间彼此的相关,找出变量间潜在的关系构造,变量间简单的构造关系称为“成份ponents或“因素factors.三、因素分析的主要方式围绕浓缩原有变量提取因子的核心目标,因子分析主要涉及以下五大根本步骤:1、因子分析的前提条件由于因子分析的主要任务之一是对原有变量进展浓缩,即将原有变量中的信息重叠局部提取和综合成因子,进而最终实现减少变量个数的目的。因此它要求原有变量之间应存在较强的相关关系。否那么,如果原有变量相互独立,相关程度很低,不存在信息重叠,它们不可能有共同因子,那么也就无法将其综合和浓缩,也就无需进展因子分析

16、。本步骤正是希望通过各种方法分析原有变量是否存在相关关系,是否适合进展因子分析。spsSI供了四个统计量可帮助判断观测数据是否适合作因子分析:1计算相关系数矩阵CorrelationMatrix在进展提取因子等分析步骤之前,应对相关矩阵进展检验,如果相关矩阵中的大局部相关系数小于0.3,那么不适合作因子分析;当原始变量个数较多时,所输出的相关系数矩阵特别大,观察起来不是很方便,所以一般不会采用此方法或即使采用了此方法,也不方便在结果汇报中给出原始分析报表。2计算反映象相关矩阵Anti-imagecorrelationmatrix反映象矩阵重要包括负的协方差和负的偏相关系数。偏相关系数是在控制了

17、其他变量对两变量影响的条件下计算出来的净相关系数。如果原有变量之间确实存在较强的相互重叠以及传递影响,也就是说,如果原有变量中确实能够提取出公共因子,那么在控制了这些影响后的偏相关系数必然很小。反映象相关矩阵的对角线上的元素为某变量的MSAMeasureofSampleAdequacy统计量,其数学定义为:2rijMSAi-9其中,rj是变量Xi和其他变量Xjji间的简单相关系rjPjjiji数,Pj是变量Xjji在控制了剩余变量下的偏相关系数。由公式可知,某变量Xi的MSAi统计量的取值在0和1之间。当它与其他所有变量间的简单相关系数平方和远大于偏相关系数的平方和时,MSAi值接近1。MSA

18、i值越接近1,意味变量Xi与其他变量间的相关性越强;当它与其他所有变量间的简单相关系数平方和接近0时,MSAi值接近0。MSAi值越接近0,意味变量Xi与其他变量间的相关性越弱。观察反映象相关矩阵,如果反映象相关矩阵中除主对角元素外,其他大多数元素的绝对值均小,对角线上元素的值越接近1,那么说明这些变量的相关性较强,适合进展因子分析。与1中最后所述理由一样,一般少采用此方法。3巴特利特球度检验BartletttestofsphericityBartlett球体检验的目的是检验相关矩阵是否是单位矩阵identitymatrix,如果是单位矩阵,那么认为因子模型不适宜。Bartlett球体检验的虚

19、无假设为相关矩阵是单位阵,如果不能拒绝该假设的话,就说明数据不适合用于因子分析。一般说来,显著水平值越小1is5ingValliesExdudeg第晟对踞Eweludeewesairwis4Replace则看hmeerCoefficientDi即I即FormatVSortedbysize*Suppiessabsolutevalueslessthan:1.1C|按Continue按钮,再按OK确定五、因素分析的结果解释1 .报表1KMO测度和Bartlett球形检验表KMOandBartlettsTestKaiser-Meyer-OlkinMeasureofSamplingAdequacy.85

20、7BartlettsTestofApprox.Chi-Square1187.740Sphericitydf231Sig.000KMO是Kaiser-Meyer-Olkin的取样适当性量数。KMO测度的值越高接近1.0时,说明变量间的共同因子越多,研究数据适合用因子分析。通常按以下标准解释该指标值的大小:KMO值到达0.9以上为非常好,0.80.9为好,0.70.8为一般,0.60.7为差,0.50.6为很差。如果KMO测度的值低于0.5时,说明样本偏小,需要扩大样本,此处的KMO值为0.857,表示适合进展因素分析。Bartlett球体检验的目的是检验相关矩阵是否是单位矩阵identityma

21、trix,如果是单位矩阵,那么认为因子模型不适宜。Bartlett球体检验的虚无假设为相关矩阵是单位阵,如果不能拒绝该假设的话,就说明数据不适合用于因子分析。一般说来,显著水平值越小0.05说明原始变量之间越可能存在有意义的关系,如果显著性水平很大如0.10以上可能说明数据不适宜于因子分析。本例中,Bartlett球形检验的2值为1187.740自由度为231,伴随概率值为0.0000.01,到达了显著性水平,说明拒绝零假设而承受备择假设,即相关矩阵不是单位矩阵,代表母群体的相关矩阵间有共同因素存在,适合进展因素分析。2 .报表2共同因子方差共同性表munalitiesInitialExtra

22、ctiona11.000.719a21.000.656a31.000.734a41.000.675a51.000.612a61.000.755a71.000.631a81.000.572a91.000.706a101.000.784a111.000.756a121.000.774a131.000.564a141.000.706a151.000.662a161.000.500a171.000.748a181.000.554a191.000.502a201.000.767a211.000.654a221.000.471ExtractionMethod:PrincipalponentAnalysis

23、.上表报告的是共同因子方差,即说明每个变量被解释的方差量。初始共同因子方差Initialmunalities是每个变量被所有成份或因子解释的方差估计量。对于主成份分析法来说,它总是等于1,因为有多少个原始变量就有多少个成份munalitie,因此共同性会等于1。抽取共同因子方差是指因子解中每个变量被因子或成份解释的方差估计量。这些共数值小就说明该变量不适合作因同因子方差是用来预测因子的变量的多重相关的平方子,可在分析中将其排除。3 .报表3.1旋转前总的解释方差TotalVarianceExplainedponentTotalInitialEigenvaluesExtractionSumsof

24、SquaredLoadings%ofVarianceCumulative%Total%ofVarianceCumulative%18.14537.02437.0248.14537.02437.02422.72812.40049.4242.72812.40049.42431.3005.90855.3321.3005.90855.33241.2625.73661.0681.2625.73661.06851.0664.84565.9131.0664.84565.9136.9224.19370.1067.8693.95174.0578.7403.36577.4229.6813.09680.51810.

25、6202.81883.33611.5262.39185.72712.4922.23587.96213.4221.91989.88214.4101.86491.74615.3431.56093.30616.2981.35494.66117.2581.17295.83318.2491.13496.96619.211.95797.92320.176.79898.72121.146.66499.38522.135.615100.000ExtractionMethod:PrincipalponentAnalysis.上表叫做总的解释方差表。左边第一栏为各成份ponent的序号,共有22个变量,所以有22

26、个成份。第二大栏为初始特征值,共由三栏构成:特征值、解释方差和累积解释方差。Total栏为各成份的特征值,栏中只有5个成份的特征值超过了1;其余成份的特征值都没有到达或超过1。%ofVariance栏为各成份所解释的方差占总方差的百分比,即各因子特征值占总特征值总和的百分比。Cumulative%栏为各因子方差占总方差的百分比的累计百分比。如在%ofVariance栏中,第一和第二成份的方差百分比分别为37.024、12.400,而在累计百分比栏中,第一成份的累计百分比仍然为37.024,第二成份的累计方差百分比为49.424,即是两个成份的方差百分比的和37.024+12.400。第三大栏为

27、因子提取的结果,未旋转解释的方差。第三大栏与第二大栏的前五行完全一样,即把特征值大于1的四个成份或因子单独列出来了。这四个特征值由大到小排列,所以第一个共同因子的解释方差最大。4 .报表3.2旋转后总的解释方差TotalVarianceExplainedponentRotationSumsofSquaredLoadingsTotal%ofVarianceCumulative%15.11323.24323.24323.91717.80641.04932.0359.24950.29841.7287.85658.15451.7077.75965.913678910111213141516171819

28、202122ExtractionMethod:PrincipalponentAnalysis.第四大栏为旋转后解释的方差。方便显示起见,放在了表3.1下面,作为表3.2Total栏为旋转后的特征值。与旋转前的Total栏相比,不难发现,四个成份的特征值有所变化。旋转前的特征值从8.145到1.066,最大特征值与最小特征值之间的差距比拟大,而旋转后的特征值相对集中。尽管如此,旋转前、后的总特征值没有改变,最后的累计方差百分比也没有改变,让然为65.913%。5 .表4碎石图碎石图和结果3的被解释的总方差的作用一样,都是为了确定因子的数目。从碎石图可以看出,从第6个因子开场,以后的曲线变得比拟平

29、缓,最后接近一条直线。据此,可以抽取5个因子。最后决定抽取多少个因子,还要看后面的结果。6 .表5未旋转成份矩阵显示全部载荷ponentMatrix(a)12ponent345a6.796.273.065-.194.071a12-.734.354.253.178.119a3.731.419-.030-.150.019a1.730.391-.104-.137.061a8.727.108-.137-.040.106a10-.726.355-.145.332.014a2.682.397-.139-.118-.011a20.653.042.095.544-.184a11-.637.505.216.15

30、8.156a5.635.413-.171-.005.094a7.598.270-.295.236.242a22.567.115-.223.164-.243a17.567-.181.426.247-.390a9-.547.094-.378.193.467a19.527.053.397.146.206a13-.527.509.066.052-.142a14-.545.607-.030.164-.113a15-.455.561.332-.142-.093a4.501.556.255-.224-.003a18.375-.130.469.083.413a21.516.031-.116.599-.123a

31、16-.366.278-.209-.196-.455ExtractionMethod:PrincipalponentAnalysis.a5ponentsextracted.上表的成份矩阵是每个变量在未旋转的成份或因子上的因子负荷量。比方a60.796Fi0.273F20.065F30.194F40.071F5。如果如下列图所示,在因子分析的options选项卡选项中选择Suppressabsolutevalueslessthan选项,那么其中小于0.10的因子负荷量将不被显示,这样将使得表格更加清晰、明了。比方每个数字代表了该变量与未旋转的因子之间的相关,这些相关有助于解释各个因子。也就是说,

32、如果一个变量在某个因子上有较大的负荷,就说明可以把这个变量纳入该因子。但是常常会有这种情况,很多的变量同时在几个未旋转的因子上有较大的负荷,这就使得解释起来比拟困难,因此查看旋转以后的结果能较好地解决这个问题。|匚口喃门廿四Factorinalyffis:OpEibn厚Mis?inQValuesEMGludfcases|i?tiseExcludecases口日1科皎日Replacewithmean-CaefhcientDisplayFormatYSortedbysize5SuppressabsolutevaluesIe舞than:7.表7旋转的成份矩阵RotatedponentMatrix(a

33、)12ponent345a3.819-.109.122.164a1.815-.152.135a2.778-.129.160a6.772-.231.221.227a5.742.222a4.718.192.162.305a8.616-.352.207.157a7.598-.156.403.149-.256a11-.176.814-.142-.204a12-.356.769-.157-.174a14.767-.299-.165a15.737-.300.140a13.691-.262a10-.336.669-.260-.387a21.216-.137.758.110a20.289-.139.737.226.265a22.428-.238.441-.133.137a18.120-.120.715.121a16.289-.138-.623a19.313.188.557.233a9-.250.259-.755a17-.215.437.242.667ExtractionMethod:PrincipalponentAnalysis.RotationMethod:VarimaxwithKaiserNormalization.ARotationc

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!