SPSS因子分析法例子解释

上传人:z****2 文档编号:195396476 上传时间:2023-03-16 格式:DOCX 页数:19 大小:226.42KB
收藏 版权申诉 举报 下载
SPSS因子分析法例子解释_第1页
第1页 / 共19页
SPSS因子分析法例子解释_第2页
第2页 / 共19页
SPSS因子分析法例子解释_第3页
第3页 / 共19页
资源描述:

《SPSS因子分析法例子解释》由会员分享,可在线阅读,更多相关《SPSS因子分析法例子解释(19页珍藏版)》请在装配图网上搜索。

1、因子分析的基本概念与步骤一、因子分析的意义在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、 完整的把握与认识。例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动 的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、 获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业 基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。 虽然收集这些数据需要投入许多精力 ,虽然它们能够较为全面精确地描述事物 ,但在实际 数据建模时,这些变量未必能真正发挥预期的作用,“投入”与“产出”并非呈合理的正

2、比, 反而会给统计分析带来很多问题,可以表现在:计算量的问题由于收集的变量较多,如果这些变量都参与数据建模 ,无疑会增加分析过程中的计算 工作量。虽然,现在的计算技术已得到了迅猛发展,但高维变量与海量数据仍就是不容忽视 的。变量间的相关性问题收集到的诸多变量之间通常都会存在或多或少的相关性。例如,高校科研状况评价中 的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的 专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之 间信息的高度重叠与高度相关会给统计方法的应用带来许多障碍。例如,多元线性回归分 析中,如果众多解释变量之间存在较强的相关性,

3、即存在高度的多重共线性,那么会给回归 方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。类似的问题 还有很多。为了解决这些问题,最简单与最直接的解决方案就是削减变量的个数 ,但这必然又会 导致信息丢失与信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法, 它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正 式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。因子分析的概念起源于20世纪初Karl Pearson与Charles Spearmen等人关于智力测 验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经

4、济学等领域, 并因此促进了理论的不断丰富与完善。因子分析以最少的信息丢失为前提 ,将众多的原有变量综合成较少几个综合指标 ,名 为因子。通常,因子有以下几个特点:因子个数远远少于原有变量的个数原有变量综合成少数几个因子之后 ,因子将可以替代原有变量参与数据建模 ,这将大大减少分析过程中的计算工作量。因子能够反映原有变量的绝大部分信息 因子并不就是原有变量的简单取舍 ,而就是原有变量重组后的结果,因此不会造成原 有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。因子之间的线性关系并不显著 由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决 变量多重共线性等给分析应用

5、带来的诸多问题。因子具有命名解释性通常,因子分析产生的因子能够通过各种方式最终获得命名解释性。因子的命名解释 性有助于对因子分析结果的解释评价,对因子的进一步应用有重要意义。例如,对高校科研 情况的因子分析中,如果能够得到两个因子,其中一个因子就是对科研人力投入、经费投 入、立项项目数等变量的综合,而另一个就是对结项项目数、发表论文数、获奖成果数等 变量的综合,那么,该因子分析就就是较为理想的。因为这两个因子均有命名可解释性,其中 一个反映了科研投入方面的情况 ,可命名为科研投入因子 ,另一个反映了科研产出方面的 情况,可命名为科研产出因子。总之,因子分析就是研究如何以最少的信息丢失将众多原有

6、变量浓缩成少数几个因子, 如何使因子具有一定的命名解释性的多元统计分析方法。二、因子分析的基本概念1、因子分析模型因子分析模型中,假定每个原始变量由两部分组成:共同因子(common factors)与唯一 因子(unique factors)。共同因子就是各个原始变量所共有的因子,解释变量之间的相关关 系。唯一因子顾名思义就是每个原始变量所特有的因子,表示该变量不能被共同因子解释 的部分。原始变量与因子分析时抽出的共同因子的相关关系用因子负荷 (factor loadings) 表示。因子分析最常用的理论模式如下:Z 二 a F + a F + a F + + a F + U (j=l,2,

7、3.,n,n 为原始变量总数)jjl 1j 2 2 j 3 3jm m j可以用矩阵的形式表示为Z二AF + U。其中F称为因子,由于它们出现在每个原始变 量的线性表达式中(原始变量可以用 X 表示,这里模型中实际上就是以 F 线性表示各个原 j始变量的标准化分数Z ),因此又称为公共因子。因子可理解为高维空间中互相垂直的m j个坐标轴,A称为因子载荷矩阵,a (j二1,2,3.n,i二1,2,3.m)称为因子载荷,就是第j个原始 ji变量在第i个因子上的负荷。如果把变量Z瞧成m维因子空间中的一个向量,则a表示 jjiZ在坐标轴F上的投影,相当于多元线性回归模型中的标准化回归系数;U称为特殊因

8、子, ji表示了原有变量不能被因子解释的部分,其均值为0,相当于多元线性回归模型中的残差。 其中,(1) Z 为第 j 个变量的标准化分数;j(2) F (i=1,2,m)为共同因素;i(3) m 为所有变量共同因素的数目;(4) U为变量Z的唯一因素;jj(5) a 为因素负荷量。ji2、因子分析数学模型中的几个相关概念 因子载荷(因素负荷量 factor loadings) 所谓的因子载荷就就是因素结构中,原始变量与因素分析时抽取出共同因素的相关。可以证明,在因子不相关的前提下,因子载荷a就是变量Z与因子F的相关系数,反映了ji j i变量Zj与因子Fi的相关程度。因子载荷a值小于等于1,

9、绝对值越接近1,表明因子F与 jii变量Z的相关性越强。同时,因子载荷a也反映了因子F对解释变量Z的重要作用与程 jjiij度。因子载荷作为因子分析模型中的重要统计量,表明了原始变量与共同因子之间的相关 关系。因素分析的理想情况,在于个别因素负荷量a不就是很大就就是很小,这样每个变 ji 量才能与较少的共同因素产生密切关联,如果想要以最少的共同因素数来解释变量间的关 系程度,则U彼此间或与共同因素间就不能有关联存在。一般说来,负荷量为0、3或更大 j 被认为有意义。所以,当要判断一个因子的意义时,需要查瞧哪些变量的负荷达到了 0、 3 或 0、 3 以上。变量共同度(共同性,Communali

10、ty)变量共同度也就就是变量方差,就就是指每个原始变量在每个共同因子的负荷量的平 方与,也就就是指原始变量方差中由共同因子所决定的比率。变量的方差由共同因子与唯 一因子组成。共同性表明了原始变量方差中能被共同因子解释的部分,共同性越大,变量能 被因子说明的程度越高,即因子可解释该变量的方差越多。共同性的意义在于说明如果用 共同因子替代原始变量后 ,原始变量的信息被保留的程度。因子分析通过简化相关矩阵 , 提取可解释相关的少数因子。一个因子解释的就是相关矩阵中的方差,而解释方差的大小 称为因子的特征值。一个因子的特征值等于所有变量在该因子上的负荷值的平方总与。变量Z的共同度h 2的数学定义为:h

11、 2 = a 2,该式表明变量Z的共同度就是因子载荷 jjiji =1矩阵A中第j行元素的平方与。由于变量Z的方差可以表示成h2 + u2 = 1,因此变量Z的 jj方差可由两个部分解释:第一部分为共同度h 2,就是全部因子对变量Z方差解释说明的比j例,体现了因子全体对变量Z的解释贡献程度。变量共同度h 2越接近1,说明因子全体解释j说明了变量Z的较大部分方差,如果用因子全体刻画变量Z,则变量Z的信息丢失较少; jjj第二部分为特殊因子U的平方,反应了变量Z方差中不能由因子全体解释说明的比例,u2j越小则说明变量Z的信息丢失越少。j总之,变量d共同度刻画了因子全体对变量Z信息解释的程度,就是评

12、价变量Z信息 jj 丢失程度的重要指标。如果大多数原有变量的变量共同度均较高(如高于 0、 8),则说明提 取的因子能够反映原有变量的大部分信息(80以上)信息,仅有较少的信息丢失,因子分析 的效果较好。因子,变量共同度就是衡量因子分析效果的重要依据。因子的方差贡献(特征值 eigenvalue)n2因子的方差贡献(特征值)的数学定义为:S 2a ,该式表明,因子F的方差贡献就i ji ij=1是因子载荷矩阵A中第i列元素的平方与。因子F的方差贡献反映了因子F对原有变量 ii总方差的解释能力。该值越高,说明相应因子的重要性越高。因此,因子的方差贡献与方差 贡献率就是衡量因子重要性的关键指标。为

13、了便于说明,以三个变量抽取两个共同因素为例,三个变量的线性组合分别为:Z = a F + a F + U1 11 1 12 2 1Z = a F + a F + U2 21 1 22 2 2Z = a F + a F + U3 31 1 32 2 3转换成因素矩阵如下:FF共同性唯一因素变量12(h 2)(d 2)(共同因素一)(共同因素二)Xaaa 2 + a 21 - h 21111211 121Xaaa 2 + a 21 - h 22212221 222Xaaa 2 + a 21 - h 23313231323特征值a 2 + a 2 + a 2a 2 + a 2 + a 2112131

14、112131解释量a 2 + a 2 + a 2a 2 + a 2 + a 21 1o iqi1 1Q1QI112 131112 13133所谓共同性,就就是每个变量在每个共同因素之负荷量的平方总与 (一横列中所有因 素负荷量的平方与),也就就是个别变量可以被共同因素解释的变异量百分比 ,这个值就是 个别变量与共同因素间多元相关的平方。从共同性的大小可以判断这个原始变量与共同 因素之间关系程度。而各变量的唯一因素大小就就是1减掉该变量共同性的值。 (在主成 分分析中,有多少个原始变量便有多少个“ component 成分,所以共同性会等于1,没有唯 一因素)。至于特征值就是每个变量在某一共同因

15、素之因素负荷量的平方总与 (一直行所有因 素负荷量的平方与)。在因素分析之共同因素抽取中 ,特征值大的共同因素会最先被抽取, 其次就是次大者,最后抽取的共同因素之特征值最小,通常会接近 0(在主成分分析中,有几 个题项,便有几个成分,因而特征值的总与刚好等于变量的总数)。将每个共同因素的特征 值除以总题数,为此共同因素可以解释的变异量,因素分析的目的,即在因素结构的简单化, 希望以最少的共同因素,能对总变异量作最大的解释,因而抽取的因素越少越好,但抽取因 素之累积解释的变异量则越大越好。3、社会科学中因素分析通常应用在三个层面:(1)显示变量间因素分析的组型(pattern)(2) 侦测变量间

16、之群组(clusters),每个群组所包括的变量彼此相关很高,同构型较大,亦 即将关系密切的个别变量合并为一个子群。(3) 减少大量变量数目 ,使之称为一组涵括变量较少的统计自变量 (称为因素),每个因 素与原始变量间有某种线性关系存在,而以少数因素层面来代表多数、个别、独立的变量。因素分析具有简化数据变量的功能 ,以较少层面来表示原来的数据结构 ,它根据变量 间彼此的相关 ,找出变量间潜在的关系结构,变量间简单的结构关系称为“成份”(components)或“因素(factors)、三、因素分析的主要方式围绕浓缩原有变量提取因子的核心目标,因子分析主要涉及以下五大基本步骤:1、因子分析的前提

17、条件由于因子分析的主要任务之一就是对原有变量进行浓缩,即将原有变量中的信息重叠 部分提取与综合成因子,进而最终实现减少变量个数的目的。因此它要求原有变量之间应 存在较强的相关关系。否则,如果原有变量相互独立,相关程度很低,不存在信息重叠,它们 不可能有共同因子,那么也就无法将其综合与浓缩,也就无需进行因子分析。本步骤正就是 希望通过各种方法分析原有变量就是否存在相关关系,就是否适合进行因子分析。SPSS 提供了四个统计量可帮助判断观测数据就是否适合作因子分析:(1) 计算相关系数矩阵 Correlation Matrix在进行提取因子等分析步骤之前 ,应对相关矩阵进行检验,如果相关矩阵中的大部

18、分 相关系数小于 0、 3,则不适合作因子分析;当原始变量个数较多时,所输出的相关系数矩阵 特别大,观察起来不就是很方便,所以一般不会采用此方法或即使采用了此方法 ,也不方便 在结果汇报中给出原始分析报表。(2) 计算反映象相关矩阵 Anti-image correlation matrix反映象矩阵重要包括负的协方差与负的偏相关系数。偏相关系数就是在控制了其她 变量对两变量影响的条件下计算出来的净相关系数。如果原有变量之间确实存在较强的 相互重叠以及传递影响,也就就是说,如果原有变量中确实能够提取出公共因子 ,那么在控 制了这些影响后的偏相关系数必然很小。反映象相关矩阵的对角线上的元素为某变

19、量的MSA(Measure of Sample Adequacy)统 计量,其数学定义为:工r 2 ijMSA = 存y ,其中,r就是变量x与其她变量x ( j丰i)间的简单相关系i 乙 r 2 + 乙 p 2ijijijijj知j知数, p就是变量x ( j丰i)在控制了剩余变量下的偏相关系数。由公式可知,某变量x的ijjiMSA 统计量的取值在0与 1之间。当它与其她所有变量间的简单相关系数平方与远大于i偏相关系数的平方与时,MSA值接近1。MSA值越接近1,意味变量x与其她变量间的相iii关性越强;当它与其她所有变量间的简单相关系数平方与接近0时,MSA值接近0MSA值ii越接近 0,

20、意味变量 x 与其她变量间的相关性越弱。i观察反映象相关矩阵,如果反映象相关矩阵中除主对角元素外 ,其她大多数元素的绝 对值均小,对角线上元素的值越接近 1,则说明这些变量的相关性较强,适合进行因子分析。 与(1)中最后所述理由相同,一般少采用此方法。(3) 巴特利特球度检验 Bartlett test of sphericityBartlett球体检验的目的就是检验相关矩阵就是否就是单位矩阵(identity matrix),如果 就是单位矩阵,则认为因子模型不合适。Bartlett球体检验的虚无假设为相关矩阵就是单位 阵,如果不能拒绝该假设的话,就表明数据不适合用于因子分析。一般说来,显著

21、水平值越小 (0、05)表明原始变量之间越可能存在有意义的关系,如果显著性水平很大(如 0、10以上) 可能表明数据不适宜于因子分析。(4) KMO(Kaiser-Meyer-Oklin Measure of Smapling Adequacy)KMO就是Kaiser-Meyer-Olkin的取样适当性量数KMO测度的值越高(接近1、0时), 表明变量间的共同因子越多,研究数据适合用因子分析。通常按以下标准解释该指标值的 大小:KMO值达到0、9以上为非常好,0、80、9为好,0、70、8为一般,0、60、7 为差,0、50、6为很差。如果KMO测度的值低于0、5时,表明样本偏小,需要扩大样本

22、。综上所述,经常采用的方法为巴特利特球度检验 Bartlett test of sphericity 与 KMO(Kaiser-Meyer-Oklin Measure of Smapling Adequacy)。2、抽取共同因子,确定因子的数目与求因子解的方法 将原有变量综合成少数几个因子就是因子分析的核心内容。本步骤正就是研究如何在样本数据的基础上提取与综合因子。决定因素抽取的方法,有“主成份分析法” (principal components analysis)、主轴法、一般化最小平方法、未加权最小平方法、最大概似法、 Alpha 因素抽取法与映象因素抽取法等。使用者最常使用的就是主成份分

23、析法与主轴法, 其中,又以主成份分析法使用最为普遍,在SPSS使用手册中,也建议研究者多采用主成份分 析法来估计因素负荷量(SPSS Inc,1998)。所谓主成份分析法,就就是以较少的成份解释原 始变量方差的较大部分。进行主成份分析时,先要将每个变量的数值转换成标准值。主成 份分析就就是用多个变量组成一个多维空间 ,然后在空间内投射直线以解释最大的方差 , 所得的直线就就是共同因子,该直线最能代表各个变量的性质,而在此直线上的数值所构 成的一个变量就就是第一个共同因子,或称第一因子(F)。但就是在空间内还有剩余的方 差,所以需要投射第二条直线来解释方差。这时,还要依据第二条准则,即投射的第二

24、条直线 与第一条直线成直交关系(即不相关),意为代表不同的方面。第二条直线上的数值所构成 的一个变量,称为第二因子(f2)。依据该原理可以求出第三、第四或更多的因子。原则上 因子的数目与原始变量的数目相同 ,但抽取了主要的因子之后,如果剩余的方差很小,就可 以放弃其余的因子,以达到简化数据的目的。因子数目的确定没有精确的定量方法,但常用的方法就是借助两个准则来确定因子的 个数。一就是特征值(eigenvalue)准则,二就是碎石图检验(scree test)准则。特征值准则就就 是选取特征值大于或等于 1 的主成份作为初始因子,而放弃特征值小于 1 的主成份。因为 每个变量的方差为 1,该准则

25、认为每个保留下来的因子至少应该能解释一个变量的方差,否 则达不到精简数据的目的。碎石检验准则就是根据因子被提取的顺序绘出特征值随因子 个数变化的散点图,根据图的形状来判断因子的个数。散点曲线的特点就是由高到低,先陡 后平,最后几乎成一条直线。曲线开始变平的前一个点被认为就是提取的最大因子数。后 面的散点类似于山脚下的碎石,可舍弃而不会丢失很多信息。3、使因子更具有命名可解释性通常最初因素抽取后 ,对因素无法作有效的解释。这时往往需要进行因子旋转(rotation),通过坐标变换使因子解的意义更容易解释。转轴的目的在于改变题项在各因素 负荷量的大小,转轴时根据题项与因素结构关系的密切程度 ,调整

26、各因素负荷量的大小,转 轴后,使得变量在每个因素的负荷量不就是变大(接近 1)就就是变得更小(接近0),而非转轴 前在每个因素的负荷量大小均差不多,这就使对共同因子的命名与解释变量变得更容易。 转轴后,每个共同因素的特征值会改变,但每个变量的共同性不会改变。常用的转轴方法, 有最大变异法(Varimax)、四次方最大值法(Quartimax)、相等最大值法(Equamax)、直接斜 交转轴法(Direct Oblimin)、Promax转轴法,其中前三者属于“直交转轴法(orthogonal rotations),在直交转轴法中,因素(成份)与因素(成份)间没有相关,亦即其相关为0,因素轴间

27、夹角为 90;而后二者(直接斜交转轴、 Promax 转轴法)属“斜交转轴” (oblique rotations), 采用斜交转轴法,表示因素与因素间彼此有某种程度的相关 ,亦即因素轴间的夹角不就是 90。直交转轴法的优点就是因素间提供的信息不会重叠 ,观察体在某一个因素的分数与 在其它因素的分数,彼此独立不相关;而其缺点就是研究者迫使因素间不相关 ,但在实际 情境中,它们彼此有相关的可能性很高。因而直交转轴方法偏向较多人为操控方式,不需 要正确响应现实世界中自然发生的事件(Bryman&Cramer,1997)。所谓直交旋转法(orthogonal rotations),就就是要求各个因子

28、在旋转时都要保持直角 关系,即不相关。在直交旋转时,每个变量的共同性(commonali ty)就是不变的。不同的直 交旋转方法有不同的作用。在直交旋转法中,常用于社会科学研究的方式就是Varimax旋 转法。该方法就是在旋转时尽量弄清楚在每一个因子上各个变量的因子负荷情况,也即让 因子矩阵中每一列的 的值尽可能变成1 或0,该旋转法的作用就是突出每个因子的性质, 可以更清楚哪些变量就是属于它的。由此可见,Varimax旋转法可以帮助找出多个因子, 以澄清概念的内容Quartimax旋转法可以则可以尽量弄清楚每个变量在各个因子上的负 荷情况,即让每个变量在某个因子上的负荷尽可能等于 1,而在其

29、它因子上则尽可能等于 0。该方法可以增强第一因子的解释力,而使其它因子的效力减弱。可见 Quartimax 旋转 法适合于找出一个最强效力的因子。Equamax旋转法则就是一种折中的做法,即尽可能简 化因子,也可弄清楚负荷情况。其缺点就是可能两方面都未照顾好。斜交旋转(oblique rotarion)方法就是要求在旋转时各个因子之间呈斜交的关系,表 示允许该因子与因子之间有某种程度上的相关。斜交旋转中,因子之间的夹可以就是任意 的,所以用斜交因子描述变量可以使因子结构更为简洁。选择直接斜交旋转时,必须指定 Delta值。该值的取值范围在0一1之间,0值产生最高相关因子,大的负数产生旋转的 结

30、果与直交接近。Promax斜交旋转方法也允许因子彼此相关,它比直接斜交旋转更快,因 此适用于大数据集的因子分析。综上所述,不同的因子旋转方式各有其特点。因此,究竟选择何种方式进行因子旋转 取决于研究问题的需要。如果因子分析的目的只就是进行数据简化,而因子的确切含义就 是什么并不重要,就应该选择直交旋转。如果因子分析的目的就是要得到理论上有意义的 因子,应该选择斜交因子。事实上,研究中很少有完全不相关的变量,所以,从理论上瞧斜 交旋转优于直交旋转。但就是斜交旋转中因子之间的斜交程度受研究者定义的参数的影 响,而且斜交选装中所允许的因子之间的相关程度就是很小的,因为没有人会接受两个高 度相关的共同

31、因子。如果两个因子确实高度相关,大多数研究者会选取更少的因子重新进 行分析。因此,斜交旋转的优越性大打折扣。在实际研究中,直交旋转(尤其就是 Varimax 旋转法)得到更广泛的运用。4、决定因素与命名转轴后,要决定因素数目,选取较少因素层面,获得较大的解释量。在因素命名与结果 解释上,必要时可将因素计算后之分数存储,作为其它程序分析之输入变量。5、计算各样本的因子得分因子分析的最终目标就是减少变量个数,以便在进一步的分析中用较少的因子代替 原有变量参与数据建模。本步骤正就是通过各种方法计算各样本在各因子上的得分,为进 一步的分析奠定基础。此外,在因素分析中,研究者还应当考虑以下几个方面(Br

32、yman&Cramer,1997):(1) 可从相关矩阵中筛选题项题项间如果没有显著的相关,或相关太小,则题项间抽取的因素与研究者初始构建的 层面可能差距很大。相对的题项间如果有极其显著的正/负相关,则因素分析较易构建成 有意义的内容。因素分析前,研究者可从题项间相关矩阵分布情形,简扼瞧出哪些题项间 有密切关系。(2) 样本大小因素分析的可靠性除与预试样本的抽样有关外,预样本数的多少更有密切关系。进行 因素分析时,预试样本应该多少才能使结果最为可靠,学者间没有一致的结论,然而多数 学者均赞同“因素分析要有可靠的结果,受试样本数要比量表题项数还多”,如果一个分 量表有40个预试题项,则因素分析时

33、,样本数不得少于40。此外,在进行因素分析时,学者Gorshch(1983)的观点可作为参考: 题项与受试者的比例最好为1:5; 受试总样本总数不得少于100人。如果研究主要目的在找出变量群中涵括何种因 素,样本数要尽量大,才能确保因素分析结果的可靠性。(3) 因素数目的挑选进行因素分析,因素数目考虑与挑选标准,常用的准则有两种:一就是学者Kaiser所 提的准则标准:选取特征值大于1的因素,Kaiser准则判断应用时,因素分析的题项数最 好不要超过30题,题项平均共同性最好在0、70以上,如果受试样本数大于250位,则平 均共同性应在0、60以上(Stevens,1992),如果题项数在50

34、题以上,有可能抽取过多的共 同因素(此时研究者可以限定因素抽取的数目);二为CATTELL(1996)所倡导的特征值图形 的陡坡检验(scree test),此图根据最初抽取因素所能解释的变异量高低绘制而成。“陡坡石” (scree)原就是地质学上的名词,代表在岩石斜坡底层发现的小碎石,这些 碎石价值性不高。应用于统计学之因素分析中,表示陡坡图底端的因素不具重要性,可以 舍弃不用。因而从陡坡图的情形,也可作为挑选因素分析数目的标准。在多数的因素分析中,根据Kaiser选取的标准,通常会抽取过多的共同因素,因而陡 坡图就是一个重要的选取准则。在因素数目准则挑选上,除参考以上两大主要判断标准外,

35、还要考虑到受试者多少、题项数、变量共同性的大小等。四、因素分析的操作说明Statistics/Data Reduction/Factor(统计分析/数据缩减/因子)其中五个按钮内的图标意义如下:Descriptives( 描 述 性 统 计 量 ) 按 钮 , 会 出 现 “ Factor-tpr已:r;3L Liitl已;ht filo delNixed Modelsan1an2an3542413251534834.1uaCor re ipLirLdenc e Aii:il7E i -.Uj111 m :1 5 c:al i ng.一322724411711Multiple EeEporLE

36、eM1 e e i ng y:iliie Ari:ilyEi e.CulTipleK S:iITipl 已弓出现“Factor Analysis”(因子分析)对话框,将左边框中鉴别度达显著性的ala22 选如右边“Variables”(变量)下的空框中。Analysis:Descriptives ”(因子分析:描述性统计量)对话窗口1. “Statistics”(统计量)选项框(1)“IZIUnivariate descriptives”(单变量描述性统计量):显示每一题项的平均 数、标准差。(2)“Zlnitial solution”(未转轴之统计量):显示因素分析未转轴前之共同性 (com

37、munality)、特征值(eigenvalues)、变异数百分比及累积百分比。2. “Correla tion Ma trie”(相关矩阵)选项框(1)“ZCoefficients”(系数):显示题项的相关矩阵;(2)“Insignificance levels(显著水准):求出前述矩阵的显著水准;“IZIDeterminant”(行列式):求出前述相关矩阵的行列式值; “ZKMO and Bartlett s test of sphericity”(KM0 与 Bartlett 的球形检定): 显示KMO抽样适当性参数与Bartlett的球形检定;(5)“Zlnverse”(倒数模式):求

38、出相关矩阵的反矩阵;(6)“ZReproduced”(重制的):显示重制相关矩阵,上三角形矩阵代表残差值;而主对 角线及下三角形代表相关系数;(7)“ZAnti-image”(反映象):求出反映象的共变量及相关矩阵;在 “Factor Analysis:Descriptives ”对话窗口中,选取“ Zlnitial solution”、 “KMO and Bartlett s test of sphericity” 二项。Statistics Univariate descriptives破 Initial salutionCorrelation MatrixCoefficientsInve

39、rse 5.ignific3rice levels ReproducedDetermirantAnti-image Illi Illi IlliIlli Illi IlliIlli Illi Illi p 00 and Bartletts test of sphericity+ Ext rac tion(萃取)按钮,会出现Factor Analysis:Ex tract ion”(因子分析:萃取)对话窗口1. “Method” (方法)选项框:下拉式选项内有 7种选取因素的方法(1)“Principal components”法:主成份分析法抽取因素,此为SPSS内定方法;(2)“Unweig

40、hted least squares”法:未加权最小平方法;(3)“Ggeneralized least square”法:一般化最小平方法;(4)“Mmximum likelihood”法:最大概似法;(5)“Principal-axis fac to ring ” 法:主轴法;(6)“Alpha fac to ring ”法:因素抽取法;(7)“Image fac to ring ”法:映象因素抽取法;2. “Analyze”(分析)选项方框(1)“OCorrelation matrix(相关矩阵):以相关矩阵来抽取因素;(2)“OCovariance matrix”(共变异系数矩阵):以

41、共变量矩阵来抽取因素。3. “Display”(显示)选项方框(1)“ZUnrotated factor solution” (未旋转因子解):显示未转轴时因素负荷量、 特征值及共同性;(2)“ZScreet plot”(陡坡图):显示陡坡图4. Extract”(萃取)选项方框(1)“Eigenvalue over: ”(特征值):后面的空格内定为1,表示因素抽取时,只抽取 特征值大于1者,使用者可随意输入0至变量总数之间的值;(2)“Number of factors” (因子个数):选取此项时,后面的空格内输入限定之因素个数。在“Factor Analysis:Extraction”对话

42、窗口中,抽取因素方法选择Principal components,选取OCorrelation matrix、并勾选 口Unrotated factor solution、 Screet plot等项,在抽取因素时限定在特征值大于1者,在Eigenvalue over: 后面的空格内输入1。Rotation(萃取)按钮,会出现“Factor Analysis:Rotation”(因子分 析:旋转)对话窗口1. “Method”(方法)选项框内有6中因素转轴方法(1) “ONone” :不需要转轴;(2) “OVarimax” :最大变异法,属正交转轴法之一;(3) “OQuarimax” :四

43、次方最大值法,属正交转轴法之一;(4) “OEquamax” :相等最大值法,属正交转轴法之一;(5) “ODirect Oblimin” :直接斜交转轴法,属斜交转轴法之一;(6) “OPromax” :Promax转轴法,属斜交转轴法之一。2. “Display” (显示)选项框:(1) “DRotated solution”(转轴后的解):显示转轴后的相关信息,正交转轴显示因 素组型(patt ern)矩阵及因素转换矩阵;斜交转轴则显示因素组型、因素结构矩阵与因素 相关矩阵。(2) “Loading plot”(因子负荷量):绘出因素的散布图。3. “Maximum Iterations

44、 for Convergence ” :转轴时执行的叠代(iterations)最多次数,后 面内定的数字 25(算法执行转轴时,执行步骤的次数上限)。在 “ Factor Analysis:Rotation对话窗中,选取 “ OVarimax ”、“ DRotated solution”等项。研究者要勾选“DRotated solution”选项,才能显示转轴后的相关信 息。ContinueC aricelHelpuartimaKquamax PromaHKappa |TDirect OblinninDelta: |0D isplay眉 Rotated solution Loading pl

45、ot(s)MaMimum Iterations for Convergence: |25“Score(分数)按钮1. “IZISave as variable(因素存储变量)框 勾选时可将新建立的因素分数存储至数据文件中 ,并产生新的变量名称 (内定为fact_l、fact_2等)。在“Method框中表示计算因素分数的方法有三种:“ORegression” :使用回归法;(2) “OBartlett” :使用 Bartlette 法;(3) “OAnderson-Robin” :使用 Anderson-Robin 法;2. “ZDisplay factor score coefficient

46、 matr ix ” (显示因素分数系数矩阵)选项 勾选时可显示因素分数系数矩阵。“Options(选项)按钮,会出现Factor Analysis:Options(因子分析:选项)对话窗口1. “Missing Values(遗漏值)框选项:遗漏值的处理方式。(1)“OExclude cases listwise”(完全排除遗漏值):观察值在所有变量中没有遗漏 者才加以分析;(2)“OExclude cases pairwise(成对方式排除):在成对相关分析中出现遗漏值的 观察值舍弃;(3)“OReplace with mean(用平均数置换):以变量平均值取代遗漏值。2. “Coeffi

47、cient Display Format(系数显示格式)框选项:因素负荷量出现的格式。(1)“ZSorted by size(依据因素负荷量排序):根据每一因素层面之因素负荷量的 大小排序;(2)“ZSuppress absolute values less thar” (绝对值舍弃之下限):因素负荷量小 于后面数字者不被显示,内定的值为0、1。在Factor Analysis:Options对话窗口中,勾选“OExclude cases listwise”、 “Sorted by size ”等项,并勾选“ ZSuppress absolute values less than ” 选项,

48、正式的论文研究中应呈现题项完整的因素负荷量较为适宜。Factor Analysis: OptionsContinue匚 ancelMissing Values& Ewclude ta?es listwiseEMclude tases pairwiseR.eplce wilh meanCoeffi c:i 亡 nt D ispldv Format P Sorted by size硬 Suppress absolute values less than:按 Continue 按钮,再按 OK 确定。五、因素分析的结果解释1.报表1KMO测度与Bartlett球形检验表KMO and Bartlet

49、ts TestKaiser-Meyer-Olkin Measure of SamplingAdequacy、857Bartletts Test ofApprox、 Chi-Square1187、 740Sphericitydf231Sig、000KMO就是Kaiser-Meyer-Olkin的取样适当性量数KMO测度的值越高(接近1、0时), 表明变量间的共同因子越多,研究数据适合用因子分析。通常按以下标准解释该指标值的 大小:KMO值达到0、9以上为非常好,0、80、9为好,0、70、8为一般,0、60、7 为差,0、50、6为很差。如果KMO测度的值低于0、5时,表明样本偏小,需要扩大样本

50、, 此处的KMO值为0、857,表示适合进行因素分析。Bartlett球体检验的目的就是检验相关 矩阵就是否就是单位矩阵(identity matrix),如果就是单位矩阵,则认为因子模型不合适。 Bartlett 球体检验的虚无假设为相关矩阵就是单位阵,如果不能拒绝该假设的话,就表明数 据不适合用于因子分析。一般说来,显著水平值越小(0、 05)表明原始变量之间越可能存 在有意义的关系,如果显著性水平很大(如 0、 10 以上)可能表明数据不适宜于因子分析。本例中,Bartlett球形检验的2值为1187、740(自由度为231),伴随概率值为0、0000、01, 达到了显著性水平,说明拒绝

51、零假设而接受备择假设,即相关矩阵不就是单位矩阵,代表母 群体的相关矩阵间有共同因素存在,适合进行因素分析。2.报表2共同因子方差(共同性)表CommunalitiesInitial Extractiona11、000、719a21、000、656a31、000、734a41、000、675a51、000、612a61、000、755a71、000、631a81、000、572a91、000、706a101、000、784all1、000、756a121、000、774a131、000、564a141、000、706a151、000、662a161、000、500a171、000、748a181

52、、000、554a191、000、502a201、000、767a211、000、654a221、000、471Extraction Method: Principal Component Analysis、 上表报告的就是共同因子方差,即表明每个变量被解释的方差量。初始共同因子方差 (Initial Communalities)就是每个变量被所有成份或因子解释的方差估计量。对于主成份分 析法来说,它总就是等于1,因为有多少个原始变量就有多少个成份(Communalitie),因此共 同性会等于 1。抽取共同因子方差就是指因子解中每个变量被因子或成份解释的方差估计量。这些 共同因子方差就是用来

53、预测因子的变量的多重相关的平方。数值小就说明该变量不适合 作因子,可在分析中将其排除。3报表3、1旋转前总的解释方差Total Variance ExplainedComponentTotalInitial EigenvaluesExtraction Sums of Squared Loadings% of VarianceCumulative %Total% of VarianceCumulative %18、14537、 02437、0248、14537、 02437、 02422、72812、 40049、4242、72812、 40049、 42431、3005、90855、3321、

54、3005、90855、 33241、2625、73661、0681、2625、73661、 06851、0664、84565、9131、0664、84565、 9136、9224、19370、1067、8693、95174、0578、7403、36577、4229、6813、09680、51810、6202、81883、33611、5262、39185、72712、4922、23587、96213、4221、91989、88214、4101、86491、74615、3431、56093、30616、2981、35494、66117、2581、17295、83318、2491、13496、966

55、19202122、211、95797、 923、176、79898、 721、146、66499、 385、135、615100、 000Extraction Method: Principal Component Analysis、上表叫做总的解释方差表。左边第一栏为各成份(Component)的序号,共有22个变量, 所以有 22 个成份。第二大栏为初始特征值,共由三栏构成:特征值、解释方差与累积解释 方差Total栏为各成份的特征值,栏中只有5个成份的特征值超过了 1;其余成份的特征值 都没有达到或超过1%of Variance栏为各成份所解释的方差占总方差的百分比,即各因 子特征值占总

56、特征值总与的百分比。Cumulative %栏为各因子方差占总方差的百分比的累 计百分比。如在% of Variance栏中,第一与第二成份的方差百分比分别为37、024、12、 400,而在累计百分比栏中,第一成份的累计百分比仍然为 37、 024,第二成份的累计方差百 分比为49、 424,即就是两个成份的方差百分比的与(37、 024+12、 400)。第三大栏为因子提取的结果,未旋转解释的方差。第三大栏与第二大栏的前五行完全 相同,即把特征值大于1的四个成份或因子单独列出来了。这四个特征值由大到小排列, 所以第一个共同因子的解释方差最大。3报表3、2旋转后总的解释方差Total Var

57、iance ExplainedComponentRotation Sums of Squared LoadingsTotal% of VarianceCumulative %123456789101112131415161718192021225、1133、9172、0351、7281、70723、 24317、 8069、2497、8567、75923、 24341、 04950、 29858、 15465、 913Extraction Method: Principal Component Analysis、第四大栏为旋转后解释的方差。 (方便显示起见,放在了表3、 1 下面,作为表3、

58、2)Total栏为旋转后的特征值。与旋转前的Total栏相比,不难发现,四个成份的特征值有 所变化。旋转前的特征值从 8、145 到1、066,最大特征值与最小特征值之间的差距比较 大,而旋转后的特征值相对集中。尽管如此,旋转前、后的总特征值没有改变,最后的累计方 差百分比也没有改变,让然为65、913。4.表 4碎石图 碎石图与结果3的被解释的总方差的作用相同,都就是为了确定因子的数目。从碎石图 可以瞧出,从第 6 个因子开始,以后的曲线变得比较平缓,最后接近一条直线。据此,可以抽 取 5 个因子。最后决定抽取多少个因子,还要瞧后面的结果。5.表 5未旋转成份矩阵(显示全部载荷)Compon

59、ent Matrix(a)12Component345a6、796、273、065-、194、071a12-、734、354、253、178、119a3、731、419-、030-、150、019al、730、391-、104-、137、061a8、727、108-、137-、040、106a10-、726、355-、145、332、014a2、682、397-、139-、118-、011a20、653、042、095、544-、184all-、637、505、216、158、156a5、635、413-、171-、005、094a7、598、270-、295、236、242a22、567、1

60、15-、223、164-、243a17、567-、181、426、247-、390a9-、547、094-、378、193、467a19、527、053、397、146、206a13-、527、509、066、052-、142a14-、545、607-、030、164-、113a15-、455、561、332-、142-、093a4、501、556、255-、224-、003a18、375-、130、469、083、413a21、516、031-、116、599-、123a16-、366、278-、209-、196-、455Extraction Method: Principal Component Analysis、a 5 components extracted 、上表的成份矩阵就是每个变量在未旋转的成份或因子上的因子负荷量。比如a二0.796F + 0.273F + 0.065F -0.194F

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!