量表分析及因子分析最新版本

上传人:沈*** 文档编号:139034140 上传时间:2022-08-22 格式:PPT 页数:64 大小:623.50KB
收藏 版权申诉 举报 下载
量表分析及因子分析最新版本_第1页
第1页 / 共64页
量表分析及因子分析最新版本_第2页
第2页 / 共64页
量表分析及因子分析最新版本_第3页
第3页 / 共64页
资源描述:

《量表分析及因子分析最新版本》由会员分享,可在线阅读,更多相关《量表分析及因子分析最新版本(64页珍藏版)》请在装配图网上搜索。

1、中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt1第六章第六章 量表分析及因子分析量表分析及因子分析中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt2本章讲授主要内容信度分析内部一致性分析效度分析因子分析中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt3信度分析指问卷的稳定性或可靠性,即用问卷对同一事物进行重复测量时,所得结果的一致性程度。定义定义折半法(split-half technique)将量表分

2、成两半(常用的做法是按项目号的前后顺序或奇偶性),计算这两部分的总得分的相关系数。具体方法具体方法Alpha信度系数法折半法应用的公式的前提:两半题项得分的方差大致相等。若不满足这一假设,会低估信度系数。用克朗巴哈提出的alpha系数来测量累加量表的信度。平均相关系数法首先计算量表中两两项目得分(经过逆处理之后的得分)之间的相关;然后计算所有相关系数的平均。平均相关系数的大小可以指示量表的信度。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt4折半信度法ru=2rh/(1+rh)其中,rh表示两个总得分的相关系数,ru表示整个量表

3、的内在一致性信度系数,上式为斯皮尔曼-布朗公式。Alpha信度系数法其中,K为量表中题项的总数;i2表示第i个题项得分的题内方差;i2为K个题项的题内方差之和;T2表示总得(所有题项得分之和)的方差。具体计算公式具体计算公式中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt5大学生政治心理量表中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt6折半信度法折半信度法将V261-V2614 按奇偶数分为两半,分别计算两部分总加和 Total3、Total4。调用 Correl

4、ate过程计算相关系数为:0.364。rh=0.364ru=2rh/(1+rh)=2*0.364/(1+0.364)=0.533中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt7SPSS操作步骤:Analyze=Scale=Reliability Analysis打开对话框选入要分析的每个题项。选择具体需要计算的信度系数,共有五种。Alpha:克朗巴哈系数。Split-half:折半信度,一般要求该系数大于0.7。列出每个变量(题项的)标签。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-20

5、08学年学年编辑ppt8选择输出的统计量;Item:给出各变量的均值和标准差;Scale:给出各变量之和(即总分的均值、方差和标准差);Scale if item deleted:给出当在问卷中删除当前变量后,问卷相应指标的改变。这一项非常重要,可以用来对问卷中的各项进行逐一分析,达到改良问卷的目的。提供了三种分析方法,它们都是用来分析各变量取值是否相互不独立。如果问卷设计得好,则各答案应当是相关的。Correlations:计算;Covariances:计算。Inter-Item:输出各变量间的相关信息:项目间的两两相关系数矩阵、项目间的两两协方差值矩阵。中国传媒大学电视与新闻学院中国传媒大

6、学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt9Reliability Statistics.612.65014CronbachsAlphaCronbachsAlpha Based onStandardizedItemsN of Items克朗巴哈克朗巴哈信度系数信度系数Reliability Statistics.4507a.4207b14.457.627.627.626ValueN of ItemsPart 1ValueN of ItemsPart 2Total N of ItemsCronbachs AlphaCorrelation Between Form

7、sEqual LengthUnequal LengthSpearman-Brown CoefficientGuttman Split-Half CoefficientThe items are:神州五号,西方文化比中国文化先进,美对外政策霸权主义特征,愿意在国外发展事业,911美国罪有应得,台湾人自由幸福比是否回归更重要,为自己是中华民族的一员而骄傲.a.The items are:美对中国人权的批评别有用心,人权高于主权,强权即公理,爱国情感是人的道德品质的重要部分,在国家冲突中站在祖国立场,站在人类立场看问题,若台湾宣布独立,武力收复.b.折半信折半信度系数度系数中国传媒大学电视与新闻学院

8、中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt10v各种系数应该多大才能认为该量表的信度较高?各种系数应该多大才能认为该量表的信度较高?v没有统一的标准!没有统一的标准!v根据不同专家的观点,量表的信度根据不同专家的观点,量表的信度系数如果在系数如果在0.9以上,表示量表的信度甚佳。以上,表示量表的信度甚佳。v但是对于可接受的最小信度系数值是多少,许多专但是对于可接受的最小信度系数值是多少,许多专家的看法也不一致:家的看法也不一致:v有些专家定为有些专家定为0.8以上,也有的专家定位以上,也有的专家定位0.7以上。以上。通常认为,如果研究者编制的量表的信

9、度过低,如通常认为,如果研究者编制的量表的信度过低,如在在0.6以下,干脆扔掉,重新编制较为适宜。以下,干脆扔掉,重新编制较为适宜。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt11Inter-Item Correlation Matrix1.000.014.233.013.126.202.324.075.116-.142.202.162.068.177.0141.000-.010.202-.052.209.151.060.070-.077.065.046-.039.076.233-.0101.000.041.310.111.2

10、60.243.043.000.302.171.090.261.013.202.0411.000-.215.097.061.117-.039-.104.201.095.000-.002.126-.052.310-.2151.000.013.120.183.098.128.203.167.167.250.202.209.111.097.0131.000.254.188.164-.102.040.282.064.284.324.151.260.061.120.2541.000.219.246-.057.469.357.005.239.075.060.243.117.183.188.2191.000.

11、169.008.271.224.159.106.116.070.043-.039.098.164.246.1691.000-.216.082.191.101.071-.142-.077.000-.104.128-.102-.057.008-.2161.000.088-.059-.019.116.202.065.302.201.203.040.469.271.082.0881.000.334.081.230.162.046.171.095.167.282.357.224.191-.059.3341.000.170.231.068-.039.090.000.167.064.005.159.101-

12、.019.081.1701.000.038.177.076.261-.002.250.284.239.106.071.116.230.231.0381.000神 州 五 号西 方 文 化 比 中 国 文 化先 进美 对 外 政 策 霸 权 主 义特 征愿 意 在 国 外 发 展 事 业911美 国 罪 有 应 得台 湾 人 自 由 幸 福 比 是否 回 归 更 重 要为 自 己 是 中 华 民 族 的一 员 而 骄 傲美 对 中 国 人 权 的 批 评别 有 用 心人 权 高 于 主 权强 权 即 公 理爱 国 情 感 是 人 的 道 德品 质 的 重 要 部 分在 国 家 冲 突 中 站 在

13、 祖国 立 场站 在 人 类 立 场 看 问 题若 台 湾 宣 布 独 立,武力 收 复神 州 五 号西 方 文 化比 中 国 文化 先 进美 对 外 政策 霸 权 主义 特 征愿 意 在 国 外发 展 事 业911美 国 罪有 应 得台 湾 人 自 由幸 福 比 是 否回 归 更 重 要为 自 己 是 中华 民 族 的 一员 而 骄 傲美 对 中 国 人权 的 批 评 别有 用 心人 权 高于 主 权 强 权 即 公 理爱 国 情 感是 人 的 道德 品 质 的重 要 部 分在 国 家 冲突 中 站 在祖 国 立 场站 在 人 类 立场 看 问 题若 台 湾 宣布 独 立,武 力 收 复Th

14、e covariance matrix is calculated and used in the analysis.输出各题项之间两两相关系数,第输出各题项之间两两相关系数,第11项(爱国情感)和第七项(自豪感)相关程度最高(项(爱国情感)和第七项(自豪感)相关程度最高(0.469)中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt12Item-Total Statistics45.475034.792.266.172.59446.800034.564.123.100.61845.806333.340.356.225.58047.

15、106335.919.070.169.62247.025032.918.263.238.59146.587531.389.316.238.58145.618832.388.473.377.56345.937533.443.365.176.57946.718833.801.176.147.60847.125037.003-.075.132.66645.756331.808.450.369.56245.925031.504.427.251.56247.581334.459.152.076.61145.968831.527.386.214.568神 州 五 号西 方 文 化 比 中 国 文 化先 进

16、美 对 外 政 策 霸 权 主 义特 征愿 意 在 国 外 发 展 事 业911美 国 罪 有 应 得台 湾 人 自 由 幸 福 比 是否 回 归 更 重 要为 自 己 是 中 华 民 族 的一 员 而 骄 傲美 对 中 国 人 权 的 批 评别 有 用 心人 权 高 于 主 权强 权 即 公 理爱 国 情 感 是 人 的 道 德品 质 的 重 要 部 分在 国 家 冲 突 中 站 在 祖国 立 场站 在 人 类 立 场 看 问 题若 台 湾 宣 布 独 立,武力 收 复Scale Mean ifItem DeletedScale Variance ifItem DeletedCorrecte

17、dItem-TotalCorrelationSquaredMultipleCorrelationCronbachsAlpha if ItemDeleted考查项目与量表得分的关系:考查项目与量表得分的关系:若将某一项目从量表中剔除,则量表的平均得分若将某一项目从量表中剔除,则量表的平均得分、方差、每个项目得分与剩余各项目得分间方差、每个项目得分与剩余各项目得分间的相关系数的相关系数(Corrected Item-Total Correlation)、以该项目为自变量所有其他项目为因变量、以该项目为自变量所有其他项目为因变量建立回归方程的建立回归方程的R2值值(Squared Multiple

18、Correlation)以及以及Cronbach 值值(Alpha if Item Deleted)会是多少?会是多少?中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt13ANOVAa428.3351592.694954.1681373.39870.268.0002159.04620671.0453113.21420801.4973541.55022391.582Between PeopleBetween ItemsResidualTotalWithin PeopleTotalSum of SquaresdfMean Square

19、FSigGrand Mean=3.5683The covariance matrix is calculated and used in the analysis.a.方差分析表明,方差分析表明,F=70.268F=70.268,P0.000P0.000,即每一题项与各个题项间是相关的。,即每一题项与各个题项间是相关的。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt14内部一致性检测又称极端组检测,考察两个极端组得分的平均值。具体做法:将预测试的样本分为高低两组:取两端27%(或25%)划分,然后计算每个题项在两个极端组得分的平

20、均值。具有鉴别度的题项,在两个极端组的得分应具有显著差异。内部一致性分析中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt15第一步:Transform-Compute,增加新变量total,计算量表总分;第二步:对total进行频数分析;第三步:确定两个百分位数73、27,寻找高27%和低27%作为分割点,输出频数分析表;第五步:对新变量,确定范围:最低分第27%(25%)百分位数设定为新变量值为1(低分组),Add添加后,再输入第73%(75%)最高分,并设定为2(高分组);第四步:Transform-Record,选择旧变量t

21、otal,变换新变量group,帖标签后变更;第六步:查阅数据文件中产生的新变量group;第七步:进行t检验。将要分析的题目选入变量框,以group为分组变量;中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt16total1.61.51.51.61.52.91.61.54.41.61.55.921.32.98.831.94.413.231.94.417.631.94.422.163.88.830.974.410.341.285.011.852.921.32.955.953.17.463.263.88.872.121.32.975

22、.074.410.385.331.94.489.742.55.995.61.61.597.11.61.598.51.61.5100.06842.5100.09257.5160100.031.0038.0041.0043.0045.0047.0048.0049.0050.0051.0052.0053.0054.0055.0056.0057.0058.0059.0060.0061.0062.00TotalValidSystemMissingTotalFrequencyPercentValid PercentCumulativePercentStatisticstotal689250.000052.

23、000056.7500ValidMissingN255075Percentiles中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt17Group Statistics2146.42864.791361.045561958.10531.62941.37381groupe1.002.00totalNMeanStd.DeviationStd.Error MeanIndependent Samples Test7.115.011-10.09738.000-11.676691.15645-14.01780-9.33558-10.51624.

24、986.000-11.676691.11037-13.96362-9.38977Equal variances assumedEqual variances not assumedtotalFSig.Levenes Testfor Equality ofVariancestdfSig.(2-tailed)MeanDifferenceStd.ErrorDifferenceLowerUpper95%ConfidenceInterval of theDifferencet-test for Equality of Means中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用

25、2007-2008学年学年编辑ppt18效度分析1.单项与总和相关效度分析这一方法主要用于测量量表的内容效度。所谓内容效度指所选的题项是否能代表所要测量的内容或主题。具体步骤:计算每个项目的分数和总和的相关,如果相关系数不显著,表示该项目鉴别力低。如果把这个题项纳入量表,实际测量被调查者的态度,将会影响测量的准确性,最好提出。相关系数的显著程度越高,量表的内容效度就越高。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt19可以看出,可以看出,14个题项中有个题项中有12个相关系数是显著的,符合较高效度量表的标准。个相关系数是显著的

26、,符合较高效度量表的标准。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt202.难易度和鉴别度难易度就是项目的难易程度。具体做法:将态度总分值由低到高的顺序排列,划出人数大致相等的低分组和高分组,一般的情况是大致各占总调查人数的四分之一。然后考察高分组和低分组中的被调查者在每个题项上的“通过率”,即在该题中选“同意”或“非常同意”的比例;对于逆向题,则为选“不同意”和“非常不同意”的比例。如果该题项是很“容易”回答的,那么,高分组和低分组的人在该题项上都容易通过,也即该题项十分容易让人一目了然地给出确切的答复。反之,如果该题项很

27、“难”回答,“使用*品牌纯净水的家庭是不太注意节约的家庭”,那么,不但低分组的通过率低,高分组的通过率也可能不高。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt21计算某个题项的难易度的公式:难易度=(PH+PL)2m其中,m表示高分组或低分组的人数,一般取1/4左右;PH和PL分别为高分组和低分组中通过该题项的人数,即对该题项持肯定、积极态度的人数。难易度实际上等于高、低分组在该题项上通过率的平均值。难易度越大,表示该题项越“容易”。难易度到底多大比较合适?要根据调查目的和要求来确定。在社会调查研究的态度量表中,一般取难易度适

28、中(0.5 左右)的情况较多。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt22中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt23鉴别度分析鉴别度指量表中所测量的项目对所测量特性的区分或鉴别能力。如果高分组中的人大多数都通过了某一项目,而低分组的人几乎没有通过,那么该题项的鉴别度就较高。反之,如果高分组的人几乎没有通过,而低分组的人几乎都通过了该题项,那么,鉴别度应该是负的,绝对值较高。一般采用高分组和低分组通过率之间的差异来计算量表中各项目的鉴别度。鉴别度=(P

29、H-PL)/m一般要求量表中各项目的鉴别度高一些为好。鉴别度较高的项目表示总分高的人与低的人在该题项中的回答有明显不同,高分组的倾向于对高项目的肯定态度,而低分的表示否定的态度。也就是说这样的项目可以较好地鉴别对某事物态度不同的受试者。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt24值得注意:无论是难易度还是鉴别度,实际上都是一种相对的概念,它们是针对被调查者而言的。一般取适中的鉴别度。在设计量表时,通过试调查认真考察每个项目的难易度和鉴别度,剔除那些不和要求的项目,这样才能提高整个量表的信度和效度。中国传媒大学电视与新闻学院

30、中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt25中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt26因子分析(Fact Analysis)因子分析是多元统计技术的一个分支,其目的是浓缩数据。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量(公共因子)来表示基本的数据结构。这些假想变量能够反映原来众多的观测变量所代表的主要信息,并解释这些观测变量之间的相互依存关系,将这些假想变量称为基础变量,即因子(Factors)。因子分析就是研究如何以最少的信息丢失把

31、众多的观测变量浓缩为少数几个因子的过程。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt27两个主两个主要应用要应用寻求基本结构、检验结构效度在多元分析中,经常碰到观测变量很多且变量之间存在着较强的相关关系的情形,这不仅给问题的分析和描述带来一定困难,而且在使用某些统计方法时会出现问题。数据简化通过因子分析把一组观测变量化为少数几个因子后,可以进一步将原始观测变量的信息转换成这些因子的因子值,然后用这些因子代替原来的观测变量进行其他统计分析,如回归分析、路径分析、判别分析和聚类分析,利用因子值也可以直接对样本进行分类和综合评价。中

32、国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt28因子分析的基本假设,是因子隐含在许多可观察的现实事物的背后。虽然难以直接测量,但是可以从复杂的外在现象中计算、估计。其数学原理的共变的抽取。也就是说,受到同一个因子影响的测量分数,共同相关的部分就是因子所在的部分。因子的提取也是根据共同相关的得分而决定。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt29一般说来,研究者事先对观测数据背后存在多少个因子、因子如何抽取、因子的内容以及变量的分类等一无所知,未有任何事前的假

33、定,而由因子分析的过程来决定。这种类型的应用称为探索性因子分析(EFA),因子分析的大部分应用都属于这种类型。探索性因子分析(探索性因子分析(Exploratory Factor Analysis;EFA)中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt30有的情况下,研究者根据某些理论或其他先验知识可能对因子的个数或因子的结构作出假设,因子分析也可以用来检验这个假设,作为证实假设的工具,这种类型的应用称为证实性(CFA)因子分析。证实性因子分析(证实性因子分析(Confirmatory Factor Analysis;CFA)中

34、国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt31探索性因子分析步骤第一步:通过共变关系的分解,找出最低限度的主要成分(principal component)或共同因子(common factor)。第二步:探讨这些主成分或共同因子与个别的变量的关系,找出观测变量与其相对应因子的强度,即因子负荷值或负载值(factor loading),以说明因子与所属的观察变量的关系与强度。第三步:决定因子的内容,为因子取一个合适的名字。2ij 为因子fi 解释变量Xi变异的比例中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件

35、应用软件应用2007-2008学年学年编辑ppt32因子分析的条件 因子分析的变量都必须是连续变量,符合线性相关的假设。顺序与类别变量不得使用因子分析简化结构。抽样的过程必须具有随机性,并具有一定的规模。如果研究的总体具有较高的同质性(如学生样本),变量数目不多,样本数可以介于100200之间;Gorsuch(1983)建议样本数最少为变量数的5倍,且大于100。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt33因子分析的原理xxZ1.因子分析模型imimiiiiUFaFaFaFaX332211可以证明,经过标准化的变量,不改变

36、变量间的相关系数。因子分析模型在形式上和多元回归模型相似,每个观测变量由一组因子的线性组合来表示。上式中,F1,F2,Fm叫公共因子(Common factors),它们是各个观测变量所共有的因子,解释了变量之间的相关。Ui称为特殊因子(Unique factor),它是每个观测变量所特有的因子,相当于多元回归中的残差项,表示该变量不能被公共因子所解释的部分。aim称为因子负载(Factor loading),它是第i个变量在m个公共因子上的负载,相当于多元回归分析中的标准回归系数。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt

37、34F1F2F,kX1X2XkU1U2Uka11a21am1a12a22am2a1ma2makm因子模型也可以用路径分析图表示中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt35相相 關關 矩矩 陣陣1.000.293.462.409.291.136.445.477.337.370.2931.00.347.200.621.284.279.300.465.263.462.3471.000.474.359.182.495.461.341.353.409.200.4741.00.201.036.508.447.301.346.291.6

38、21.359.2011.000.363.332.333.553.275.136.284.182.036.3631.00.096.137.250.092.445.279.495.508.332.0961.000.584.378.412.477.300.461.447.333.137.5841.000.338.452.337.465.341.301.553.250.378.3381.000.325.370.263.353.346.275.092.412.452.3251.000大體來說,我對我自己十分滿意(X1)有時我會覺得自己一無是處(X2)我覺得自己有許多優點(X3)我自信我可以和別人表現得一

39、樣好(X4)有時候我的確感到自己沒有什麼用處(X5)我時常覺得自己沒有什麼好驕傲的(X6)我覺得自己和別人一樣有價值(X7)我十分地看重自己(X8)我常會覺得自己是一個失敗者(X9)我對我自己抱持積極的態度(X10)相關X1X2X3X4X5X6X7X8X9X10因子分析的数学原理(相关矩阵)因子分析的基础是变量之间的相关。因此,应先计算若干个选项(如X1到X10)的两两相关,详细分析相关矩阵代表的意义。如果“自尊”用Y来表示,其他10个选项的分数以X1到X10表示,则Y的得分可以用以下数学模型预测得到:Y=b1X1+b2X2+b3X 3+b10X10+U中国传媒大学电视与新闻学院中国传媒大学电

40、视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt36因子分析中的有关概念因子负载(负荷)因子负荷是因子分析中的最重要的统计量,它是连接观测变量和公共因子之间的纽带。因子负荷不仅表示观测变量如何由因子线性表示的,而且也反映了因子和变量之间的相关关系。假如我们得到了5个观测变量、2个公共因子的情形:X1=0.9562F1+0.2012F2+0.2126U1 X2=0.8735F1+0.2896F2+0.3913U2 X3=0.1744F1+0.8972F2+0.4057U3 X4=0.5675F1+0.7586F2+0.3202U4 X5=0.8562F1+0.3315F2

41、+0.3962U5可以看出,公共因子F1与变量X1、X2、X4、X5关系密切,它主要代表了这些变量的信息。F2与变量X4、X5关系密切,它主要代表了这两个变量的信息。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt37 F1 F2 hi2X1 0.9562 0.2012 0.9548X2 0.8735 0.2896 0.8469X3 0.1744 0.8972 0.8354X4 0.5675 0.7586 0.8975X5 0.8562 0.3315 0.8430hi2=ai12+ai22+aim2(i=1,2,p)表明F1和F2

42、两个因子解释了X1变量信息的95.48%。公共因子方差(Communality),或共同度指观测变量方差中由公共因子决定的比例。变量的方差由两部分组成,一部分由公共因子决定,一部分由特殊因子决定(即残差)。公共因子方差表示原始变量方差能被公共因子所解释的部分,共同度越大,变量能被因子说明的程度越高。一个原始变量的共同度等于因子负荷矩阵中该变量所在行的所有元素的平方和。对上例,计算出每个变量的公共因子方差为:共同度这个指标以观测量为中心,其意义在于说明如果用公共共同度这个指标以观测量为中心,其意义在于说明如果用公共因子替代观测变量后,原来的每个变量的信息被保留的程度。因子替代观测变量后,原来的每

43、个变量的信息被保留的程度。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt38因子贡献(因子贡献(Contributions)特征值(特征值(eigenvalue)一个因子的特征值等于因子负荷矩阵中该变量所在列的所有元素的平方和,表示该因子所能解释的方差。因子Fj所能解释的方差所占的比例叫做该因子的贡献率。其计算公式为:F1 F2 hi2X1 0.9562 0.2012 0.9548X2 0.8735 0.2896 0.8469X3 0.1744 0.8972 0.8354X4 0.5675 0.7586 0.8975X5 0.8

44、562 0.3315 0.8430特征值:2.7628 1.614684 Fj贡献率:0.552 0.323 表明第一个因子F1解释了所有变量总方差的55%,第二个变量解释了上述总方差的32%,两个因子一共解释了总方差的87%。),2,1(/22221mjpaaaFpjjjj)(的贡献率中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt39因子分析的主要步骤:第一步:计算所有变量的相关矩阵。相关矩阵是因子分析直接要用的数据,根据相关矩阵还应该进一步判断应用因子分析方法是否合适。第二步:提取因子。这一步是确定因子的个数和求因子解的方法

45、。第三步:是进行因子旋转。这一步的目的是通过坐标轴变换使因子解的实际意义更容易解释。第四步:计算因子值。因子值是各个因子在每个观测量上的得分,有了因子值可以在其他的分析中使用这些因子。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt40因子分析的目的是简化数据或者找出基本的数据结构,因此,使用因子分析的前提是观测变量之间应该有较强的相关关系。如果变量之间的相关程度很小的话,他们不可能共享因子。所以,计算出相关矩阵后,应对相关矩阵进行检验,如果相关矩阵的大部分相关系数都小于0.3,则不适合做因子分析。SPSS提供了三个统计量帮助判断

46、观测数据是否适合做因子分析。1.反映象相关矩阵(Anti-image correlation matrix)其元素等于负的偏相关系数。偏相关是控制其他变量不变,一个自变量对因变量的独特解释作用。如果数据中确实存在公共因子,变量之间的偏相关系数应该很小,因为它与其他变量重叠的解释影响被扣除掉了。所以如果反映象相关矩阵中很多元素的值比较大,应该考虑该观测数据不适合做因子分析。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt41K KM MO O與與 B Ba ar rt tl le et tt t檢檢 定定.8795569.70345

47、.000Kaiser-Meyer-Olkin 取樣適切性量數。近似卡方分配自由度顯著性Bartlett 球形檢定Barlett球形球形检验呈现显著检验呈现显著表示相关系数足以作为因子分析抽取之用2.巴特勒球形检验(Bartletts test of sphericity)该统计量从检验整个相关矩阵出发,其零假设为相关矩阵是单位阵(我们一般将对角元素为1,其余元素为0的矩阵称为单位阵)。如果检验的结果无法拒绝零假设,那么,因子分析的使用就可能是不适当的,应该重新考虑。另外,需要注意的是,随着样本量的增加,巴特勒球形检验对检验出变量间的相关也会变得更为敏感。中国传媒大学电视与新闻学院中国传媒大学电

48、视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt42K KM MO O與與 B Ba ar rt tl le et tt t檢檢 定定.8795569.70345.000Kaiser-Meyer-Olkin 取樣適切性量數。近似卡方分配自由度顯著性Bartlett 球形檢定3.KMO(kaiser-Meyer-Olkin Measure of Sampling Adequacy)测度该测度从比较观测变量之间的简单相关系数和偏相关系数的相对大小出发,其值的变化范围从01。当所有变量之间的偏相关系数的平方和,远远小于简单相关系数的平方和时,KMO值接近1。KMO值较小时,表

49、明观测变量不适合做因子分析。通常按以下标准解释该指标的大小:中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt43例:生育率的影响因素分析。例:生育率的影响因素分析。分析思路:生育率受社会、经济、文化、计划生育政策等许多因素影响,但是这些因素对生育的影响并不是完全独立的,而是交织在一起的。如果直接用选定的变量对生育率进行多元回归分析,最终结果往往只能保留二、三个变量,其他变量的信息就丢失了。因此,我们首先对自变量进行因子分析,找出基本的数据结构,用新生成的因子再对生育率进行分析。这样,一方面克服了自变量之间高度相关的缺陷,另一方面,

50、又保留了这些变量的信息。选择的变量有:选择的变量有:人均国民收入人均国民收入城镇人口比例城镇人口比例初中以上文化程度的比例初中以上文化程度的比例多孩率多孩率综合节育率。综合节育率。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt441990年我国30个省、(直辖)市、自治区的数据(有节略)中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt45对以上5个变量进行相关分析表明:多孩率和综合生育率之间存在较强的相关关系,其余的3个变量之间存在着较强的相关关系。Kaiser-M

51、eyer-Olkin Measure of Sampling Adequacy=.71321Bartlett Test of Sphericity=106.77649,Significance=.00000中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt46因子抽取的目的在于决定测量变量中,存在着多少个潜在的成分或因子。因子的抽取(Factor extraction)方法方法一类是基于主成分分析模型的主成分法。在因子分析着占重要地位。一类是基于公共因子模型的公因子法,包括主轴因子法、极大似然法、最小二乘法、alpha法等。主成分法

52、(主成分法(Principal components analysis)是一种数学变换方法,它把给定的一组(如k个)相关变量通过线性变换成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一个变量具有最大的方差,称为第一主成分,第二个变量的方差次之,并且和第一个变量不相关,称为第二主成分,依次类推,k个变量就有k个主成分,最后一个主成分具有的方差最小,且和前面的主成分都不相关。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt47因子数的确定因子数的确定有k个变量就有k个成分,但是因子

53、分析的目的是为了简化数据。于是,提取前几个主成分作为初始因子,需要几个因子能代表原来数据中的主要信息呢?目前没有精确的定量方法,实际应用中借助一些准则类判断:1.特征值准则取特征值大于1的主成分作为初始因子,放弃特征值小于1的主成分。因为每个变量的方差为1,该准则认为每个保留下来的因子至少应该能解释一个变量的方差,否则达不到精简的目的。2.碎石检验准则(Scree Test Criterion)按照因子被提取的顺序,画出因子的特征值随因子个数变化的散点图,根据图的形状来判断因子的个数。该图像一个山峰,从第一个因子开始,曲线迅速下降,然后下降边得平缓,最后变成近似一条直线。曲线变平开始的前一个点

54、认为是提取的最大因子数,因为后面的散点就像山脚下的碎石,舍去这些“碎石”并不损失很多信息。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt48中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt49因子累积解释方差的比例也是确定因子个数时可参考的指标,一般选取的因子数应使累积解释的方差比例达到7080%以上。实际中,很少仅仅依赖某一准则来确定因子个数,而是结合几个准则进行判断。保留的因子是否有意义,是否能被解释,也是在确定因子时应该考虑的一个重要方面。保留的因子太多,解释

55、因子时可能会比较困难。有些情况下,分析人员已经事先确定了因子的个数,就可以在计算机中设定要提取的因子个数。这种方法在检验有关理论和假设时非常方便。中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt50解释因子初始因子解达到了数据简化的目的。但是,根据初始因子解,往往很难解释因子的意义,大多数因子都和很多变量相关。如一个公共因子与所有变量的相关系数都很高。因为求初始因子时,是按照因子的重要程度顺序提取的,所以,第一个因子能解释最大比例的方差,绝大多数变量在第一个因子上都有显著的负载,第二个和其后的因子所能解释的方差依次递减。但我们往往

56、很关心每个因子的实际意义是什么,否则就很难理解因子分析的结果。因子旋转是寻求这一实际意义的有效工具,因子旋转的目的是通过改变坐标轴的位置,重新分配各个因子所解释的方差比例,使因子结构明了、易解释。因子旋转不改变模型对数据的拟合程度,不改变每个变量的共同度。因子旋转因子旋转(factor rotation)中国传媒大学电视与新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt51旋转的方式1.直交旋转(orthogonal rotation)指旋转过程中,因子之间的轴线夹角为90度,即因子之间的相关设定为0。有最大变异法(Varimax)、四方最大法(q

57、uartimax)、均等变异法(equimax rotation)。2.斜交旋转(oblique rotation)允许因子之间具有一定的共变,在旋转过程中,同时对因子的关联情形进行估计。有最小斜交法(oblimin rotation)、最大斜交法(oblimax rotation)、四方最小法(quartmin)等。目前没有可以令人信服的理由说明某种旋转方法优于另一种。选择旋转方法主要是根据研究问题的需要:如果因子分析的目的只是要简化数据,把很多变量浓缩成少数几个,而因子的确切含义是什么并不重要,则选择正交旋转。如果研究的目标是要得到几个理论上有意义的因子,应选择斜交旋转。中国传媒大学电视与

58、新闻学院中国传媒大学电视与新闻学院SPSS软件应用软件应用2007-2008学年学年编辑ppt52转轴后的成份矩阵 成份 1 2 3 4 5 6 7 8 9 10 11 D12 我常看运动的实况转播我常看运动的实况转播 0.851-6.60E-02 2.14E-02 2.57E-02 7.69E-02 5.02E-02-4.53E-02-0.213 6.98E-02 9.98E-02-1.68E-02 D22 我持续运动以保持身体健康我持续运动以保持身体健康 0.717-6.35E-02 0.167 0.181 0.113-4.93E-02 0.316 0.24 0.112 0.109 6.6

59、6E-02 D28 我会去参我会去参加激烈的运动加激烈的运动 0.675 0.132-2.04E-02 2.69E-02 0.179 0.129-0.149-7.36E-02-0.21 0.125-8.14E-02 D03 我经常运动以保持身材我经常运动以保持身材 0.642 0.194-1.83E-02 0.121 0.123 6.63E-02 0.373 0.326 2.42E-03-4.21E-02 7.50E-02 D36 我觉得世界上的事物变化得太快-0.421-0.171 6.03E-02 0.213 0.164 0.296 0.102-0.204 9.27E-02 6.22E-0

60、2-0.209 D05 我喜欢逛街购物我喜欢逛街购物 -9.28E-03 0.811-7.03E-02 1.22E-02-0.152 0.154 2.05E-04-0.113 6.93E-02-3.78E-02 1.77E-02 D14 我很注意目前流行的事物我很注意目前流行的事物 8.42E-02 0.65 0.101 6.37E-02 0.397 0.13 0.265 0.172 6.02E-02-3.27E-02-0.107 D08 对于同一种产品,我喜欢尝试不同的品牌对于同一种产品,我喜欢尝试不同的品牌 -6.59E-02 0.647 0.127-0.146 7.31E-02-0.30

61、4 0.339 8.19E-02-0.105 0.203 2.96E-02 D23 我很喜欢到处享受美食我很喜欢到处享受美食 7.14E-02 0.638-1.94E-02-9.39E-02-1.47E-02 4.37E-03-0.271 0.203 1.65E-03 7.48E-02 0.329 D27 我喜欢名牌、昂贵的服饰我喜欢名牌、昂贵的服饰 0.32 0.604 0.202-0.129 0.298 0.238-9.57E-02 4.09E-02 0.208-3.03E-02-0.327 D02 我经常利用假日和家人团聚我经常利用假日和家人团聚 -8.97E-02-2.44E-02 0

62、.799-0.244-7.19E-02 8.89E-02 9.77E-02 0.16 0.185 4.43E-02 0.145 D15 家庭是我的生活重心家庭是我的生活重心 8.14E-02 3.20E-02 0.784 0.189 4.40E-02-3.20E-03-4.08E-02-3.15E-02 0.15 9.05E-02-1.40E-02 D20 买东西我主要考虑质量,而不是外观包装买东西我主要考虑质量,而不是外观包装好看就好看就好好 3.16E-02 6.66E-02 0.621 0.479-3.83E-02 0.115 0.129-3.35E-03-9.22E-02-0.302

63、0.232 D26 我喜欢和家人一起共进晚餐我喜欢和家人一起共进晚餐 -4.00E-02-5.35E-03 0.584 0.257 0.245 0.31 8.23E-02 6.19E-02-3.12E-02 0.215-6.16E-04 D16 我买东西只要质量好,贵一点无所谓 0.342 0.361 0.466 0.212 0.144-5.38E-02 0.102-0.161 5.42E-02 0.215-0.206 D31 我很注意饮食的选择 0.193 0.138 0.414 0.158 0.307 0.212 6.83E-02 0.318 0.123 0.146 0.106 D30 对

64、于自己喜欢的休闲活动会比较关心对于自己喜欢的休闲活动会比较关心 0.191-5.87E-02 0.247 0.785 0.13-7.71E-02-2.97E-02 3.86E-02-2.31E-02-5.80E-02 5.96E-02 D18 我希望能独立完成自己的事情我希望能独立完成自己的事情 -0.157-4.27E-02 5.53E-02 0.672-0.152 0.219 0.206-0.106 0.221 0.272 9.18E-02 D33 我喜欢预先计划自己的行动我喜欢预先计划自己的行动 0.109-9.65E-02-7.22E-02 0.576 1.62E-02-2.75E-0

65、3 0.221 0.351-0.168 0.213-0.314 D21 我喜欢游山玩水,投入大自然的怀抱 7.48E-02 0.115 0.189 0.486-6.07E-02-0.17 0.395 1.02E-02 0.344 0.235 0.104 D35 我喜欢多认识一些朋友我喜欢多认识一些朋友 0.106-1.02E-02 4.65E-02-7.36E-02 0.848 7.16E-02 0.131-4.17E-02 0.134-5.73E-02 7.94E-02 D34 我常关心电视上的广告我常关心电视上的广告 0.203 1.89E-02 0.178 0.167 0.533-1.6

66、1E-02-3.67E-02-1.17E-02-8.09E-02 0.482 1.55E-02 D01 我常和朋友或同事一起从事休闲活动 0.167 0.389-9.23E-02 0.37 0.45-0.225-0.206 0.116 0.108 0.188 0.314 D25 钱是我们生活中重要的东西钱是我们生活中重要的东西 1.38E-03-1.81E-03 0.239-8.46E-02 0.104 0.718-1.39E-02-0.12 6.90E-03-0.106 3.31E-02 D19 我希望我有更多钱我希望我有更多钱 9.14E-02 0.295 5.20E-02 0.136-3.17E-02 0.663-0.174 1.75E-02 8.54E-02 0.182 0.123 D06 我经常阅读报章、杂志以吸收休闲方面的消息-9.62E-02 9.14E-02 0.353 0.113 0.175-0.414 0.372-5.48E-02 0.322 0.328 0.211 D07 我出外旅游,主要是为了增长自己的知识我出外旅游,主要是为了增长自己的知识 7.54E-02

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!