因子分析Word

上传人:痛*** 文档编号:108076286 上传时间:2022-06-15 格式:DOC 页数:23 大小:567.50KB
收藏 版权申诉 举报 下载
因子分析Word_第1页
第1页 / 共23页
因子分析Word_第2页
第2页 / 共23页
因子分析Word_第3页
第3页 / 共23页
资源描述:

《因子分析Word》由会员分享,可在线阅读,更多相关《因子分析Word(23页珍藏版)》请在装配图网上搜索。

1、因子分析一、实验目的与要求1.通过上机操作使学生掌握因子分析方法在SAS软件中的实现;熟悉因子分析的用途、目的,掌握如何判断因子分析的适用条件,能正确选择适当的因子;熟悉因子旋转的意义并能正确使用旋转方法;2.要求学生能正确解释软件分析处理的结果; 3.要求学生阅读一定数量的文献资料,掌握因子分析方法在写作中的应用。二、实验内容与步骤 因子分析的基本目的是用少数的几个因子去描述多个变量之间的关系,以达到降维的目的。被描述的变量一般都是可观测的随机变量,而因子是不可观测的潜在变量。例如:“态度”,“能力”都是不可观测的潜在变量,多用“受教育水平”“工作业绩”等可观测变量来反映潜在变量水平。因子分

2、析就是利用这些不可观测的潜在变量作为公共因子来解释可观测变量的一种工具。因子分析的基本思想就是把联系比较紧密的变量归为同一个类别,实现不同类型的变量之间有较低相关性。在同一个类别内的变量,认为是收到了某个共同的影响而高度相关,这个共同因素称之为公共因子,即为潜在的不可观测变量。因子分析的基本原理是以相关性为基础,从协方差或相关矩阵入手把大部分的变异归结为少数几个公共因子所为,把剩余的变异称为特殊因子。每一类变量代表了一个公共因子,因子分析就是寻找和确定这些公共因子的分析方法。因子分析反映了一种降维的思想,通过降维将相关性高的变量聚在一起,不仅便于提取容易解释的特征,而且降低了需要分析的变量数目

3、和分析问题的复杂性。在问题内在体系还不了解时,可利用它吧观测变量鬼碧昂为少数几个公共因子,令每个因子代表一个空间的维度,经过正交或斜交旋转,使各个维度互不相连,用这些维度刻画系统的结构。因子分析的内容非常丰富,常用的因子分析类型是R型因子分析和Q型因子分析。R型的因子分析是对变量作因子分析,Q型因子分析是对样品作因子分析。因子分析与主成分分析不同:主成分分析是寻求若干个可观测随机变量的少量线性组合,说明其含义;因子分析主要的目的是找出不一定可观测的潜在变量作为公共因子,并解释公共因子的意义,及如何用不可观测随机变量,计算可观测随机变量。因子分析方法在心理学,经济,医学,生物学,教育学等方面有重

4、要用途。例如为了测验应聘者的素质,出40道题,让应聘者回答,每道题有一得分, 40题得分被认为可以观测的随机变量。我们希望找出有限个不可观测的潜在变量来解释这40个随机变量,这些不可观测的潜在变量不一定能表示为原来随机变量的线性组合,但却是有实际意义的,例如交际能力,应变能力,语言能力、推理能力、艺术修养、历史知识和生活常识等。又如分析生物生长状况时,从生物的实测指标(长、宽和体重等)可以分析出生长因子和控制因子,找出它们在不同时刻的作用。一、 因子分析的步骤1,因子分析的操作步骤(1) 确认待分析的变量是否适合做因子分析(2) 构造因子变量(3) 因子旋转是因子变量更具有可解释性(4) 计算

5、因子得分2,在因子分析过程中计算的过程分为以下几步(1) 对样本数据进行标准化处理;(2) 计算相关系数矩阵(3) 计算相关系数矩阵的特征值和特征向量,确定因子个数;(4) 求出因子载荷矩阵;(5) 根据情况进行因子旋转;(6) 计算因子得分(7) 以因子的贡献率为权重,计算因子得分的综合得分,根据综合得分排序。二、 操作步骤的详细解释8 确认待分析的变量是否适合做因子分析因子分析是从众多的原始变量中重构少数几个具有代表意义的因子变量的过程。隐含的前提是原有变量之间要具有比较强的相关性。所以,在因子分析之前,首要的就是要先对原有变量做相关分析,看它是否满足做因子分子的条件。确定是否适合做因子分

6、析的方法:(1) 计算变量之间的相关系数矩阵如果相关系数矩阵在进行统计检验中大部分相关系数都小于0.3,那么表明这些变量不适合于进行因子分析。(2) 巴特利特球形检验(Bartlett Test of Sphericity)此方法采用假设检验法。假设各变量不相关,即相关系数矩阵对角线上值都为1,其他值都为0.统计量由行列式得到,如果显著性概率值小于0.05,则认为假设不成立,各变量相关性较大,适合做因子分析。(3) KMO(Kaiser-Meyer-Olkin)检验KMO值在0-1之间,其值越接近1,表明所有变量之间简单相关系数平方和远大于偏相关系数平方和,就越适合因子分析。一般认为,大于0.

7、7则适合做因子分析。9 构造因子变量因子分析中有很多确定因子变量的方法,如基于主成分模型的主成分分析和基于因子分析模型的主轴因子法、极大似然法、最小二乘法等。下面对其中主成分分析法最为常用。主成分分析通过坐标变换手段,将原有的相关向量x做线性变化,转换为另外一组不相关的变量y,并将y用x表示y1,y2.yp为原有变量的主成分,按在总方差中所占比列排次序,所占比例越大,表明综合原有变量的能力也越强,这些从前往后取前面几个主成分,一般认为累积变量共享率达到85%以上时,所选择的所有主成分能够较为完整的表示所有原变量的信息,从而确定了因子个数和公共因子。3,因子旋转因子旋转的目的:因子分析不仅是要找

8、出主因子,更重要的是知道每个主因子所代表的意义。通过估计因子载荷矩阵得到的因子模型还只是一个初始模型,不一定能反映问题的实质特征,它们所代表的实际意义也不一定容易解释。因子旋转就是为了解决因子不能反映实际意义的问题的一种改进方法。另外,如果求得的载荷举着A的所有元素都接近0或者|1|,则模型的公共因子就抑郁解释,反之,如果多数居中,不大不小,则对模型的公共因素不易做出解释。这时,通过因子旋转,可以使得载荷矩阵的每一列上的元素的绝对值尽可能来开距离,是其中一些元素接近0,另一些接近|1|。因子旋转的依据是因子模型的不唯一性。附:设T 为任意一个m*m的正交矩阵,则TTT=I X=u+Af+e=u

9、+A(TTT)f+e=u+(AT)(TTf)+e则载荷矩阵由A变为(AT),公共因子由f变为(TTf),此时,仍然满足因子模型的假设E(TTf)=TTE(f)=0;V(TTf)= TTV(f)T=I;Cov(TTf,e)=E(TTfeT)=0.所以,因子载荷是不唯一的,因子模型也是不唯一的,在满足条件的情况下,可以根据这个性质因子旋转,实现公共因子的实际可理解性。因子旋转的方法很多,如正交旋转,斜交旋转,正交旋转又包括最大方差旋转,四次方最大化旋转等。(1)最大方差旋转法原理:选择正交矩阵T,使得矩阵AT所有m个列元素平方的相对方差之和达到最大。V=V1+V2+.Vm步骤:设已求出的因子载荷矩

10、阵为a11 a12 .a1ma21 a22.a2map1 ap2 apm A=任意选取两列A*(例如第一,二列)与正交变换矩阵T因子旋转,T可以表示为 A*T 由上式求得各列元素的相对方差之和V,易知V是函数,利用微积分求极值的方法,将V对导数等于0,求出,使V达到最大。 此时,其余列不变。 之后,在其余列中再人选两列重复上述旋转,m个公因子总共需要进行m(m-1)次,此时算是完成了第一轮旋转,然后再重新开始,进行第二轮配对旋转,如此继续下去,得到一系列因子载荷矩阵A1,A2.,必然有V1V20.8091185,因子1比因子2重要。 Final Communality Estimates: T

11、otal = 3.665605 ALLCHEMI DUPONT UNIONCAR EXXON TEXACO 0.660709 0.806483 0.685885 0.731155 0.781374上表是共性方差。 从因子负荷阵可见:可观测因子在第一公共因子上的负荷都是相差不多的正数,可见第一公共因子表示一般经济条件,可称为市场因子;前三个公司是化学加工公司,它们的股票回报率在第二个公共因子上的负荷都是负的,后两个公司是石油公司,它们的股票回报率在第二个公共因子上的负荷都是正的,可见第二个公共因子反映产业的不同,可称为产业因子。 由于数据集stock已建立,可直接调用。采用极大似然法的程序是pr

12、oc factor data=stock method=ml n=2; /* method=ml采用极大似然法,对数据集stock用相关阵计算因子分析,n=2选取两个公共因子*/var AllChemi duPont UnionCar Exxon Texaco; /*可观测因子是AllChemi 、duPont 、UnionCar、 Exxon、Texaco */run;KMO(Kaiser-Meyer-Olkin)检验结果:Kaisers Measure of Sampling Adequacy: Overall MSA = 0.78185714AllChemi duPont UnionCa

13、r Exxon Texaco0.80012479 0.74270362 0.80925619 0.80426580 0.75573953可以看出KMO(Kaiser-Meyer-Olkin)检验值为0.78185714大于0.7,可以做因子分析主要输出的表 Factor Pattern 因子 FACTOR1 FACTOR2 ALLCHEMI 0.68323 -0.19151 DUPONT 0.69240 -0.51867 UNIONCAR 0.68027 -0.25058 EXXON 0.62085 0.07033 TEXACO 0.79388 0.43971可见极大似然法所得因子负荷阵是 V

14、ariance explained by each factor FACTOR1 FACTOR2 Weighted 8.026412 2.379734 Unweighted 2.424712 0.566772上表第3列是每个因子负荷的平方和,反映因子的重要性:平方和越大,该因子越重要。本例中2.42471244 0.56677229,因子1比因子2重要。 Final Communality Estimates and Variable Weights Total Communality: Weighted = 10.406145 Unweighted = 2.991485 ALLCHEMI D

15、UPONT UNIONCAR EXXON TEXACO Communality 0.503484 0.748441 0.525560 0.390406 0.823593 Weight 2.014042 3.975230 2.107740 1.640434 5.668700上表第2列是共性方差。 两个公共因子的含义和主成分法一样。采用主因子法(初始特殊因子的方差是0.3,0.2,0.3,0.3,0.2)的程序是proc factor data=stock method=p n=2 msa; /*采用主因子法,对数据集stock用相关阵计算因子分析,选取两个公共因子*/var AllChemi d

16、uPont UnionCar Exxon Texaco; /*可观测因子是AllChemi 、duPont 、UnionCar、 Exxon、Texaco */priors 0.3 0.2 0.3 0.3 0.2;/*规定特殊因子的方差为0.3 0.2 0.3 0.3 0.2*/run;执行后所得主要输出有 Factor Pattern FACTOR1 FACTOR2 ALLCHEMI 0.68468 -0.07101 DUPONT 0.64931 -0.10567 UNIONCAR 0.69450 -0.06773 EXXON 0.62329 0.15067 TEXACO 0.59798 0

17、.11765可见主因子法所得因子负荷阵是 Variance explained by each factor FACTOR1 FACTOR2 2.118782 0.057339上表第是每个因子负荷的平方和,反映因子的重要性:平方和越大,该因子越重要。本例中2.1187820 0.0.0573392,因子1比因子2重要。 Final Communality Estimates: Total = 2.176121 ALLCHEMI DUPONT UNIONCAR EXXON TEXACO 0.473823 0.432771 0.486911 0.411192 0.371424上表是共性方差。 采用

18、迭代主因子法的程序是proc factor data=stock method=prinit n=2 msa; /*采用迭代主因子法,对数据集stock用相关阵计算因子分析,选取两个公共因子*/var AllChemi duPont UnionCar Exxon Texaco; /*可观测因子是AllChemi 、duPont 、UnionCar、 Exxon、Texaco */run;执行后所得主要输出有 Factor Pattern FACTOR1 FACTOR2 ALLCHEMI 0.69710 -0.07560 DUPONT 0.77286 -0.42899 UNIONCAR 0.71

19、576 -0.11929 EXXON 0.61011 0.19072 TEXACO 0.69767 0.50637可见迭代主因子法所得因子负荷阵是 Variance explained by each factor FACTOR1 FACTOR2 2.454553 0.496758上表最后一行是每个因子负荷的平方和,反映因子的重要性:平方和越大,该因子越重要。本例中2.1187820 0.0.0573392,因子1比因子2重要。 Final Communality Estimates: Total = 2.951310 ALLCHEMI DUPONT UNIONCAR EXXON TEXACO

20、 0.491662 0.781354 0.526545 0.408606 0.743143上表是共性方差。如何比较不同估计方法的效果?一般说来,我们可以用共性方差的大小和方程(6.4)满足的程度来估价其效果。共性方差越大,特殊因子的方差越小,效果越好;(6.4)满足的程度越高,即分量绝对值越小,效果越好。四种方法共性方差列表如下方法AllChemiduPontUnionCarExxonTexaco主成分0.660708740.806483160.685885040.731154500.78137395极大似然0.503484300.748441430.525559560.390406460.8

21、2359299主因子0.473822620.432771060.486911110.411192370.37142401迭代主因子0.491661760.781353780.526545060.408606240.74314335可见主成分法共性方差大。另一方面,由于样本相关阵是对于主成分法对于极大似然法对于主因子法对于迭代主因子法可见,对于例6.4,极大似然法的拟合效果较好。但是极大似然法和迭代主因子法所得共性方差较小,从而特殊因子方差较大。迭代主因子法比主因子法效果好。通常所得的观测值都被简化为样本协差阵或样本相关阵,这时可以把样本协差阵或样本相关阵直接输入,从而计算因子负荷阵。例6.6

22、为了弄清员工的病情,对某学校员工进行调查,得到16种病的样本相关阵,其中x1:高血压;x2:临界高血压;x3:慢性肝病;x4:有肝炎病史;x5:颈胸腰椎病;x6:肺结核病;x7:有肺结核病史;x8:胃及12指肠溃疡;x9:有大手术史;x10:精神病;x11:肿瘤病;x12:糖料病;x13:心电图异常;x14:眼底网动脉硬化;x15:血脂高;x16:先天性或风湿性心脏病。表6-3 16种病的样本相关阵x1x2x3x4x5x6x7x8x9x10x11x12x13x14x15x161.5204.1478-.0357.3094.2063.3703.2911.3095-.3548.5248-.1525.

23、6728.7608.5543-.4007.1.3509.3354.7538.7772.7043.5258.3111-.2179.7216.3531.7929.8024.8244-.1530.1.7349.7585.0625.6069.8043.6419.4515.3698.7975.5031.5113.5830-.1520.1.8154.3894.7371.8824.7389.3850.0511.6985.4431.3714.5096.0855.1.6911.9410.9408.5915.2720.6933.6676.7410.7423.8964-.0047.1.7495.5254.1614-

24、.0551.4861.1990.5403.5255.7017.1614.1.8891.5068.3643.5440.6209.6456.7856.9200.0123.1.6575.3443.4524.6074.6972.6189.7845-.0218.1.0388-.0798.3684.4434.4831.3560-.1334.1.0425.6213-.3272.0897.2353.0304.1.2275.6448.7000.8044-.1647.1.2466.3951.5297-.0013.1.6855.7317-.2479.1.9053-.2827.1-.0745.1解 用变量x1-x6表

25、示16种疾病的病人数,采用SAS程序data helth(type=corr);_type_=corr;input _name_ $ x1-x16;cards;x1 1 .5204 .1478 -.0357 .3094 .2063 .3708 .2911 .3095 -.3548 .5248 -.1525 .6728 .7608 .5548 -.4007x2 . 1 .3509 .3354 .7538 .7772 .7043 .5258 .3111 -.2179 .7216 .3531 .7929 .8024 .8244 -.1530x3 . . 1 .7849 .7585 .0625 .60

26、89 .8043 .6419 .4515 .3698 .7975 .5031 .5113 .5830 -.1520 x4 . . . 1 .8154 .3894 .7371 .8824 .7889 .3850 .0511 .6985 .4461 .3714 .5096 .0855 x5 . . . . 1 .6911 .9410 .9408 .5915 .2720 .5933 .6676 .7410 .7428 .8964 -.0047 x6 . . . . . 1 .7495 .5254 .1614 -.0551 .4861 .1990 .5403 .5255 .7017 .1614 x7

27、. . . . . . 1 .8891 .5068 .3663 .5440 .6209 .6456 .7856 .9220 .0123 x8 . . . . . . . 1 .6575 .3443 .4524 .6074 .6972 .6189 .7845 -.0218x9 . . . . . . . . 1 .0388 -.0798 .3684 .4434 .4831 .3560 -.1334x10 . . . . . . . . . 1 .0425 .6213 -.3272 .0897 .2353 .0304x11 . . . . . . . . . . 1 .2275 .6448 .7000 .8044 -.1647x12 . . . . . . . . . . . 1 .2466 .3951 .5297 -.0013 x13 . . . . . . . . . . . . 1 .6855 .7317 -.2479x14 . . . . . . . . . . . . . 1 .9053 -.2827 x15 . . . . . . . . . . . . . . 1 -.0745x16 . . .

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!