主成分分析的应用例子[1]

上传人:jin****ng 文档编号:110729263 上传时间:2022-06-19 格式:DOC 页数:8 大小:517KB
收藏 版权申诉 举报 下载
主成分分析的应用例子[1]_第1页
第1页 / 共8页
主成分分析的应用例子[1]_第2页
第2页 / 共8页
主成分分析的应用例子[1]_第3页
第3页 / 共8页
资源描述:

《主成分分析的应用例子[1]》由会员分享,可在线阅读,更多相关《主成分分析的应用例子[1](8页珍藏版)》请在装配图网上搜索。

1、SPSS软件进行主成分分析的应用例子2002年16家上市公司4项指标的数据5见表2,定量综合赢利能力分析如下:表220(02年16家上市公司4项指标的数据公司销售净利率(X.)资产净利率(X2)净资产收益率(X)销售毛利率(X.)歌华有线43.317.39J8.7354.89五粮液17.1112.1317.2944.25用友软件21.116.037.0089.37太太药业29.558.6210.1373浙江阳光11.008.4111.8325.22烟台万华17.6313.8615.4136.44方正科技2.734.2217.169.96红河光明29.115.446.0956.26贵州茅台20.

2、299.4812.9782.23中铁二局3.994.649.3513.04红星发展22.6511.1314.350.51伊利股份4.437.3014.3629.04青岛海尔5.408.9012.5365.5湖北宜化7.062.795.2419.79雅戈尔19.8210.5318.5542.04福建南纸7.262.996.9922.721.主成分分析的做法第一,将EXCEL中的原始数据导入到SPSS软件中;注意:导入Spss的数据不能出现空缺的现象,如出现可用0补齐。第二,对四个指标进行标准化处理;【1】“分析”|“描述统计”|“描述”。【2】弹出“描述统计”对话框,首先将准备标准化的变量移入变

3、量组中,此时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点击确定。【3】返回SPSS的“数据视图”,此时就可以看到新增了标准化后数据的字段。所做工作:a.原始数据的标准化处理梢吉:争利拿(XI:资产審和拿(X2):争黄产收話辜:X3)梢査毛利皇CX4)1左I科技?.73丄221丁IE9.9627.262.09B.S922.723.317.3907354.09A20.299.J612.9?02.235红河光同3.115MEDA5E.26E红星富展22.6511131+.3050.517湖北宜化7.3?2:9辺19.7986.4D3?012.E3B6.60929.55a.G21D.13?

4、3W1017.1112IB1729J4.251119.8210.53185542041217.63130615136.44134.437.3014.3629.041出友软件i.03-0069.3715汀辽阳光11.anaT1B325.22IE中性二冃小64136数据标准化主要功能就是消除变量间的量纲关系,从而使数据具有可比性,可以举个简单的例子,一个百分制的变量与一个5分值的变量在一起怎么比较?只有通过数据标准化,都把它们标准到同一个标准时才具有可比性,一般标准化采用的是Z标准化,即均值为0,方差为1,当然也有其他标准化,比如0-1标准化等等,可根据自己的研究目的进行选择,这里介绍怎么进行数据

5、的Z标准化。所的结论:标准化后的所有指标数据。2梢匡:争利率CX1、工资产爭刊率CX2:卫争资产收益率個)蹦害毛利率1方正科技-1.19HE-1DBCEB127T12-1.422062焉遣甯纸0.801-1J584J-117-0.89&8532.3570.1C782-0.707070.420244敦1歸O/3JO570.53373D.207J41.51235红阿先阴1.113-07IZ639-13277E.47E41E红至世愿0.5735104021009969024C647湖北直W0.31EK1.519631.527311.018936-a.9E4ia3ES691B415.35S2am丈尢蛍

6、世1.15134匹盼-A3793C1.16261100.051941.3471?1.301E-1-0.1604110.29993O.0E0331.5S7J5-O.1OE0312網目万华.lazsa1B7H2IB602B-a.33E2a13悌利脚滸-1W9O3D13545D.613770.6397114用废牧件0.412420.525204114121.8340415曲:!阳光-0.473420.20520D.019B1-07963416中跌二&-1.00754-0951SE-05E2J2-1.295T7注意:SPSS在调用FactorAnalyze过程进行分析时,SPSS会自动对原始数据进行标

7、准化处理,所以在得到计算结果后的变量都是指经过标准化处理后的变量,但SPSS并不直接给出标准化后的数据,如需要得到标准化数据,则需调用Descriptives过程进行计算。第三,并把标准化后的数据保存在数据编辑窗口中然后利用SPSS的factor过程对数据进行因子分析(指标之间的相关性判定略)。【1】“分析”|“降维”|“因子分析”选项卡,将要进行分析的变量选入“变量”列表;【2】设置“描述”,勾选“原始分析结果”和“KMO与Bartlett球形度检验”复选框;【3】设置“抽取”,勾选“碎石图”复选框;【4】设置“旋转”,勾选“最大方差法”复选框;【5】设置“得分”,勾选“保存为变量”和“因子

8、得分系数”复选框;【6】查看分析结果。所做工作:a.查看KMO和Bartlett的检验KMO和Bartlett的检醞取样足鵰度的Kaiser-MeyebOlkin度罢Bartlett的球畛度检验近似卡方dfSig.45521.6476.001KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;Bartlett球度度检验的Sig值越小于显著水平0.05,越说明变量之间存在相关关系。所的结论:符合因子分析的条件,可以进行因子分析,并进一步完成主成分分析。注意:1. KMO(Kaiser-Meyer-Olkin)KMO统计量是取值在0和1之间。当所有变量间的简单相

9、关系数平方和远远大于偏相关系数平方和时,KMO值接近1.KM0值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO值接近0.KMO值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。Kaiser给出了常用的kmo度量标准:0.9以上表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合。2. Bartlett球度检验:巴特利特球度检验的统计量是根据相关系数矩阵的行列式得到的,如果该值较大,且其对应的相伴概率值小于用户心中的显著性水平,那么应该拒绝零假设,认为相关系数矩阵不可能是单位阵

10、,即原始变量之间存在相关性,适合于做主成份分析;相反,如果该统计量比较小,且其相对应的相伴概率大于显著性水平,则不能拒绝零假设,认为相关系数矩阵可能是单位阵,不宜于做因子分析。Bartlett球度检验的原假设为相关系数矩阵为单位矩阵,Sig值为0.001小于显著水平0.05,因此拒绝原假设,说明变量之间存在相关关系,适合做因子分析。所做工作:b.全部解释方差或者解释的总方差(TotalVarianceExplained)初贻特征值提取平方和载入台计方養的累秩方差的滋11.8974742947.4291.897-47.42947.4292-1.55038.740:1.55(138741S6.16

11、9395.9954.1604.005100.000提取方法;主成份分析&初始特征根(InitialEigenvalues)大于1,并且累计百分比达到80%85%以上。查看相关系数矩阵的特征根及方差贡献率见表3,由于前2个主成分贡献率285%、结合表4中变量不出现丢失,所以提取的主成分个数m=2。所的结论:初始特征根:入=1.897入=1.55012主成分贡献率:r=0.47429r=0.3874012注意:主成分的数目可以根据相关系数矩阵的特征根来判定,如前所说,相关系数矩阵的特征根刚好等于主成分的方差,而方差是变量数据蕴涵信息的重要判据之一。根据入值决定主成分数目的准则有三:1. 只取入1的

12、特征根对应的主成分从TotalVarianceExplained表中可见,第一、第二和第三个主成分对应的入值都大于1,这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分的。2. 累计百分比达到80%85%以上的入值对应的主成分在TotalVarianceExplained表可以看出,前三个主成分对应的入值累计百分比达到89.584%,这暗示只要选取三个主成分,信息量就够了。3. 根据特征根变化的突变点决定主成分的数量从特征根分布的折线图(ScreePlot)上可以看到,第4个入值是一个明显的折点,这暗示选取的主成分数目应有pW4。那么,究竟是3个还是4个呢?根据前面两条准则

13、,选3个大致合适(但小有问题)。第四,计算特征向量矩阵(主成分表达式的系数)【1】将初始因子载荷矩阵中的两列数据输入(可用复制粘贴的方法)到数据编辑窗口(为变量V1、V2);F=V/SQR(入)【2】然后利用“转换”|“计算变量”,打开“计算变量”对话框,在“目标变量”文本框中输入“叮,然后在数字表达式中输入“V/SQR(入厂注:入=1.897,即可得到特征向量F;111【3】然后利用“转换”|“计算变量”,打开“计算变量”对话框,在“目标变量”文本框中输入“F”,然后在数字表达式中输入“V/SQR(入)”注:入222=1.550,即可得到特征向量F;12【4】最后得到特征向量矩阵(主成分表达

14、式的系数)。所做工作:a.成分矩阵或者初始因子载荷矩阵(ComponentMatrix)ComponentMatrix匚orriponent12销售1争利率,731-.513资产浄利率.818.503浄瓷产收益率.359.897销售毛利率,752-.477初始因子载荷矩阵见上图,通过初始因子载荷矩阵还不能得出主成分的表达式,还需要把初始因子载荷矩阵中的每列的系数(主成分的载荷)除以其相应主成分的特征根的平方根后才能得到主成分系数向量(主成分的得出系数);所的结论:1用于计算主成分表达式系数的初始因子载荷矩阵中每个指标的载荷。VIV2娈呈10.73.6120B2.5030.36D.9D4075D

15、.4B52计算后,得到的主成分表达式的系数矩阵。VIV2F1F210.73-0.G10!04120.820.500.L90.J030.3E0.3002G0.72占0.750.80E6338注意:1. 主成分表达式的系数提取出来的全部主成分可以基本反映全部指标的信息,但这些新变量(主成分)的表达却不能从输出窗口中直接得到,即:主成分中每个指标所对应的系数不是初始因子载荷矩阵中的对应指标的载荷,因为“ComponentMatrix”是指初始因子载荷矩阵,每一个载荷量表示主成分与对应变量的相关系数。2. 主成分表达式系数的计算方法初始因子载荷矩阵或主成分载荷矩阵(ComponentMatrix)中的

16、数据除以主成分相对应的特征根(或特征值)开平方根便得到两个主成分中每个指标所对应的系数。F=V/SQR(入)1113. 主成分的指标划分与命名初始因子载荷矩阵或主成分载荷矩阵(ComponentMatrix)中每列表示相应主成分与对应变量的相关系数,每个主成分所反映的原始指标各有不同,为进一步明确每个主成分侧重反应的具体原始指标,需要对原始指标在每个主成分上的载荷进行比较,其中载荷越大,其对应的主成分反映该原始指标的信息量越大,反之亦然;如果某一原始指标在几个主成分的载荷绝对值不相上下,归类比较含混,导致主成分的原始指标划分不清。说明有必要作进一步的因子分析。从ComponentMatrix即

17、主成分载荷表中可以看出,哪一原始指标在哪一主成分上载荷绝对值较大,亦即与该主成分的相关系数较高【注:相关分为正负相关】。第五,计算主成分得分矩阵(主成分得分)【1】将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分函数的表达式;Z=F*zX+F*zX+F*zX+F*zX1Z=F*zX+F*zX+F*zX+F*zX(其中,zX为标准化后的数据)2 共1貂2233244i【2】然后利用“转换”|“计算变量”,打开“计算变量”对话框,在“目标变量”文本框中输入“,然后在数字表达式中输入“0.531*z(销售净利率)+0.594*z(资产净利率)+0.261*z(净资产收益率)+0.546*z

18、(销售毛利率)”注:F=0.531,0.594,0.261,0.546,即可得到特征向量Z;11【3】同理注:F=-0.412,0.404,0.720,-0.383】,可得到特征向量Z;22【4】求出16家上市公司的主成分值。所做工作:a.对原始数据标准化后的数据E梢害:争利率CX1工资产爭刊率CX2:卫争资产收益率個)ZiS毛利率X4)A1方正村邑-1DBCEB127T12-1.422062焉遣甯纸0.801-1J584J-117-0.89&8532.3570.1C782-0.707070.420241O/3JO570.53373D.297J41.51235红阿先阴1.113-07IZ639

19、13277E.47E41E红至世愿0.5735104021009969024C647湖北直W0.31EK1.519631.527311.018936-a.9E4ia3ES691B415.35S2a9丈尢蛍世1.15134匹盼-A.-79301.1626110b.oBiaS1.3471?1;01E-1-oB604110.29993O.0E0331.597-15-O.1OE0312網目万华.lazsa1B7H2IES02B-a.33E2a13悌利股悟-1W9O3D13545D.613770.6397114用启牧件0.412420.525204114121.83016戎:!阳光-0.473420.2

20、0520D.019B1-07963416中跌二&-1.00754-0951SE-05E2J2-1.295T7标准化后的数据;所的结论:1用于计算主成分表达式系数的初始因子载荷矩阵中每个指标的载荷。E销售净利車XDZ叢产净利萃OQ)X3)E悄售毛利苹-:XJ)Z1Z2S1方正科技-19eO5-i.aco8fl117112-1.42206-1./21.522-.1121肛844-1I16J7-D.B9BB5JD7-a72m2.35793=010782-0707970.42024123-16940.340570.533730.287441.641281.410.3151.11333JJ.7CG39-

21、13277&0.47E410.D9-1.066红呈览底.5J7351D4O2IDESSE9D.24DE412Da537湖北直化0J31E85-1.51963寸52731-1.01099-2.291998青良毎尔0.96期00.6965D184150.85528DJI0:5:別丈丈药丸3.2697J-0.3793-1.162811.31-1上10五規克.aE1941347171301EJ-D.01EIZ141IE1阳山0.29933009603159745-0.106E610314112咽台万华0.107931.07821D.E83200.336281.211.4613-1.0JOBJJ.135

22、460.61377-0.63971-0.031.D6U用我软件.41242-a5252日-1114121.H3JD4D丘2-10915淅迁阳洗-0.47342020520001901TL73B34-0560B016中諛二局:丝764C.9513E?.662-1.29577-zpo016注意:1.特征向量矩阵载荷的用运Z=F*zX+F*zX+F*zX+F*zXZ=F*zX+F*zX+F*zX+F*zX(其中,zX为标准化后的数据)第六,最后利用主成分函数、综合主成分公式:【1】将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分表达式;Z=r*Z+r*Z1122【2】然后利用“转换”|“计

23、算变量”,打开“计算变量”对话框,在“目标变量”文本框中输入“Z”,然后在数字表达式中输入“r*Z+r*Z”1122注:r=0.47429,r=0.3874,即可得到综合主成分;【3】综合主成分(赢利能力)值。所做工作:a.对原始数据标准化后的数据可肖售净利至(XI)2冕产净利車1X3)测售毛利豆Z1Z2S1方正科拒-1.19EO5-1.OEG301.27112-1.422C6-1721.522-0.30112-1-1I16J711田日B5JD7-a7232.35793町10782-0707970.42024123-16940.34C670.533731.2871.541281.410.315

24、1.11333-0.7C63t-1.327托L.47B410.09-1866红星冼辰口.57351D4a2lE39E90.24&412Da537期北盘化0.818-151983I62731-101099-229-09980.9G100.36560D.184150.85528D.210.359文贰商业-.151940.26S7J-0.379301.162011.31-1.D610.061941347171301-.O1ED411E1JE11欝勢;0.299330096031597450.10BE610314112眶1台万华0.107931.07821D.E83200.33G281.211.461

25、3-1.0-59090.135葩U.L137?-0.63971-0.031-6U用左软件口.41242-a5252日-1114121.0304E2-1BA15淅迁阳光0i7342J2O52ED019S1C.79E34-05606016巾談二局-1.00764-0.9519E-D.S6242-1.295772.D00.15标准化后的数据;所的结论:1用于计算主成分表达式系数的初始因子载荷矩阵中每个指标的载荷。ii刊2销舍净利至(XI利至(X2)E净蚩芦收摘至(X3)H誚芭毛利宇(X4)Z172z1方iE科技-1.19B05-1.0EO331.27112-1.422D6-1.721.520.232

26、:-0.00112-1.更畝-1/1164?-o.esaas-2.07-0.72-1.3332.357ES-01D78247D737D420241.231.69D.074禹州茅合O.340570533730287靭1541281.410310.655红河光明1.11338C7CS33-1.3277G叮76410.001.8B0.636U.31.0JO2-応沏1.200.6:0.7/7遇北宜忧-a.aiBEa-151933-T52731-101399-2.29-o.gg147e-O.96J1D39091E415DBS52B.21.35D.24衣丸药业1.15194O2E074-0.3793011

27、6201131-1.000.231C1五椁才0.061941.347171.30161-D.016D41.1G1.4G1.12110.299390.Q5EO31.59745-0.103661.031.411.0312.107501B7H21HEO2BD3362B1.211.4E1.1413-1.049C0013545061377-05337-0.831oe0.0214用定牧件0.41242-0.52528-11U121834皿0.62i.83-0.4415浙汇阳埋-O.d/3420.20528JfllfSI-.796340.56U.3D-0.03茁中铁二局-1.037E4-09519645E2

28、42-129577-2.00.15田注意:1.综合主成分得分的计算方法1122Z=r*Z+r*Z(Z:综合主成分得分;r:主成分贡献率;Z:主成分i得分)i5.主成分、综合主成分(赢利能力)值公司Z1Z2Z烟台万华1.211.461.14五粮液1.161.461.12雅戈尔1.031.411.03红星发展1.200.530.77贵州茅台1.41-0.310.55青岛海尔0.210.350.24太太药业1.31-1.080.20伊利股份-0.831.060.02浙江阳光-0.560.60-0.03歌华有线1.23-1.69-0.07方正科技-1.721.52-0.23用友软件0.62-1.89-0.44红河光明0.09-1.88-0.69中铁二局-2.000.15-0.89福建南纸-2.07-0.72-1.26湖北宜化-2.29-0.99-1.47

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!