主成分分析完整版课件

上传人:txadgkn****dgknqu... 文档编号:204689443 上传时间:2023-04-27 格式:PPT 页数:28 大小:415KB
收藏 版权申诉 举报 下载
主成分分析完整版课件_第1页
第1页 / 共28页
主成分分析完整版课件_第2页
第2页 / 共28页
主成分分析完整版课件_第3页
第3页 / 共28页
资源描述:

《主成分分析完整版课件》由会员分享,可在线阅读,更多相关《主成分分析完整版课件(28页珍藏版)》请在装配图网上搜索。

1、主成分分析主成分分析Principalcomponentanalysis1感谢下载主成分分析的基本思想主成分分析的基本思想主成分的计算主成分的计算主成分分析的应用主成分分析的应用2感谢下载主成分分析的基本思想主成分分析的基本思想主主成成分分分分析析就就是是把把原原有有的的多多个个指指标标转转化化成成少少数数几几个个代代表表性性较较好好的的综综合合指指标标,这这少少数数几几个个指指标标能能够够反反映映原原来来指指标标大大部部分分的的信信息息(85%以以上上),并并且且各各个个指指标标之之间间保保持持独独立立,避避免免出出现现重重叠叠信信息息。主主成成分分分分析析主主要要起起着着降降维维和和简化数

2、据结构简化数据结构的作用。的作用。1 1 基本思想基本思想3感谢下载主主成成分分分分析析是是把把各各变变量量之之间间互互相相关关联联的的复复杂杂关关系系进进行行简简化化分析的方法。分析的方法。在在社社会会经经济济的的研研究究中中,为为了了全全面面系系统统的的分分析析和和研研究究问问题题,必必须须考考虑虑许许多多经经济济指指标标,这这些些指指标标能能从从不不同同的的侧侧面面反反映映我我们们所所研研究究的的对对象象的的特特征征,但但在在某某种种程程度度上上存存在在信信息息的的重重叠叠,具具有有一一定定的相关性。的相关性。主主成成分分分分析析试试图图在在力力保保数数据据信信息息丢丢失失最最少少的的原

3、原则则下下,对对这这种种多多变变量量的的截截面面数数据据表表进进行行最最佳佳综综合合简简化化,也也就就是是说说,对对高维变量空间进行降维处理。高维变量空间进行降维处理。很很显显然然,识识辨辨系系统统在在一一个个低低维维空空间间要要比比在在一一个个高高维维空空间间容易得多。容易得多。4感谢下载(1)基于相关系数矩阵基于相关系数矩阵/协方差矩阵做主成分分析?协方差矩阵做主成分分析?(2)选择几个主成分?选择几个主成分?(3)如何解释主成分所包含的实际意义?如何解释主成分所包含的实际意义?在在力力求求数数据据信信息息丢丢失失最最少少的的原原则则下下,对对高高维维的的变变量量空空间间降降维维,即即研研

4、究究指指标标体体系系的的少少数数几几个个线线性性组组合合,并并且且这这几几个个线线性性组组合合所所构构成成的的综综合合指指标标将将尽尽可可能能多多地地保保留留原原来来指指标标变变异异方方面面的信息。这些综合指标就称为主成分。的信息。这些综合指标就称为主成分。要讨论的问题是:要讨论的问题是:5感谢下载2 2 数学模型与几何解释数学模型与几何解释假设我们所讨论的实际问题中,有假设我们所讨论的实际问题中,有p个指标,我们把这个指标,我们把这p个指标看作个指标看作p个随机变量,记为个随机变量,记为X1,X2,Xp,主成分分,主成分分析就是要把这析就是要把这p个指标的问题,转变为讨论个指标的问题,转变为

5、讨论m个新的指标个新的指标F1,F2,Fm(mp),按照保留主要信息量的原则充分反映),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。原指标的信息,并且相互独立。其中其中6感谢下载这种由讨论这种由讨论多个指标多个指标降为降为少数几个少数几个综合指标的过程在数学上就叫综合指标的过程在数学上就叫做做降维降维。主成分分析通常的做法是,。主成分分析通常的做法是,寻求原指标的线性组合寻求原指标的线性组合Fi。满足如下的条件:满足如下的条件:主成分之间相互独立,即无重叠的信息。即主成分之间相互独立,即无重叠的信息。即主成分的方差依次递减,重要性依次递减,即主成分的方差依次递减,重要性依次递减

6、,即每个主成分的系数平方和为每个主成分的系数平方和为1。即。即7感谢下载主主成成分分分分析析的的几几何何解解释释旋转坐标轴旋转坐标轴旋转变换的目的是为了使得旋转变换的目的是为了使得n个个样本点在样本点在F1轴方向上的离散程度最轴方向上的离散程度最大,即大,即F1的方差最大,变量的方差最大,变量F1代代表了原始数据的绝大部分信息,在表了原始数据的绝大部分信息,在研究某经济问题时,即使不考虑变研究某经济问题时,即使不考虑变量量F2也损失不多的信息。也损失不多的信息。F1与与F2除起了浓缩作用外,还具除起了浓缩作用外,还具有不相关性。有不相关性。F1称为第一主成分,称为第一主成分,F2称为第二称为第

7、二主成分。主成分。8感谢下载主成分的计算主成分的计算先讨论二维情形先讨论二维情形求第一主成分求第一主成分F1和和F2。我们已经把主成分我们已经把主成分F1和和F2 的坐标原点放的坐标原点放在平均值在平均值 所在处,从而使得所在处,从而使得F1和和F2 成为成为中心化的变量,即中心化的变量,即F1和和F2 的样本均值都为零。的样本均值都为零。9感谢下载因此F1可以表示为关键是,寻找合适的单位向量 ,使F1的方差最大。问题的答案是:X的协方差矩阵S 的最大特征根 所对应的单位特征向量即为 。并且 就是F1的方差。10感谢下载同样,同样,F2可以表示为可以表示为寻找合适的单位向量寻找合适的单位向量

8、,使,使F2与与F1独立,独立,且使且使F2的方差(除的方差(除F1之外)最大。之外)最大。问题的答案问题的答案是:是:X的协方差矩阵的协方差矩阵S的第二大特征根的第二大特征根 所对应的单位特征向量即为所对应的单位特征向量即为 。并且。并且 就就是是F2的方差。的方差。11感谢下载其中,其中,aij称为因子载荷量称为因子载荷量因子载荷量:主成分与变量间的相关系数,因子载荷量:主成分与变量间的相关系数,即:因子载荷量的大小和它前面的正负号直接反映了即:因子载荷量的大小和它前面的正负号直接反映了主成分与相应变量之间关系的密切程度和方向。从而可以说主成分与相应变量之间关系的密切程度和方向。从而可以说

9、明各主成分的意义明各主成分的意义12感谢下载求解主成分的步骤:求解主成分的步骤:1.求样本均值求样本均值 和样本协方差矩阵和样本协方差矩阵S;2.求求S的特征根的特征根求解特征方程求解特征方程 ,其中,其中I是单位矩阵,是单位矩阵,解得解得2个特征根个特征根 3.求特征根所对应的单位特征向量求特征根所对应的单位特征向量4.写出主成分的表达式写出主成分的表达式13感谢下载身高身高x1(cm)胸围胸围x2(cm)体重体重x3(kg)149.5162.5162.7162.2156.5156.1172.0173.2159.5157.769.577.078.587.574.574.576.581.574

10、.579.038.555.550.865.549.045.551.059.543.553.5例例1下表是下表是10位学生的身高位学生的身高、胸围、胸围、体重、体重的数据。的数据。对此进行主成分分析。对此进行主成分分析。14感谢下载1.求样本均值和样本协方差矩阵求样本均值和样本协方差矩阵 2.求解协方差矩阵的特征方程求解协方差矩阵的特征方程 3.解得三个特征值解得三个特征值 和对应的单位特征向量:和对应的单位特征向量:15感谢下载4.由此我们可以写出三个主成分的表达式:5.主成分的含义F1表示学生身材大小。F2反映学生的体形特征 16感谢下载三个主成分的方差贡献率分别为:前两个主成分的累积方差贡

11、献率为:17感谢下载在一般情况下,设有n个样品,每个样品观测p个指 标,将原始数据排成如下矩阵:多指标多指标 求解主成分的步骤:求解主成分的步骤:18感谢下载1.求样本均值和样本协方差矩阵S;2.求解特征方程=0,其中I是单位矩阵,解得p个特征根3.求所对应的单位特征向量 解得 4.写出主成分的表达式 19感谢下载根据累积贡献率的大小取前面m 个(mp)主成分选取原则:且主成分个数的选取原则20感谢下载例例 设设 的协方差矩阵为的协方差矩阵为作主成分分析。作主成分分析。解:解:如果从如果从 出发作主成分分析,易求得其特征出发作主成分分析,易求得其特征值和相应的正交单位化特征向量为值和相应的正交

12、单位化特征向量为 的两个主成分分别为的两个主成分分别为 第一主成分的贡献率为第一主成分的贡献率为21感谢下载R R 型分析型分析为消除为消除量纲量纲影响,在计算之前先将原始数据影响,在计算之前先将原始数据标准化标准化。标准。标准化变量的化变量的S=R,所以用,所以用标准化变量标准化变量进行主成分分析相当于进行主成分分析相当于从原变量的从原变量的相关矩阵相关矩阵 R 出发进行主成分分析。统计学上称出发进行主成分分析。统计学上称这种分析法为这种分析法为R R型分析型分析,由协方差矩阵出发的主成分分析为,由协方差矩阵出发的主成分分析为S S型分析型分析。S型分析和型分析和R型分析的结果是不同的。在一

13、般情况下,型分析的结果是不同的。在一般情况下,若各变量的量纲不同,通常采用若各变量的量纲不同,通常采用R R型分析型分析。R型分析的概念型分析的概念22感谢下载这里我们需要进一步强调的是,从相关阵求得的主这里我们需要进一步强调的是,从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。成分与协差阵求得的主成分一般情况是不相同的。实际表明,这种差异有时很大。实际表明,这种差异有时很大。我们认为,如果各指标之间的数量级相差悬殊,特我们认为,如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做别是各指标有不同的物理量纲的话,较为合理的做法是使用法是使用R代替代替。对于

14、研究经济问题所涉及的变量单位大都不统一,对于研究经济问题所涉及的变量单位大都不统一,采用采用R代替代替后,可以看作是用标准化的数据做分后,可以看作是用标准化的数据做分析,这样使得主成分有现实经济意义,不仅便于剖析,这样使得主成分有现实经济意义,不仅便于剖析实际问题,又可以避免突出数值大的变量。析实际问题,又可以避免突出数值大的变量。23感谢下载主成分分析的步骤主成分分析的步骤 1.1.将原始数据标准化;将原始数据标准化;2.2.根根据据标标准准化化变变量量求求出出协协方方差差矩矩阵阵(标标准准化化后后协协方方差差矩矩阵与相关矩阵完全一样);阵与相关矩阵完全一样);3.3.求求出出相相关关矩矩阵

15、阵的的特特征征值值,计计算算累累计计贡贡献献率率,及及其其对对应应的特征向量;的特征向量;4.4.确定主成分,进一步分析。确定主成分,进一步分析。对于对于X=(X1,X2,Xp),设设则标准化变量为则标准化变量为24感谢下载企业的经济效益分析企业的经济效益分析某某市市对对下下属属1010个个企企业业作作经经济济效效益益分分析析,根根据据经经济济统统计计原原理理,用用取取得得的的生生产产成成果果与与各各项项成成本本的的消消耗耗作作对对比比,来来衡衡量量每每个个企企业业的的经济效益,也就是用下述五个指标来对每个企业进行分析。经济效益,也就是用下述五个指标来对每个企业进行分析。Z1:固定资产的产值率

16、:固定资产的产值率Z2:净产值劳动生产率:净产值劳动生产率Z3:万元产值的流动资金占用率:万元产值的流动资金占用率Z4:万元产值利润率:万元产值利润率Z5:万元资金的利润率:万元资金的利润率25感谢下载1、数据标准化、数据标准化2、求相关矩阵求相关矩阵R3、计计算算R的的特特征征值值及及累累积积贡贡献献率率,并并计计算算相相应应的的特特征征向量向量经过计算取经过计算取2个主成分,信息的可靠程度超过个主成分,信息的可靠程度超过85%26感谢下载4、分析意义第第j个企业的第一主成分值为个企业的第一主成分值为各企业的第一主成分值如下表各企业的第一主成分值如下表0.77-1.8-1.160.105-0

17、.84-1.2053.830.960.33-0.99311.第第一主成分一主成分F1的意义的意义在在F1的的表表达达式式中中,只只有有第第三三个个指指标标Z3(万万元元产产值值流流动动资资金金占占用用率率)的的系系数数为为负负值值(-0.45),而而Z5的的系系数数最最大大,Z5与与Z3是是刻刻画画企企业业经经营营水水平平高高低低的的。当当Z3取取值值较较小小,Z5取取值值较较大大时时,F1就就较较大。于是大。于是F1在此突出地反映了一个企业经营水平的高低。在此突出地反映了一个企业经营水平的高低。由由计计算算结结果果可可见见,企企业业7的的经经营营水水平平最最高高,企企业业2的的经经营营水水平

18、平最最低。低。27感谢下载2.第二主成分第二主成分F2的意义的意义第第j个企业的第二主成分值为个企业的第二主成分值为各企业的第二主成分值如下表各企业的第二主成分值如下表-2.070.0927-2.1803-0.70770.4047-0.1223-0.43401.96021.7771.3257F2除了第一系数为正之外,其他约为负值,其中除了第一系数为正之外,其他约为负值,其中Z4系数绝对值最大。系数绝对值最大。Z1的意义是投资水平,的意义是投资水平,Z4的意义是销售水平。如果投资大,销售水的意义是销售水平。如果投资大,销售水平低,自然平低,自然F2的值会增大。所以的值会增大。所以F2的值较小时,反映企业的投资与的值较小时,反映企业的投资与收益比值较小。由此看来,企业收益比值较小。由此看来,企业8,9,10的的F2值趋大,应属于不景值趋大,应属于不景气范围。企业气范围。企业7的投资虽最大,但盈利水平居高,因此的投资虽最大,但盈利水平居高,因此F2值较小。企值较小。企业业1,3的的F2值最小,反映这两个企业投资额与销售额之比最小,因值最小,反映这两个企业投资额与销售额之比最小,因此是经济效益好的企业。由于此是经济效益好的企业。由于上述分析应该有上述分析应该有90%以上的可信度。以上的可信度。28感谢下载

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!