MATLAB主成分分析

上传人:daj****de2 文档编号:117504776 上传时间:2022-07-08 格式:DOCX 页数:3 大小:12.73KB
收藏 版权申诉 举报 下载
MATLAB主成分分析_第1页
第1页 / 共3页
MATLAB主成分分析_第2页
第2页 / 共3页
MATLAB主成分分析_第3页
第3页 / 共3页
资源描述:

《MATLAB主成分分析》由会员分享,可在线阅读,更多相关《MATLAB主成分分析(3页珍藏版)》请在装配图网上搜索。

1、1. princomp功能:主成分分析格式:PC二princomp(X)PC,SCORE,latent,tsquare=princomp(X)说明: PC,SCORE,latent,tsquare=princomp(X) 对数据矩阵 X 进行主成分 分析,给出各主成分(PC)、所谓的Z-得分(SCORE)、X的方差矩阵的特征值(latent) 和每个数据点的HotellingT2统计 量(tsquare)。2. pcacov功能:运用协方差矩阵进行主成分分析格式: PC=pcacov(X)PC,latent,explained=pcacov(X)说明: PC,latent,explained=

2、pcacov(X) 通过协方差矩阵 X 进行主成分分 析,返回主成分(PC)、协方差矩阵X的特征值(la ten t)和每个特征向量表征在观 测量总方差中所占的百分数(explained)。3. pcares功能:主成分分析的残差格式: residuals=pcares(X,ndim)说明: pcares(X,ndim) 返回保留 X 的 ndim 个主成分所获的残差。注意, ndim 是一个标量,必须小于 X 的列数。而且, X 是数据矩阵,而不是协方差矩阵。4. barttest功能:主成分的巴特力特检验格式: ndim=barttest(X,alpha) ndim,prob,chisqu

3、are=barttest(X,alpha) 说明:巴特力特检验是一种等方差性检验。 ndim=barttest(X,alpha) 是在显 著性水平 alpha 下,给出满足数据矩阵 X 的非随机变量的 n 维模型, ndim 即模 型维数,它由一系列假设检验所确定, ndim=1 表明数据 X 对应于每个主成分的 方差是相同的;ndim=2表明数据X对应于第二成分及其余成分的方差是相同的。第一种方法:用 matlab 的各个函数组合得到的结果 clc;clear;X=28 1 1100 5 0;5 2 1200 1 2;10 9 1010 2 0;4 8 700 6 2;31 2 200 7

4、2;4 1 1100 0.5 1;5 1 1100 3 0;26 7 400 6 2; p=mean(X); %每一列的平均值 pq=repmat(p,8,1); b=std(X); %每一列的标准差 bq=repmat(b,8,1); ding = (X-pq)./bq; %标准化矩阵dd =cov(ding); %协方差计算 or dd=ding*ding/13V,D=eig(dd); %计算特征值和特征向量,V是特征向量,D是特征值W = 0.2004 0.5401 0.4460;0.5989-0.72690.1889;0.06350.0608-0.5782;0.18580.13400.

5、5507;-0.7500-0.39780.3575;% 前三个85%,得到的主成分系数,Y= ding *WY =0.71891.7805-0.1687-1.2866-0.4645-1.28151.5565-0.8752-0.92440.0146-1.57580.8769-0.57680.86492.5466-0.77250.0577-1.68920.18630.6378-1.46350.1594 -0.4250 2.1036第二种方法:用 matlab 的自带函数 princomp 得到的结果 pc,score,latent,tsquare = princomp(X);pc =-0.0249

6、 0.9933 0.0934 -0.0575 0.0250 -0.0028-0.09670.9941-0.04130.02790.99970.02470.00530.00370.0030-0.00550.04960.04210.98840.1372-0.0016-0.0293-0.0362-0.13440.9898为什么结果不一样呢?第三种方法用 spss 软件来做,结果让我更加不解, 我迷茫了第一种和第二种方法应该能得到相同结果1、你第一种方法中得到的特征向量矩阵是主成分系数(标准化后变量的主成分 系数),而最后计算的矩阵 Y 是每个样本数据的主成分得分;2、第二种方法应该对标准化矩阵用 p

7、rincomp 处理,对原始数据直接用当然得到 不同的结果3、pc,score,latent,tsquare二 princomp()结果中 pc 是主成分系数,latent 是特征值,应该和第一种方法中得到的特征向量和特征值相同;score是主成分 得分,应该和 Y 相同。4、SPSS 中得到的结果不同是因为其计算方法和 MATLAB 稍有差异,两种结果应 该成某个倍数关系(特征值取法不一样),但是结论是一致的,不影响分析5、MATLAB 中对原始数据标准化可以直接用 zscore 函数主成分分析和因子分析的区别1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成 分表示成个

8、变量的线性组合。2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释 各变量之间的协方差。3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因 子分析的假设包括:各个共同因子之间不相关,特殊因子(specific fac tor) 之间也不相关,共同因子和特殊因子之间也不相关。4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候, 的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不到的因 子。5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定, 只要是特征值大于 1 的因子进入分析),而指定的因

9、子数量不同而结果不同。在 主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面 更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候, 更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的 变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后 续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。 所以这中区分不是绝对的。总的来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分 析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要 的。主成分分析一般很少单独使用,通常用做以下用途:a 了解数据(screening the data);b 和 cluster analysis 一起使用;c 和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化(reduce dimensionali ty);d 在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差 矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各 因子所解释的部分。)。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!