《典型相关系数》PPT课件

上传人:xt****7 文档编号:182415623 上传时间:2023-01-23 格式:PPT 页数:90 大小:466KB
收藏 版权申诉 举报 下载
《典型相关系数》PPT课件_第1页
第1页 / 共90页
《典型相关系数》PPT课件_第2页
第2页 / 共90页
《典型相关系数》PPT课件_第3页
第3页 / 共90页
资源描述:

《《典型相关系数》PPT课件》由会员分享,可在线阅读,更多相关《《典型相关系数》PPT课件(90页珍藏版)》请在装配图网上搜索。

1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程第七章 典型相关与对应分析n7.1 典型相关分析典型相关分析n7.2 对应分析对应分析STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n7.1 7.1 典型相关分析典型相关分析n7.1.1 典型相关分析的概念与步骤典型相关分析的概念与步骤n7.1.2 用用INSIGHT模块实现典型相关分析模块实现典型相关分析n7.1.3 用用“分析家分析家”实现典型相关分析实现典型相关分析n7.1.4 用用CANCORR过程实现典型相关分析过程实现典型相关分析STATSTATSTATSTATSASS

2、AS软件与统计应用教程软件与统计应用教程7.1.1 典型相关分析的概念与步骤典型相关分析的概念与步骤1.1.典型相关分析的基本思想典型相关分析的基本思想 典型相关分析采用主成分的思想浓缩信息,根据变量典型相关分析采用主成分的思想浓缩信息,根据变量间的相关关系,寻找少数几对综合变量间的相关关系,寻找少数几对综合变量(实际观测变量实际观测变量的线性组合的线性组合),用它们替代原始观测变量,从而将二组,用它们替代原始观测变量,从而将二组变量的关系集中到少数几对综合变量的关系上,通过对变量的关系集中到少数几对综合变量的关系上,通过对这些综合变量之间相关性的分析,回答两组原始变量间这些综合变量之间相关性

3、的分析,回答两组原始变量间相关性的问题。除了要求所提取的综合变量所含的信息相关性的问题。除了要求所提取的综合变量所含的信息量尽可能大以外,提取时还要求第一对综合变量间的相量尽可能大以外,提取时还要求第一对综合变量间的相关性最大,第二对次之,依次类推。关性最大,第二对次之,依次类推。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 这些综合变量被称为典型变量,或典则变量,第这些综合变量被称为典型变量,或典则变量,第1对对典型变量间的相关系数则被称为第典型变量间的相关系数则被称为第1典型相关系数。典典型相关系数。典型相关系数能简单、完整地描述两组变量间关系的指标。型

4、相关系数能简单、完整地描述两组变量间关系的指标。当两个变量组均只有一个变量时,典型相关系数即为简当两个变量组均只有一个变量时,典型相关系数即为简单相关系数;当其中的一组只有一个变量时,典型相关单相关系数;当其中的一组只有一个变量时,典型相关系数即为复相关系数。系数即为复相关系数。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.典型相关系数与典型相关变量典型相关系数与典型相关变量 设设X=(X1,X2,Xp),Y=(Y1,Y2,Yq)是两是两个随机向量。利用主成分思想寻找第个随机向量。利用主成分思想寻找第i对典型相关变量对典型相关变量(Ui,Vi):Ui=

5、ai1X1+ai2X2+aipXp=aiXVi=bi1Y1+bi2Y2+biqYq=biYi=1,2,m=min(p,q);称;称ai和和bi为(第为(第i对)典对)典型变量系数或典型权重。型变量系数或典型权重。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 记第一对典型相关变量间的典型相关系数为:记第一对典型相关变量间的典型相关系数为:CanR1=Corr(U1,V1)(使(使U1与与V1间最大相关);间最大相关);第二对典型相关变量间的典型相关系数为:第二对典型相关变量间的典型相关系数为:CanR2=Corr(U2,V2)(与(与U1、V1无关;使无关;使

6、U2与与V2间最间最大相关)大相关)第第m对典型相关变量间的典型相关系数为:对典型相关变量间的典型相关系数为:CanRm=Corr(Um,Vm)(与(与U1,V1,Um1,Vm1无无关;关;Um与与Vm间最大相关)间最大相关)STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.典型相关变量的性质典型相关变量的性质 各对典型相关变量所包括的相关信息互不交叉,且满各对典型相关变量所包括的相关信息互不交叉,且满足:足:1)U1,U2,Um互不相关,互不相关,V1,V2,Vm互不互不相关,即其相关系数为相关,即其相关系数为jijiVVCorrjijiUUCorrji

7、ji,0,1),(,0,1),(STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2)同一对典型相关变量同一对典型相关变量Ui和和Vi之间的相关系数为之间的相关系数为CanRi,不同对的典型相关变量之间互不相关,即:,不同对的典型相关变量之间互不相关,即:3)Ui和和Vi的均值为的均值为0,方差为,方差为1(i=1,m)。)。4)1 CanR1 CanR2 CanRm 0jijiCanRVUCorriji0),(STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.典型相关系数的求解步骤典型相关系数的求解步骤 1)求求X,Y变量

8、组的相关阵变量组的相关阵 R=;2)求矩阵求矩阵A=(R11)1R12(R22)1R21和和B=(R22)1R21(R11)1R12,可以证明可以证明A、B有相同的非零特征值;有相同的非零特征值;3)求求A或或B的特征值的特征值i与与CanRi,A或或B的特征值即为典的特征值即为典型相关系数的平方:型相关系数的平方:i=(CanRi)2,i=1,m。22211211RRRRSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4)求求A、B关于关于i的特征向量。设的特征向量。设ai为为A关于关于i的特征向的特征向量,量,bi为为B关于关于i的特征向量,则的特征向量,

9、则ai和和bi为为(第(第i对)典型对)典型变量系数。即第变量系数。即第i对典型相关变量对典型相关变量(Ui,Vi):Ui=aiX*=ai1X1*+ai2X2*+aipXp*Vi=biY*=bi1Y1*+bi2Y2*+biqYq*i=1,2,m=min(p,q);其中;其中X*,Y*为原变量组为原变量组的标准化。的标准化。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程5.5.特征根特征根 特征根特征根(eigenvalue)是方差分析和多元检验的基础,特是方差分析和多元检验的基础,特征根与典型相关系数之间的数量关系为:征根与典型相关系数之间的数量关系为:上式可

10、以理解为第上式可以理解为第i对典型变量表示观测变量总方差对典型变量表示观测变量总方差作用的指标,它的值越大说明表示作用越大。作用的指标,它的值越大说明表示作用越大。221iiCanRCanRi特征根第STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程6.6.典型相关系数的标准误典型相关系数的标准误7.7.典型相关系数的假设检验典型相关系数的假设检验 典型相关系数的假设检验包括对全部总体典型相关系典型相关系数的假设检验包括对全部总体典型相关系数的检验和对部分总体典型相关系数的检验。对数据的数的检验和对部分总体典型相关系数的检验。对数据的要求:要求:1)两个变量组均应

11、服从多维正态分布:两个变量组均应服从多维正态分布:(X,Y)Np+q(,2)2)n p+q112nCanRCanRSEiiSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(1)全部总体典型相关系数为全部总体典型相关系数为0 H0:CanRi=0,i=1,m H1:至少有一个:至少有一个CanRi 0 检验的似然比统计量为检验的似然比统计量为对于充分大的对于充分大的n,当,当H0成立时,统计量成立时,统计量近似服从自由度为近似服从自由度为pq的的 2分布。分布。miir121)1(11ln)3(21qpnQSTATSTATSTATSTATSASSAS软件与统计应用

12、教程软件与统计应用教程(2)部分总体典型相关系数为部分总体典型相关系数为0 仅对较小的典型相关作检验:仅对较小的典型相关作检验:H0:CanRi=0,i=s,m,2 s m H1:至少有一个:至少有一个CanRi 0其检验的统计量为其检验的统计量为对于充分大的对于充分大的n,当,当H0成立时,统计量成立时,统计量近似服从自由度为近似服从自由度为(p k)(q k)的的 2分布。分布。mkiikr121)1(1121ln)3(21kkiikrqpknQSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程7.1.2 用用INSIGHT模块实现典型相关分析模块实现典型相关

13、分析1.1.实例实例【例【例7-1】1985年中国年中国28省市城市男生省市城市男生(1922岁岁)的调查的调查数据,见表数据,见表7-1。其中。其中6项形态指标:身高项形态指标:身高(cm)、坐高、坐高、体重体重(kg)、胸围、肩宽、盆骨宽,分别记为、胸围、肩宽、盆骨宽,分别记为x1,x2,x6;5项机能指标:脉搏项机能指标:脉搏(次次/分分)、收缩压、收缩压(mmHg)、舒张、舒张压压(变音变音)、舒张压、舒张压(消音消音)、肺活量、肺活量(ml),分别记为,分别记为y1,y2,y5。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表7-1 城市男生(192

14、2岁)形态与机能调查数据设表中数据已经存放在数据集中,试分析形态指标和机设表中数据已经存放在数据集中,试分析形态指标和机能指标这两组变量间的相关性。能指标这两组变量间的相关性。编号身高x1坐高x2体重x3胸围x4肩宽x5盆骨宽x6脉搏y1收缩压y2舒张压y3舒张压y4肺活量y51173.2893.6260.186.7238.9727.5175.3117.474.661.845082172.0992.8360.3887.3938.6227.8276.7120.177.166.244693171.4692.7859.7485.5938.8327.4675.8121.875.265.44398417

15、0.0892.2558.0485.9238.3327.2976.1115.173.861.340685170.6192.3659.6787.4638.3827.1472.9119.477.567.1433916167.9490.9155.9786.6638.1727.1676.2110.968.556.8414117168.8291.356.0785.8737.6126.6777.2113.87157.5390518168.0291.2655.2885.6339.6628.0774.5117.27463.8394319167.8790.9655.7984.9238.226.5374.3112.

16、369.350.2419520168.1591.554.5684.8138.4427.3877.5117.475.363.6403921168.9991.5255.1186.2338.327.1477.7113.372.152.84238STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.分析设置分析设置 在在INSIGHT模块中打开数据集。模块中打开数据集。1)选择菜单选择菜单“Analyze”“Multivariate(Y X)(多元分(多元分析)析)”,打开,打开“Multivariate(Y X)”对话框;对话框;2)将将6项形态指标:项形态指标:x

17、1至至 x6选为选为X变量,将变量,将5项机能指项机能指标:标:y1至至 y5选为选为Y变量,如图变量,如图7-1左所示。左所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3)单击单击“Output”按钮,在打开的对话框中选中按钮,在打开的对话框中选中“Canonical Correlation Analysis(典型相关分析)(典型相关分析)”复选框,单击下面的复选框,单击下面的“Canonical Correlation Options(典 型 相 关 选 项)(典 型 相 关 选 项)”按 钮,打 开按 钮,打 开“C a n o n i c a

18、l Correlation Options”对话框对话框,并按下图右所示设置。并按下图右所示设置。4)三次单击三次单击“OK”按钮,得到分析结果。按钮,得到分析结果。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.结果分析结果分析(1)典型相关系数典型相关系数 第第1典型相关系数为,校正值为,标准误差为,典型典型相关系数为,校正值为,标准误差为,典型相关系数的平方为;第相关系数的平方为;第2典型相关系数为,校正值为,典型相关系数为,校正值为,标准误差为,典型相关系数的平方为,如图所示。标准误差为,典型相关系数的平方为,如图所示。前两个典型相关系数比形态指

19、标和机能指标两组间的前两个典型相关系数比形态指标和机能指标两组间的任何一个相关系数都大。任何一个相关系数都大。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2)典型变量所解释的变异典型变量所解释的变异 第二部分是的第二部分是的5个特征根(个特征根(Eigenvalues),包括:特),包括:特征根、相邻两个特征根之差、特征根所占方差信息量的征根、相邻两个特征根之差、特征根所占方差信息量的比例和累积方差信息量的比例。从中可以看出,前两对比例和累积方差信息量的比例。从中可以看出,前两对典型变量所能解释的变异占总变异(方差)的典型变量所能解释的变异占总变异(方差)

20、的91.18%,如图如图7-4所示。其它三个典型相关变量的作用很小,一所示。其它三个典型相关变量的作用很小,一共只解释了总变异的共只解释了总变异的9%,可以不予考虑。,可以不予考虑。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(3)典型相关系数的检验典型相关系数的检验 用似然比法检验典型相关系数与零的差别是否显著,用似然比法检验典型相关系数与零的差别是否显著,其原假设为小于此对典型变量典型相关系数的所有典型其原假设为小于此对典型变量典型相关系数的所有典型相关系数都为相关系数都为0,其,其p值依次为,和等等,如图值依次为,和等等,如图7-5所示,所示,说明前两

21、对典型相关系数基本具有显著意义(在的显著说明前两对典型相关系数基本具有显著意义(在的显著水平下)。因此,两组变量相关性的研究可转化为研究水平下)。因此,两组变量相关性的研究可转化为研究前两对典型相关变量的相关性。前两对典型相关变量的相关性。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(4)典型相关结构典型相关结构 典型相关结构(下图)分别是各组原始变量与典型变典型相关结构(下图)分别是各组原始变量与典型变量两两之间的相关系数矩阵。从相关系数判断,形态指量两两之间的相关系数矩阵。从相关系数判断,形态指标中除标中除x5()、()、x6()外各变量与第一典型变量间

22、的相()外各变量与第一典型变量间的相关性都比较高,机能指标中除关性都比较高,机能指标中除y2()外各变量与第一典()外各变量与第一典型变量间的相关性也都比较高。型变量间的相关性也都比较高。x5与第二典型变量间的相关性比较高,与第二典型变量间的相关性比较高,y2与第二典型与第二典型变量间的相关性比较高。变量间的相关性比较高。y1与前两个典型变量的相关系数为负值。与前两个典型变量的相关系数为负值。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 说明,第一对典型变量对肩宽说明,第一对典型变量对肩宽x5和收缩压和收缩压y2的解释作的解释作用不大。用不大。另外,从形态指

23、标组的变量和机能指标组的典型变量另外,从形态指标组的变量和机能指标组的典型变量之间,以及机能指标组的变量和形态指标组的典型变量之间,以及机能指标组的变量和形态指标组的典型变量之间的相关系数可见,各组变量与前两对典型变量之间之间的相关系数可见,各组变量与前两对典型变量之间均有较强的相关。均有较强的相关。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(5)标准化变量的典型相关变量的系数标准化变量的典型相关变量的系数 输出结果中还给出标准化变量的典型变量系数,如图输出结果中还给出标准化变量的典型变量系数,如图所示。所示。来自机能指标的第一典型变量来自机能指标的第一典

24、型变量CY1为为(原始变量的右原始变量的右上角带上角带“*”表示为标准化变量表示为标准化变量):y1*y2*y3*y4*y5*容易看出,容易看出,CY1主要代表了舒张压变音、舒张压消音、主要代表了舒张压变音、舒张压消音、肺活量等指标。肺活量等指标。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 来自形态指标的第一典型变量来自形态指标的第一典型变量CX1为:为:x1*x2*x3*x4*x5*x6*易知,易知,CX1主要代表了胸围、身高和肩宽等指标。主要代表了胸围、身高和肩宽等指标。关于第二典型变量有:关于第二典型变量有:y1*y2*y3*y4*y5*x1*x2*

25、x3*x4*x5*x6*可见,可见,CY2代表了收缩压和肺活量等指标;代表了收缩压和肺活量等指标;CX2代表了代表了身高、体重、盆骨宽等指标。身高、体重、盆骨宽等指标。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(6)典型冗余分析典型冗余分析 典型冗余分析典型冗余分析(canonical redundancy analysis)表明,表明,两对典型变量仍不能全面预测配对的那组变量。来自形两对典型变量仍不能全面预测配对的那组变量。来自形态指标的标准方差被对方两个典型变量(态指标的标准方差被对方两个典型变量(CY1、CY2)解释的累积方差比例为解释的累积方差比例

26、为55.86%,来自机能指标的标准,来自机能指标的标准方差被对方两个典型变量(方差被对方两个典型变量(CX1、CX2)解释的累积方)解释的累积方差比例为差比例为44.61%,如图所示。,如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程7.1.3 用用“分析家分析家”实现典型相关分析实现典型相关分析1.1.实例实例【例【例7-2】某康复俱乐部对】某康复俱乐部对20名中年人测量了名中年人测量了3项生理指项生理指标:体重标:体重(weight)、腰围、腰围(waist)、脉搏、脉搏(pulse)和和3项运动项运动指标:引体向上指标:引体向上(chins)、起

27、坐次数、起坐次数(situps)、跳跃次数、跳跃次数(jumps)。其数据列于表。其数据列于表7-2中。中。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表7-2 某康复俱乐部测量的生理指标和运动指标设表中数据已经存放在数据集中,试分析生理指标和运设表中数据已经存放在数据集中,试分析生理指标和运动指标这两组变量间的相关性。动指标这两组变量间的相关性。编号体重weight腰围waist脉搏pulse引体向上chins起坐次数situps跳跃次数jumpsl191365051626021893752211060319338581210110141623562121

28、053751893546131555861823656410142131543464142151051424746501505015193364667031162023762122101201717637544602518157325211230801915633541522573201383368211043STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.分析设置分析设置 1)在在“分析家分析家”中打开数据集;中打开数据集;2)选择菜单选择菜单“Statistics(统计)(统计)”“Multivariate(多元分析)(多元分析)”“Canonica

29、l Correlation(典型相关分(典型相关分析)析)”,打开,打开“Canonical Correlation”对话框;对话框;3)在对话框中将生理指标选为在对话框中将生理指标选为Set1,运动指标选为,运动指标选为Set2,如图所示。,如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4)单 击单 击“S t a t i s t i c s(统 计)(统 计)”按 钮,打 开按 钮,打 开“Canonical Correlation:Statistics”对话框;对话框;选中选中“Canonical redundancy statistics”

30、复选框,并选择复选框,并选择3个典型变量,如图所示。两次单击个典型变量,如图所示。两次单击“OK”按钮,得到按钮,得到计算结果。计算结果。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.结果分析结果分析(1)典型相关系数及显著性检验典型相关系数及显著性检验 第一部分的第一部分的4列依次是:典型相关系数、校正的典型列依次是:典型相关系数、校正的典型相关系数、近似的标准误以及典型相关系数的平方。从相关系数、近似的标准误以及典型相关系数的平方。从图图7-10中可以看出,本例提取了中可以看出,本例提取了3个典型相关系数,第个典型相关系数,第一个典型相关系数一个典

31、型相关系数CanR1,其校正值为,标准误为,其校正值为,标准误为,CanR12,第一典型相关系数表示的是第一对典型相关变,第一典型相关系数表示的是第一对典型相关变量之间的相关性。第二个典型相关系数为,第三个为。量之间的相关性。第二个典型相关系数为,第三个为。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第二部分是特征根以及相应的统计量,如图所示。第二部分是特征根以及相应的统计量,如图所示。可以看出,第一对典型变量所能解释的变异已占总变可以看出,第一对典型变量所能解释的变异已占总变异的异的97.34%,其它两个典型相关变量的作用很小,一,其它两个典型相关变量的

32、作用很小,一共只解释了总变异的共只解释了总变异的3%,可以不予考虑。,可以不予考虑。右边右边4列给出对典型相关系数的检验,结果表明,第列给出对典型相关系数的检验,结果表明,第一行的一行的F值,值,p值为,在的检验水平下,应拒绝原假设,值为,在的检验水平下,应拒绝原假设,认为第一相关系数以及比它小的两个相关系数不为认为第一相关系数以及比它小的两个相关系数不为0;后两行检验的后两行检验的p值都远大于显著水平,故可以认为只有值都远大于显著水平,故可以认为只有第一个典型相关系数不为第一个典型相关系数不为0。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第三部分输出的

33、是用四种多元统计方法进行的所有典第三部分输出的是用四种多元统计方法进行的所有典型相关系数均为型相关系数均为0的的F检验结果,如图所示。四种方法中检验结果,如图所示。四种方法中一般参照一般参照Wilks Lambda检验的结果。本例中的检验的结果。本例中的Wilks Lambda检验结果与前述完全一致,表明至少有一个典检验结果与前述完全一致,表明至少有一个典型相关系数在的显著水平下非型相关系数在的显著水平下非0。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2)典型变量系数与典型结构典型变量系数与典型结构 第四部分给出的是用原始变量表达的典型变量系数第四部分给

34、出的是用原始变量表达的典型变量系数(典型权重典型权重),如图所示。,如图所示。因因6个变量没有使用相同单位进行测量,因此考虑分个变量没有使用相同单位进行测量,因此考虑分析标准化后的系数。析标准化后的系数。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第五部分给出的是用标准化变量(对原始变量标准化)第五部分给出的是用标准化变量(对原始变量标准化)表达的典型变量系数,如图所示。表达的典型变量系数,如图所示。V1=0.7754 weight*+1.5793 waist*0.0591 pulse*它近似地是它近似地是waist*和和weight*的加权差,在的加权差

35、,在waist*上权上权重更大些。重更大些。V1在在pulse*上系数近似为上系数近似为0。W1=0.3495 chins*1.0540 situps*+0.7164 jumps*它在它在situps*上的系数最大。这一对典型变量主要是反上的系数最大。这一对典型变量主要是反映映waist*和和situps*的负相关关系。的负相关关系。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第六部分为典型结构,分别是各组原始变量与典型变第六部分为典型结构,分别是各组原始变量与典型变量两两之间的相关系数矩阵,如图所示。可以看出:量两两之间的相关系数矩阵,如图所示。可以看出

36、:在原始变量与本组的典型变量的相关关系在原始变量与本组的典型变量的相关关系(典型载荷典型载荷)中,生理指标的典型变量中,生理指标的典型变量V1与腰围与腰围waist的相关系数最的相关系数最大大(0.9254),说明这个典型变量主要反映人的肥胖程度;,说明这个典型变量主要反映人的肥胖程度;运动指标的典型变量运动指标的典型变量W1与起坐次数与起坐次数situps和引体向上次和引体向上次数数chins有较大的负相关关系,有较大的负相关关系,-0.8177),说明这个典型,说明这个典型变量主要反映人不适合运动的程度。变量主要反映人不适合运动的程度。STATSTATSTATSTATSASSAS软件与统计

37、应用教程软件与统计应用教程 在原始变量与配对组的典型变量的相关关系在原始变量与配对组的典型变量的相关关系(典型交典型交叉载荷叉载荷)的分析结果中,腰围的分析结果中,腰围waist与运动指标的第与运动指标的第1典型典型变量变量W1的相关性较强,这也说明了腰围大的相关性较强,这也说明了腰围大(体形较胖体形较胖)则则运动能力差;起坐次数和引体向上与生理指标的第运动能力差;起坐次数和引体向上与生理指标的第1典典型变量型变量V1呈一定的负相关系数,说明人的体形肥胖程呈一定的负相关系数,说明人的体形肥胖程度对这两种运动能力有负面影响。度对这两种运动能力有负面影响。STATSTATSTATSTATSASSA

38、S软件与统计应用教程软件与统计应用教程(3)典型冗余分析典型冗余分析 第七部分给出典型冗余分析的结果第七部分给出典型冗余分析的结果 上图是变量的原始方差通过它的典型变量和配对的典上图是变量的原始方差通过它的典型变量和配对的典型变量所解释的方差比例。型变量所解释的方差比例。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 下图是变量的标准化方差通过它的典型变量和配对的下图是变量的标准化方差通过它的典型变量和配对的典型变量所解释的方差比例。典型变量所解释的方差比例。图中看出,生理指标通过它的第一个典型变量解释的图中看出,生理指标通过它的第一个典型变量解释的共享方差的

39、比例是,而被对方第一个典型变量共享方差的比例是,而被对方第一个典型变量W1解解释的方差比例为释的方差比例为28.54%,其比值恰为,其比值恰为CanR2。运动指标。运动指标通过它的第一个典型变量解释的共享方差的比例是,通过它的第一个典型变量解释的共享方差的比例是,而被对方个典型变量而被对方个典型变量V1解释的方差比例为解释的方差比例为25.84%,其,其比值也是。比值也是。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第八部分给出各原始变量和配对组的典型变量间的复第八部分给出各原始变量和配对组的典型变量间的复相关系数(相关系数(Multiple Correl

40、ations)的平方(图)的平方(图7-18),),即原始变量与典型变量的判定系数,如即原始变量与典型变量的判定系数,如weight与第与第1典典型变量型变量W1的相关系数为(见图的相关系数为(见图7-15),则其复相关系),则其复相关系数平方为数平方为2。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 由复相关系数的平方可看出,生理指标的第一典型变由复相关系数的平方可看出,生理指标的第一典型变量量W1对对chins(0.3351)和和situps(0.4233)有一定解释能力,有一定解释能力,但对但对jumps(0.0167)几乎没有解释能力。而来自运动指标

41、几乎没有解释能力。而来自运动指标的第一典型变量的第一典型变量V1对对waist(0.5421)有相当好的解释能力,有相当好的解释能力,对对weight(0.2438)较差,而对较差,而对pulse(0.0701)几乎没有解释几乎没有解释能力。其中,运动指标的第一典型变量对生理指标中的能力。其中,运动指标的第一典型变量对生理指标中的腰围指标解释能力最强,可以说明运动对体形影响较大,腰围指标解释能力最强,可以说明运动对体形影响较大,加强体育锻炼可以减肥。加强体育锻炼可以减肥。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程7.1.4 用用CANCORR过程实现典型相

42、关分析过程实现典型相关分析1.CANCORR1.CANCORR过程过程 CANCORR过程的常用语法格式如下:过程的常用语法格式如下:PROC CANCORR;WITH;VAR;RUN;其中其中PROC CANCORR语句、语句、WITH语句是每个过程语句是每个过程中必不可少的,其余语句可视情况使用。中必不可少的,其余语句可视情况使用。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 下面分别介绍各语句的用法和功能。下面分别介绍各语句的用法和功能。(1)PROC CANCORR语句:标示典型相关分析开始,语句:标示典型相关分析开始,可以规定输入输出数据集,指定分

43、析方法和控制输出结可以规定输入输出数据集,指定分析方法和控制输出结果的显示等。语句中可设置的常用选项及其功能见表果的显示等。语句中可设置的常用选项及其功能见表7-3。(2)VAR语句:列出要进行典型相关分析的第一组变语句:列出要进行典型相关分析的第一组变量,变量必须是数值型的。如果量,变量必须是数值型的。如果VAR语句被忽略,所有语句被忽略,所有未被其他语句提到的数值型变量都将被视为第一组变量。未被其他语句提到的数值型变量都将被视为第一组变量。(3)WITH语句:列出要进行典型相关分析的第二组语句:列出要进行典型相关分析的第二组变量,变量必须是数值型的。该语句是每一个变量,变量必须是数值型的。

44、该语句是每一个PROC CANCORR中必不可少的。中必不可少的。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表7-3 常用选项及其功能EDF=指定误差的自由度。EDF数为有效的观察值减1DATA=指定输入数据集的名字,可以是原始数据集,或用TYPE=CORR,COV,FACTOR,SSCP,UCORR,或者UCOV的数据集,如果省略则使用最新创建的数据集OUT=指定输出数据集的名字,输出包括原始数据及典型变量得分的数据集。当输入数据集的类型为CORR,COV,FACTOR,SSCP,UCORR,或者UCOV,就不能使用这个选项OUTSTAT=生成包含各种统

45、计量的SAS数据集,包括典型相关系数和典型系数,以及你要求的多元回归统计量VNAME=为来自VAR语句中分析变量指定标签,作为标签的字符要用单引号引起来VPREFIX=为来自VAR语句的典型变量指定前缀名,默认时典型变量命名为V1,V2,V3等WNAME=为来自WITH语句中的分析变量指定标签,作为标签的字符要用单引号引起来WPREFIX=为来自WITH语句中的典型变量指定前缀名,默认为W1,W2,W3等控制输出的选项ALL打印所有选择的输出CORR打印原始变量之间的相关系数NCAN=规定要输出典型变量的个数NOPRINT禁止所有的输出REDUNDANCY打印冗余度分析的结果SHORT除了典型

46、相关和多元统计列表以外,禁止打印典型相关分析过程默认的输出SIMPLE打印均值、标准差等简单统计量STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.使用使用CANCORRCANCORR过程过程【例【例7-3】家庭特征与家庭消费之间的关系。为了了解】家庭特征与家庭消费之间的关系。为了了解家庭的特征与其消费模式之间的关系。调查了家庭的特征与其消费模式之间的关系。调查了70个家庭个家庭的下面两组变量:的下面两组变量:x1:每年去餐馆就餐的频率,:每年去餐馆就餐的频率,x2:每年外出看电影的:每年外出看电影的频率;频率;y1:户主的年龄,:户主的年龄,y2:家庭的

47、年收入,:家庭的年收入,y3:户主受教:户主受教育程度。育程度。试分析两组变量之间试分析两组变量之间的关系。假定变量的相的关系。假定变量的相关系数阵如表所示。关系数阵如表所示。x1x2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 如下代码,利用变量的相关系数矩阵作典型相关分析:如下代码,利用变量的相关系数矩阵作典型相关分析:DAT

48、A jt(TYPE=CORR);INPUT NAME$1-2(X1 X2 Y1-Y3)(6.);CARDS;Y3 0.34 ;PROC CANCORR EDF=70 REDUNDANCY;VAR X1 X2;WITH Y1-Y3;RUN;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 说明:说明:1)在数据集名在数据集名jt后用后用TYPE=CORR表明数据的类型表明数据的类型为相关矩阵,而不是原始数据。为相关矩阵,而不是原始数据。2)INPUT语句中用语句中用“NAME$”读取左侧的变量名,读取左侧的变量名,“1-2”表示变量名的字符落在第表示变量名的字符落

49、在第1、2列上,列上,“(X1 X2 Y1-Y4)”表示各列数据所对应的变量名,表示各列数据所对应的变量名,“(6.)”表示读表示读取数据的宽度均为取数据的宽度均为6列,其中相关系数占列,其中相关系数占4位,其后的空位,其后的空格占格占2位;位;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3)选择项选择项EDF=n 1,为典型相关分析提供一个计算,为典型相关分析提供一个计算误差自由度的参考值,因为该过程中没有合适的选择项误差自由度的参考值,因为该过程中没有合适的选择项可以将原始数据的样本含量可以将原始数据的样本含量n准确地送入。如果忽略这准确地送入。如果忽

50、略这一选择项,将以缺省值一选择项,将以缺省值n=10000作为样本含量参与有关作为样本含量参与有关计算和统计检验,显然不妥;计算和统计检验,显然不妥;4)选项选项REDUNDANCY表示输出典型冗余分析的结表示输出典型冗余分析的结果。果。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.结果分析结果分析(1)典型相关系数及显著性检验典型相关系数及显著性检验 第一部分的第一部分的4列依次是:典型相关系数、校正的典型列依次是:典型相关系数、校正的典型相关系数、近似的标准误以及典型决定系数(典型相关相关系数、近似的标准误以及典型决定系数(典型相关系数的平方)。从

51、中可以看出,本例提取了系数的平方)。从中可以看出,本例提取了2个典型相个典型相关系数,第一个典型相关系数关系数,第一个典型相关系数CanR1,其校正值为,标,其校正值为,标准误为,准误为,CanR12;第二个典型相关系数为。;第二个典型相关系数为。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第二部分是特征根以及相应的统计量,从中可以看出,第二部分是特征根以及相应的统计量,从中可以看出,第一对典型变量所能解释的变异已占总变异的第一对典型变量所能解释的变异已占总变异的96.13%,另一对典型相关变量的作用很小,只解释了总变异的另一对典型相关变量的作用很小,只解

52、释了总变异的3.87%,可以不予考虑。,可以不予考虑。右边右边4列给出对典型相关系数的检验,具体采用似然比列给出对典型相关系数的检验,具体采用似然比法,所求的似然比统计量近似服从法,所求的似然比统计量近似服从F分布。第一行检验分布。第一行检验的是第一相关系数以及比它小的两个相关系数是否为的是第一相关系数以及比它小的两个相关系数是否为0,第一行的第一行的F值,值,p值。后一行检验的值。后一行检验的p值远大于置信水平,值远大于置信水平,故可以认为只有第一个典型相关系数有统计学意义。故可以认为只有第一个典型相关系数有统计学意义。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计

53、应用教程 第三部分(图第三部分(图7-21)输出的是按照多元分析的原理进)输出的是按照多元分析的原理进行的所有典型相关系数是否为行的所有典型相关系数是否为0的检验,四种方法中一的检验,四种方法中一般参照般参照Wilks Lambda检验的结果。本例中检验的结果。本例中4种方法的检种方法的检验结果与前述完全一致。验结果与前述完全一致。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2)典型变量系数与典型结构典型变量系数与典型结构 第四部分(图左)给出的是用原始变量表达的典型变第四部分(图左)给出的是用原始变量表达的典型变量系数。考虑标准化后的系数,即第五部分(图

54、右)给量系数。考虑标准化后的系数,即第五部分(图右)给出的典型变量和标准化变量(对原始变量标准化)间的出的典型变量和标准化变量(对原始变量标准化)间的换算公式。由于使用原始变量的相关系数阵作为输入数换算公式。由于使用原始变量的相关系数阵作为输入数据,所以这两部分相同。据,所以这两部分相同。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 来自消费模式指标的第一典型变量来自消费模式指标的第一典型变量V1为为(原始变量的原始变量的右上角带右上角带“*”表示为标准化变量表示为标准化变量):x1*+0.2721 x2*它是它是x1*(每年去餐馆就餐的频率每年去餐馆就餐的

55、频率)和和x2*(每年外出看电每年外出看电影的频率影的频率)的加权和,在的加权和,在x1*上的权重更大些。上的权重更大些。来自家庭特征指标的第一典型变量来自家庭特征指标的第一典型变量W1为:为:W1=0.0491 y1*y2*+0.1900 y3*它在它在y2*(家庭的年收入家庭的年收入)上的系数最大。这一对典型变上的系数最大。这一对典型变量主要是反映量主要是反映x1*(每年去餐馆就餐的频率每年去餐馆就餐的频率)和和y2*(家庭的家庭的年收入年收入)的相关关系。的相关关系。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第六部分(图第六部分(图7-24)为典型

56、相关结构,分别是各组原)为典型相关结构,分别是各组原始变量与典型变量两两之间的相关系数矩阵。始变量与典型变量两两之间的相关系数矩阵。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 可以看出:可以看出:x1和和x2与第与第1典型变量典型变量V1的相关系数皆为的相关系数皆为正值,分别为和,可见正值,分别为和,可见V1可以作为消费特性的指标。可以作为消费特性的指标。家庭特征指标的所有变量与第家庭特征指标的所有变量与第1典型变量典型变量W1的相关系的相关系数分别为:,和,可见典型变量数分别为:,和,可见典型变量W1主要代表了了家庭主要代表了了家庭收入。收入。V1和和W

57、1的典型相关系数为,这就说明家庭的消费与的典型相关系数为,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的。一个家庭的收入之间其关系是很密切的。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第二对典型变量中第二对典型变量中V2与与x2的相关系数为,可以看出的相关系数为,可以看出V2可以作为文化消费特性的指标,第二对典型变量中可以作为文化消费特性的指标,第二对典型变量中W2与与y1和和y3之间的分别相关系数为和,可见典型变量之间的分别相关系数为和,可见典型变量W2主要代表了家庭成员的年龄特征和教育程度,主要代表了家庭成员的年龄特征和教育程度,V2和和W2

58、的相关系数为,说明文化消费与年龄和受教育程度的相关系数为,说明文化消费与年龄和受教育程度之间有一定关系。之间有一定关系。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(3)典型冗余分析典型冗余分析 第七部分给出典型冗余分析的结果(图第七部分给出典型冗余分析的结果(图7-25、7-26),),由于本例是对相关系数矩阵作分析故两个结果相同。由于本例是对相关系数矩阵作分析故两个结果相同。两对典型变量解释配对变量组方差的累计比例分别两对典型变量解释配对变量组方差的累计比例分别为为42.08%和和23.157%。STATSTATSTATSTATSASSAS软件与统计应用

59、教程软件与统计应用教程 消费指标通过它的第一个典型变量解释的共享方差的消费指标通过它的第一个典型变量解释的共享方差的比例是,而被对方第一个典型变量比例是,而被对方第一个典型变量W1解释的方差比解释的方差比例为例为41.66%,其比值,其比值 恰为恰为Can R2(Canonical R-Square),通过它的第二个典型变量解释的共享方差的),通过它的第二个典型变量解释的共享方差的比例是,被对方第二个典型变量比例是,被对方第二个典型变量W2解释的方差比例解释的方差比例为为0.42%,其比值为。家庭特征指标通过它的第一个典,其比值为。家庭特征指标通过它的第一个典型变量解释的共享方差的比例是,而被

60、对方第一个典型变量解释的共享方差的比例是,而被对方第一个典型变量型变量V1解释的方差比例为解释的方差比例为22.19%,通过它的第二个,通过它的第二个典型变量解释的共享方差的比例是,而被对方第二个典型变量解释的共享方差的比例是,而被对方第二个典型变量典型变量V2解释的方差比例为解释的方差比例为0.95%。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第八部分给出各原始变量和配对组的典型变量间的复第八部分给出各原始变量和配对组的典型变量间的复相关系数(相关系数(Multiple Correlations)的平方,即原始变)的平方,即原始变量与典型变量的判定系数

61、,如量与典型变量的判定系数,如x1与第与第1典型变量典型变量W1的相的相关系数为,则其判定系数为关系数为,则其判定系数为2。由复相关系数的平方可看出,消费指标的典型变量由复相关系数的平方可看出,消费指标的典型变量V1对对y2(0.4566)有一些预测能力,但对有一些预测能力,但对y1(0.0839)和和y3(0.1253)有微弱的预测能力。而来自家庭特征指标的典有微弱的预测能力。而来自家庭特征指标的典型变量型变量W1对对x1(0.4607)和和x2(0.3725)有较好的预测能力。有较好的预测能力。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n7.2 7.2

62、 对应分析对应分析n7.2.1 对应分析的基本概念对应分析的基本概念n7.2.2 使用使用CORRESP过程实现对应分析过程实现对应分析STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程7.2.1 对应分析的基本概念对应分析的基本概念1.1.对应分析的方法概述对应分析的方法概述 对应分析,也称相应分析,它是寻求样品(行)与变对应分析,也称相应分析,它是寻求样品(行)与变量(列)之间联系的低维图示法。其关键是利用一种数量(列)之间联系的低维图示法。其关键是利用一种数据变换方法,使含有据变换方法,使含有n个样品个样品m个变量的原始数据矩阵个变量的原始数据矩阵 变成另一

63、个矩阵变成另一个矩阵 ,并使并使SR=ZZ(分析变量之间关系的协方差矩阵)与(分析变量之间关系的协方差矩阵)与SQ=ZZ(分析样品之间关系的协方差矩阵)具有相同的非(分析样品之间关系的协方差矩阵)具有相同的非零特征根,它们相应的特征向量之间也有密切的关系。零特征根,它们相应的特征向量之间也有密切的关系。nmnnmmxxxxxxxxxX212222111211nmnnmmzzzzzzzzzZ212222111211STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 对协方差矩阵对协方差矩阵SR、SQ进行因子分析,分别提取两个最进行因子分析,分别提取两个最重要的公因子

64、重要的公因子R1、R2与与Q1、Q2。由于采取的是一种特殊。由于采取的是一种特殊变换方法,公因子变换方法,公因子R1与与Q1在本质上是相同的,同理,在本质上是相同的,同理,R2与与Q2在本质上也是相同的,故可用在本质上也是相同的,故可用dim1作为作为R1、Q1的的统一标志,用统一标志,用dim2作为作为R2、Q2的统一标志。于是可将的统一标志。于是可将(R1,Q1)和和(R2,Q2)两组数据点画在由两组数据点画在由(dim2,dim2)组组成的同一个直角坐标系中,这样,便于考察变量与样品成的同一个直角坐标系中,这样,便于考察变量与样品之间的相互关系。之间的相互关系。STATSTATSTATS

65、TATSASSAS软件与统计应用教程软件与统计应用教程2.2.对应分析的步骤对应分析的步骤 设原始数据矩阵设原始数据矩阵X=(xij)nm,i=1,2,n(n为样品为样品数数);j=1,2,m(m为变量数为变量数)。1)计算过渡矩阵计算过渡矩阵Z=(zij)nm:(1)其中,其中,Xi.为第为第i行的合计、行的合计、X.j为第为第j列的合计、列的合计、X.为全为全部数据的合计。部数据的合计。jijiijijXXXXXxz./.STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2)对对SR=ZZ作因子分析。作因子分析。计算协差阵计算协差阵SR=ZZ的特征值(又称为

66、惯量)的特征值(又称为惯量)1 2 m,按其累积百分比,按其累积百分比取前取前p个特征值(主惯量),通常个特征值(主惯量),通常p取取2。并计算相应的。并计算相应的单位特征向量单位特征向量u1,u2,从而得到因子载荷阵:,从而得到因子载荷阵:在两因子轴平面上作变量点图。在两因子轴平面上作变量点图。%85/11miipii2211222121212111mmuuuuuuFSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3)对对SQ=ZZ作因子分析。作因子分析。对上述对上述2个特征值计算个特征值计算SQ中相应的单位特征向量中相应的单位特征向量v1=Zu1,v2=Zu2,从而得到因子载荷阵:,从而得到因子载荷阵:在上述因子平面上作样品点图。在上述因子平面上作样品点图。说明:对应分析的提出最初是为了研究两个或多个属说明:对应分析的提出最初是为了研究两个或多个属性变量之间的相关关系,即用于列联表(参见第性变量之间的相关关系,即用于列联表(参见第9章)章)数据的分析。此时行变量的各个水平相当于各个样品,数据的分析。此时行变量的各个水平相当于各个样品,列变量的各个水

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!