多元统计分析模拟考题及答案

上传人:悦** 文档编号:169369754 上传时间:2022-11-15 格式:DOCX 页数:16 大小:32.15KB
收藏 版权申诉 举报 下载
多元统计分析模拟考题及答案_第1页
第1页 / 共16页
多元统计分析模拟考题及答案_第2页
第2页 / 共16页
多元统计分析模拟考题及答案_第3页
第3页 / 共16页
资源描述:

《多元统计分析模拟考题及答案》由会员分享,可在线阅读,更多相关《多元统计分析模拟考题及答案(16页珍藏版)》请在装配图网上搜索。

1、、判断题(对)1x (兀公2丄,Xp)的协差阵一定是对称的半正定阵(对) 2标准化随机向量的协差阵与原变量的相关系数阵相同。( 对)3 典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系的研究转化为一组 变量的线性组合与另一组变量的线性组合间的相关关系的研究。(对)4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。(错)5x(x-x2 ,X ) N ( , ), X,S分别是样本均值和样本离2ppS差阵,则X,分别是,的无偏估计。n(对)6X (XX2, ,Xp)Np( ,),X作为样本均值的估计,是无偏的、有效的、一致的。( 错)7因子载荷经正交旋转后,

2、各变量的共性方差和各因子的贡献都发生了变化(对)8因子载荷阵A (aj)中的a表示第i个变量在第j个公因子上的相对重要 性。(对)9判别分析中,若两个总体的协差阵相等,则Fisher判别与距离判别等价。(对)10距离判别法要求两总体分布的协差阵相等,Fisher判别法对总体的分布无特定的要求。二、填空题1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相 关系数矩阵.2、 设是总体X ( X,Xm)的协方差阵,的特征根:(i 1丄,m )与相应的单位正交化特征向量i (盼无丄,am ),则第一主成分的表达式是Q1X1 812X2L Qmd 方差为 1。的特征根和标准正交特

3、征向量分别是总体X ( X1,X2,X3, X4)的协方差阵,为:2.920 U(0.1485, 0.5735, 0.5577, 0.5814)1.024 U20.049 U30007匕(0.9544, 0.0984,0.2695,0.0824)(0.2516,0.7733, 0.5589, 0.1624)(0.0612,0.2519,0.5513,0.7930 ),则其第二个主成分的表达式是y2 0.9544X1 0.0984X2 02695X3 0.0824X4,方差为 1.0244-若 X(厂Np(,),(1,2, ,n )且相互独立,则样本均值向量X服从的分布是Np(,)n5.设Xi:

4、 Np( ,),i1,2丄,16,X和A分别是正态总体的样本均值和样本离差阵,则 T2 154(X) A 14(X)服从工(15小)或:F(p,n p)16 p6 设 Xi :Na(,),i1,2 丄,10,则 Wi 17设随机向量X(X1 ,X2,Xa),且协差阵123R =3821136311868设X(X1,X2): :2C),,其中10(人 )(人)服从叫(10,)443492 ,则其相关矩阵32162 1(2),2,则Cov(X1X2,X1X2)0_9设X, Y是来自均值向量为,协差阵为的总体G的两个样品,则X,Y间的马氏平2 1方距离 d (X,Y) (X Y) (X Y)10设X

5、,Y是来自均值向量为,协差阵为的总体G的两个样品,则X与总体G的马氏平方距离d2(X,G) =(X)1(X )113230.93400.1280.9340.417 0.8350.417 0.8940.02700.894 0.4470.8350.4470.103则Xi的共性方差hi0.9342 =0.872,其统计意义是:描述了全部公因子对变量X1的总方差所作的贡献,称为变量X1的共同度,反映了公共因子对变量X1的影响程度。_ 2标准化变量X1的方差为1公因子fl对X的贡献g0.9342 + 0.4172 + 0.8352=1.7431 12对应分析是将Q型因子分析和R型因子分析结合起来进行的统

6、计分析方法13典型相关分析是硏究两组变量间相关关系的一种多元统计方法14.聚类分析中,Q型聚类是指对样本进行聚类,R型聚类是指对指标进行聚类。15 Spss for windows 中主成分分析由 Data Reduction-Factor Analysis 过程实现。16设Uk,Vk是第k对典型变量则D(UQ 1, D(Vk) 1(k 1,2丄,r)Cov(Ui,Uj) 0,Cov(Vi,W) 0 (i j)(i j,i 1,2,L ,r)Cov(UiM)(i j)(j r)17.在多维标度分析中,当D是欧几里得距离阵时,X是D的一个构图三、简答题(答案见平时习题)1简述多元统计的主要内容与

7、方法(10分) 可对比一元统计列出多元统计的主要内容与方法(从随机变量及其分布、数字特征、四大分布(正态分布密度(1分)、2 ( n )与威沙特分布 )(1分)、t分布与Hoteli ng T2分布(1分)、F分布与威尔克斯分Wp( n,布(p,门1山2)( 1分)、抽样分布定理、参数估计和假设检验、统计方法(2 分)2.请阐述距离判别法、贝叶斯判别法和费希尔判别法的基本思想和方法,比较其异同 3请阐述系统聚类法、K均值聚类法、有序样品聚类法的基本思想和方法,比较其异同4请阐述主成分分析和 因子分析的基本思想、方法步骤和应用,比较其异同 5请阐述相应分析、多维标度法、典型相关分析和多变量的可视

8、化分析的基本思想和应用四、计算题设三维随机向量 X : N3( ,213)21 0 00.51 0.50 ,130 10 ,A1,求Y AX d的分布,d010 0 10.500.5解:正态分布的线性组合仍为正态,故只需求E(Y) E(AX d) AEX dDY D(AX d) ADXA0.50.51 2 13100 11 10.50.51所以 Y : N3(E(Y), D(Y)另解:Y AX d0AxiX20 咛0.5X1O.5X 23E(0.5XX2 .5X31)2E( 0.5X10.5X32)1故 Y : N3(E(Y), D(Y)D(0.5XX2 .5X31)3D( 0.5X10.5X

9、32)1COV(0.5X1 X20.5X31, 0.5X 0.5X3 2)11 1 12设三维随机向量X : N3C),已知13 2求Y 3X1 2X2 X3的分布解:正态分布的任意线性组合仍正态,故丫的分布是一维正态分布,只需求 E(Y) 3E(XJ 2E(X2)E(X3)13D(Y) 32E(X1) 22E(X2) E(X3) 2Cov(3X1,2 X2) 2Cov(3X1,X3) 2Cov(X3,2X2) 9故 Y : N(13,9)3 设有两个二元总体和匕,从中分别抽取样本计算得到58 212176 假设热二血,试用距离判别法建立判别函数和判别规则。样品X=(6,0)应属于哪个总体?.

10、貳匚厲.好J)已酬4解:门1=,比=I - 2 丿,匚=2叫二打仗-对二仗-肝)(x - p)i(&D)-(4.0.5) = 2,0.5)咽 i I 7.613967(-2,1-2.1J5 AjW =(20 5)-7.6 - 2A 24.4-2.15.8 八刃即样品X属于总体g14设已知有两个正态总体G1,G2,且 1:,而其先验概率分别为 q1 q2 0.5,误判的代价 L(2 |1) e4,L(1|2)试用贝叶斯判别法确定样本X3属于哪个总体?5解:由Bayes判别知,W(x)蚪 exp( x _) 1( 1f2(x)2)其中.q2C(1|2) dqQ(2|1)XW(x) W 1X22)属

11、于G2总体5表1是根据某超市对不同品牌同类产品按畅销(1)、平销(2)和滞销(3)的数据,利用SPSS得到的Bayes判别函数系数表,请据此建立贝叶斯判别函数,并说明如何判断新样品 (x1,x2,x3 )属于哪类?Classification Function Coefficientsx1x2group123-11.689-10.707-2.19412.29713.3614.960x316.76117.0866.447(Con sta nt)-81.843-94.536-17.449Fishers lin ear discrim inant fun cti ons表1 Bayes判别函数系数解

12、:根据判别分析的结果建立Bayes判别函数:Bayes判别函数的系数见表4.1。表中每一列表示样本判入相应类的Bayes判别函数系数。由此可建立判别函数如下:Group1:Y1 81.843 11.689X112.297X2 16.761X3Group2 : Y2 94.53610.707X1 13.361X217.086X3Group3:Y3 17.449 2.194X14.960X2 6.447X3将新样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。6.对某数据资料进行因子分析,因子分析是从相关系数阵出发进行的,前

13、两个特征根和 对 应 的 标 准 正 交 特 征 向 量 为12.920 U1(0.1485,0.5735,0.5577,0.5814)12.920 U1(0.1485,0.5735,0.5577,0.5814)(1) 取公因子个数为2 ,求因子载荷阵(2) 用F1F2表示选取的公因子,1, 2为特殊因子,写出因子模型,说明因子载荷阵中元素玄耳的统计意义7在一项对杨树的形状研究中,测定了20株杨树树叶,每个叶片测定了四个变量X1,X2,X3,X4分别代表叶长,叶子2/3处宽,1/3处宽,1/2处宽,这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:2.920 U1 1(0.1485,

14、0.5735, 0.5577,0.5814)2 1024 U2(0.9544, 0.0984,0.2695,0.0824)3 0.049 U3(0.2516,0.7733, 0.5589,0.1624)0.007U4(0.0612,0.2519,0.5513,0.7930)若按一般性原则选取主成分个数,请写出主成分表达式,并计算每个主成分的方差贡 献率解:选取主成分的一般原则是特征值大于 1 或累积贡献率达到 80%以上。据题选取两个 主成分,其表达式和贡献率分别是:y1 0.1485X1 0.5735 X 2 0.5577 X3 0.5814 X 4 ,贡献率为 1 2.920y 0.954

15、4 X10.0984 X 20.2695X? 0.0824X4,贡献率为 21.0248 下表是进行因子分析的结果 ,试根据表中信息写出每个原始变量的因子表达式,并分析是否需要对 因子载荷旋转。Component MatrixComponent123X1.969-1.084E-02.205X2.911.321-.102X3.847-.120.323X4.941.281-2.693E-02X5.899.215-1.963E-02X6-.313.839.305X7-.6666.280E-02.679X8.575-.580.367Extraction Method: Principal Compon

16、ent Analysis.a 3 components extracted.解:由表F1F2F3X1.969-1.084E-02.205X2.911.321-.102X3.847-.120.323X4.941.281-2.693E-02X5.899.215-1.963E-02X6-.313.839.305X7-.6666.280E-02.679X8.575-.580.367知X1=.969F1-1.084E-02F2 +.205 F3可以不做因子旋转,因为载荷系数基本处于两极分化状态,第一个公因子在指标X1,X2,X3,X4,X5,X7,X8有较大载荷,F2只在X6和X8上有较大载荷,F3只在X7上有较大载荷。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!