数理统计课后答案第七章.pdf
《数理统计课后答案第七章.pdf》由会员分享,可在线阅读,更多相关《数理统计课后答案第七章.pdf(13页珍藏版)》请在装配图网上搜索。
习题七 7.1 设 () , ( ) 22 11 22 ,;,; ,N 令 = 2 1112 2 2 12 2 , 于是二维 正态分布 () 22 11 22 ,;,;N 可表示为 ( ) 2 ,N . ( 1)试证明 () , 的联合密度函数 ( ) 12 ,pxx 可表示为 () () ()() () 1 1 2 12 1212 22 1 ,其中x, 2 T xx T pxx e xx = ( 2)设 () () ()12 , ,., T n XX X 为正态总体 ( ) , 的样本,证明样本均值 X 2 1 ,N n . (1) 证 因 () , ( ) 22 11 22 ,;,;N ,故 () () ()() () () () ()() 22 112212 22 2 11 1 2 11 1 12 11 2 22 22 12 2 1 1 2 21 12 2 12 1 2 3 22 2 2 12 1 2 13 22 1 , 21 1 21 1 2 T T xxxx x xx xx Pxx e e e + = = = (2)二维正态总体,样本均值仍服从正态分布,而 ()()()() () ()()() ()()() = = = = 11 2 2 2 11 1122 11 1122 2 22 1122 22 TT EX EX EX DX E X EX X EX E X X XXX X EXXE X XX X () () = 2 112 112 2 12 2 12 2 cov , cov , DX X X nn XX DX 故 X 1 ,N n . 7.2 随机抽取某班级四名同学的数学、物理和化学三门课程的期中考试成绩,结果如下: 数学 物理 化学 甲 70 75 65 已 60 70 50 丙 80 75 70 丁 90 80 80 (1)写出样本数据阵 X ; (2)求出样本均值 X ,样本协方差阵 S ,样本相关阵 R ; (3)分别把数学成绩 x 极差标准化为 x% ,把物理成绩 y 标准差标准化 y% ; (4)写出甲乙两同学的考试成绩的马氏距离表达式,并求出甲乙两同学考试成绩的欧氏距 离. 解 (1) 样本数据阵为: = 70 75 65 60 70 50 80 75 70 90 80 80 X ; (2) 样本协方差阵(对称矩阵)为: = 125 37.5 12.5 118.7537.5 117.1875 S , 样本相关阵(对称矩阵)为: = 1 0.948683298 1 0.981155781 0.979795897 1 R ; (3) 数学成绩的极差标准化 = % (70-75)/30 1/ 6 1.6667 (60-75)/30 1/ 2 0.5 (80-75)/30 1/ 6 1.6667 (90-75)/30 1/ 2 0.5 x , 物理成绩 y 标准差标准化 y% = (75-75)/4.0825 0 (70-75)/4.0825 1.2247 (75-75)/4.0825 0 (80-75)/4.0825 1.2247 ; (4) 甲乙两同学的考试成绩的马氏距离表达式: 1 12 12 12 -1 125 10 = 10,5,15 37.5 12.5 5 118.75 37.5 117.1875 15 TT T () ( ) () ( ) () ( ) d( X ,X ) ( X X ) S ( X X ) = 甲乙两同学考试成绩的欧氏距离为: 12 12 12 10 = 10,5,15 5 100 25 225 18 7083 15 TT T () ( ) () ( ) () ( ) d(X,X) (X X)(X X) . = =+ . 7.3 设对 m 维随机变量进行 n次观测得到的样本数据阵为 ( ) , ij nm XX x = 令 X % 为标准差 标准化之后的样本数据阵即 () () - ,其中 = 1,2,., ; 1,2,., ij j ij ij nm j xx Xx x i nj m s = % % , 试证明样本相关阵 1 . 1 T RXX n = % 证 % 1 1 T XX n 的第 i 行第 j 列元素为 % T X 的第 i 行与 % X 的第 j 列对应元素相乘再相加的 1 1n 倍。即 % X 的第 i 列与第j 列对应元素乘积之和的 1 1n 倍。用公式表示即为 () () ()() ()() = = = = = = = = % 11 22 1 11 1 22 11 1 1 nn kj jki i ki kj kk ij n kj jki i nn k ki i kj j kk n ki i kj j k nn ki i kj j kk xxxx xx nnss xxxx n xx xx xxxx xx xx 上式正是样本数据阵 X 的第 i 列与第j 列的样本相关系数,故 1 . 1 T RXX n = % 7.4 试借助统计分析工具(SPSS,SAS,R) ,对7.2节的例 3 进行主成分分析. 解 利用统计分析软件 SPSS 的操作结果截图如下 Communalities Initial Extraction VAR00001 1.000 .472 VAR00002 1.000 .917 VAR00003 1.000 .769 VAR00004 1.000 .795 VAR00005 1.000 .874 VAR00006 1.000 .867 VAR00007 1.000 .624 VAR00008 1.000 .745 VAR00009 1.000 .706 Extraction Method: Principal Component Analysis. Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Loadings Component Total % of Variance Cumulative % Total % of Variance Cumulative % 1 4.006 44.516 44.516 4.006 44.516 44.516 2 1.635 18.167 62.683 1.635 18.167 62.683 3 1.128 12.532 75.215 1.128 12.532 75.215 4 .955 10.607 85.822 Extraction Method: Principal Component Analysis. Component Matrix(a) Component 1 2 3 VAR00001 .606 -.072 -.316 VAR00002 .622 -.303 .663 VAR00003 .854 -.045 .193 VAR00004 .756 -.236 -.410 VAR00005 .272 .827 -.341 VAR00006 -.876 -.299 .102 VAR00007 .595 .451 .258 VAR00008 -.841 .183 -.058 VAR00009 -.221 .686 .433 Extraction Method: Principal Component Analysis. a 3 components extracted. 7.5 试借助统计分析工具对 7.3 节中关于蠓的分类一例中的数据进行判别分析. 解 利用统计分析软件 SPSS 的操作结果截图如下 先建立SPSS 数据文件 根据上述分析结果知 ,若采用总的样本协方差阵的方法的判别结果为 : 第 16,17,18 号样品是 第一类 (为 af),他们为第一类的后验概率分别为 0.85302,0.72139,0.82846 7.6 试借助统计分析工具验算 7.4 节中 2002 年足球世界杯 16强的系统聚类的结果. 解 首先建立 SPSS 数据文件 系统聚类的结果用谱系图表示如下 * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 10 10 15 15 1 1 13 13 11 11 14 14 6 6 7 7 12 12 4 4 16 16 8 8 2 2 5 5 9 9 3 3 7.7 据调查市场上销售的 9 种饮料的热量,咖啡因含量,钠含量及价格的数据如下: 饮料编号 热量 咖啡因含量 钠含量 价格 1 207.2 3.3 15.5 2.8 2 36.8 5.9 12.9 3.3 3 72.2 7.3 8.2 2.4 4 36.7 0.4 10.5 4 5 121.7 4.1 9.2 3.5 6 89.1 4 10.2 3.3 7 146.7 4.3 9.7 1.8 8 57.6 2.2 13.6 2.1 9 95.9 0 8.5 1.3 (1)试借助统计分析软件对 9 种饮料进行系统聚类. (2)借助统计分析工具对数进行主成分分析. (3)根据(1)中分为三个类的聚类结果,判别一个未知类别的样品 () 38.5,3.7,7.7,7.2 T 属于其中哪一个类. 解 (1)系统聚类 聚类结果的谱系图: * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 2.00 2 4.00 4 6.00 6 9.00 9 3.00 3 8.00 8 5.00 5 7.00 7 1.00 1 当指定聚成三个类时: (2) 作主成分分析时要求变元间具有较强的相关性,所以,第一步对原始数据是否适合作主 成分分析要进行检验: KMO and Bartletts Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .360 Approx. Chi-Square 1.296 df 6 Bartletts Test of Sphericity Sig. .972 检验的 P值 SIG=0.972, 说明原变量具有弱相关性 ,不适合提取主成分 (3) 判别分析结果如下: 即这个(编号为 10 的)样品属第二类(后验概率约为 1)- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 课后 答案 第七
装配图网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文