多元统计分析方法与应用练习册

上传人:小鹤 文档编号:169367344 上传时间:2022-11-15 格式:DOCX 页数:27 大小:84.88KB
收藏 版权申诉 举报 下载
多元统计分析方法与应用练习册_第1页
第1页 / 共27页
多元统计分析方法与应用练习册_第2页
第2页 / 共27页
多元统计分析方法与应用练习册_第3页
第3页 / 共27页
资源描述:

《多元统计分析方法与应用练习册》由会员分享,可在线阅读,更多相关《多元统计分析方法与应用练习册(27页珍藏版)》请在装配图网上搜索。

1、练习册多元统计分析方法与应用南京财经大学第一章 绪论一、填空题1多元分析研究的是的统计总体。2多元统计中常用的统计量有:、和。3协方差和相关系数仅仅是变量间的一种度量,并不能刻画变量间可能存在的。二、简答题 1简述多元统计分析的作用。2. 简述矩阵A的特征根与特征向量的求法。第二章 多元线性回归一、填空题 1人们通过各种实践,发现变量之间的相互关系可以分成 和两种类型。2总离差平方和可以分解为和两个部分,各自的自由度为和,其中在总离差平方和中所占比重越大,则线性回归效果越显著。3回归方程显著性检验时通常采用的统计量是。4偏相关系数是指多元回归分析中,的相关系数。5最优回归方程是的回归方程。6偏

2、回归平方和是指数值。7 Spss 中回归方程的建模方法有 、 、二、简答题1 简述复相关系数与偏相关系数。2 简述逐步回归分析方法的具体实施步骤三、计算题1 .现收集了 92组合金钢中的碳含量x及强度y,且求得:x 二 0.1255, y 二 45.7989 L 二 0.3019 L 二 26.5126 L 二 2941.03xxxyyy(1) 求 y关于x的一元线性回归方程;(2) 求 y 与 x 的相关系数;(3) 列出对方程作显著性检验的方差分析表(4) 在x=0.1时,求y的点估计及置信度为0.95的置信区间(5) 在x=0.1时,求y的概率为0.95的精确预测区间与近似预 测区间。四

3、、SPSS操作题重量x(克)510152025长度y(cm)7.258.128.959.9010.901下面列出在不同重量下弹簧的长度:3011.80(1) 在直角坐标系下作散点图,并判断Y关于X的相关关系是否线性;(2) 求出Y关于X的一元线性回归方程;(3) 对所求得的回归方程作显著性检验,列出方差分析表(4) 求出 Y 与 X 间的相关系数;(5) 在X=16时,求Y的概率为0.95的预测区间。2.在某化工产品的生产中,影响产品收率 y 主要变量是反应时间 x1的反应温度x2,为提高收率希望找出y关于x1,x2的回归方程,现通过试验获得如下数据:序号X1X2y13015039.32301

4、6040.034015040.944016041.553515540.363515540.573515540.783515540.293515540.6(1)求Y关于XI、X2的线性回归方程;(2) 对所求得的方程作显著性检验,在a=0.05时你的结论是什么?(3) 对各回归系数作显著性检验。(a=0.05)(4) 对回归方程的残差进行正态性、独立性、随机性及奇异值检 验。(5) 回归方程的回归平方和、残差平方和各为多少。(6) 求回归方程的复相关系数,并对拟合优度进行检验,若消除 自变量个数及样本个数对回归方程的影响,拟合优度宜采用哪个指 标,其值为多少。(7) 在排除其它因素的影响后,自变

5、量X1与因变量Y之间的相 关程度是多少。(8) 当排除其它因素对X2的影响后,X2进入回归方程,R2增加了多少?(9) X1、 X2 与 Y 的简单相关系数分别是多少?3. 某服装厂发现本厂的服装销售额与该厂所在城市的服装销售总额及人均衣着用品的支出额关系密切。现有26 期的原始数据如下:X1179.6226.2327.4463.4620.2935.41175658.1468.5539.3697.1894.9X212.5716.4821.421.531.1440.0540.7621.5226.0930.9938.7146.19y0.192.072.162.924.857.1412.066.62

6、7.739.0110.7813.2216.84X1740.2687.1956.41223.31441.31561.31683.51466.51621.71465.81632.52207.62498.6X247.4534.0354.5971.2382.8986.2292.7273.6481.1373.5081.9399.63113.63y18.9312.3318.3423.5228.7728.6528.5621.4022.1321.6121.4630.0136.60(1)以服装厂所在城市服装销售总额为自变量XI,以人均衣着用 品支出额为自变量X2,该厂服装销售额为因变量Y建立二元线性 回归方程。

7、(2)若了解到明年本城市服装销售总额X1为2700万元,X2将是 128元,试求明年该厂服装销售额的预测值及预测区间(0=0.05)( 3)对回归方程的显著性作检验;( 4)对每一个回归系数的显著性作检验;(5)求出回归方程的复相关系数;( 6)对回归方程的残差作奇异值检验4. 在经济流通领域中,某公司的年销售额Y与个人可支配收入XI, 价格X2,研究与发展费X3,广告费X4等项有关。(数据见光盘中“习 题数据库”中 204.sav 文件)(1)试根据资料用逐步回归的方法建立线性回归方程。(引入变量、 剔除变量的临界值为 1.5)(2)变量进入回归模型的顺序是什么,哪些变量未进入方程。(3)最

8、终方程的拟合优度如何,请评价之。5. 某地区大春粮食产量y和大春粮食播种面积xl、化肥用量x2、肥 猪发展头数x3、水稻抽穗扬花期降雨量x4的数据见光盘中“习题库 数据” 205.sav文件,试用逐步回归分析,寻求大春粮食产量的预报 模型(选取引入和剔除检验临界值为 2.5)。6. 某种水泥在凝固时放出的热量y(卡/克)与水泥中四中化学成分有 关,现测得13组数据,见光盘中“习题库数据” 206.sav文件,( 1)用逐步回归法建立线性回归方程(检验临界值为4)(2)对自变量 X4 的状态进行说明。第三章 主成分分析一、填空题1主成分分析是通过适当的变量替换,使新变量成为原变量的,并寻求的一种

9、方法。2主成分分析的基本思想是。3主成分的协方差矩阵为矩阵。4主成分表达式的系数向量是的特征向量。5原始变量协方差矩阵的特征根的统计含义是 。6原始数据经过标准化处理,转化为均值为 ,方差为 的标准值,且其矩阵与相关系数矩阵相等。7因子载荷量的统计含义是。8样本主成分的总方差等于。9变量按相关程度为,在程度下,主成分分析的效果较好。10在经济指标综合评价中,应用主成分分析法,则评价函数中的 权数为。11SPSS 中主成分分析采用命令过程。二、简答题1简述主成分的概念及几何意义。2简述量纲对主成分分析的影响及消除方法3列举样本主成分的性质。4提取样本主成分的原则。5简述主成分分析的适用范围及基本

10、步骤。6思考主成分分析法的应用。三、计算题1.设三个变量(xl,x2,x3)的样本协方差矩阵为:s2s2r0s2rs2s2r0s2rs211 r =2 、;2试求主成分及每个主成分的方差贡献率。2在一项研究中,测量了 376 只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见下表:Y1Y2Y3Y4Y5Y6头长x10.350.530.76-0.05-0.040.00头宽x20.330.70-0.640.000.00-0.04肱骨x30.440.19-0.050.530.190.59尺骨x40.44-0.25-0.020.48-0.15-0.63股骨x50.430.28-0.06-0.51-0.67

11、0.48胫骨x60.44-0.22-0.05-0.48-0.700.15特征值4.570.710.410.170.080.06(1) 解释 6 个主成分的实际意义。(2) 计算前三个主成分各自的贡献率和累积贡献率对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断。3在一项对杨树的性状的研究中,测定了20 株杨树树叶,每个叶片测定了四个变量:叶长怠1),2/3处宽(x2), 1/3处宽(x3), 1/2处宽(x4)。这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:九二 2.920 U二(0.1485,0.5735,0.5577,0.5814)11九二 1.024 U 二(0

12、.9544,0.0984,0.2695,0.0824)22九二 0.049 U 二(0.2516,0.7733,0.5589,0.1624)33九二 0.007 U 二(0.0612,0.2519,0.5513,0.7930)44(1) 写出四个主成分,计算它们的贡献率。(2) 计算四个变量在前两个主成分上的载荷,由因子载荷矩阵,你认为这两个主成分应该如何解释?你能给它们分别起个名字吗?(3) 根据原始数据和(1)中的结果,可以计算出 20 株杨树叶的第一、二主成分得分,试以这两个主成分y1和y2为坐标,在(y1,y2)平面 上按因子得分为坐标描出这20个样本点。4.对纽约股票市场上的五种股票

13、的周回升率x1,x2,x3,x4,x5进行了主 成分分析,其中 x1,x2,x3 分别表示三个化学工业公司的股票回升率, x4,x5 表示两个石油公司的股票回升率,主成分分析是从相关系数矩 阵出发进行的,前两个特征根和对应的标准正交特征向量为:九二 2.857 U 二(0.464,0.457,0.470,0.421,0.421)11九二 0.809 U二(0.240,0.509,0.260,0.526,0.582)22(1) 计算这两个主成分的方差贡献率。(2) 能否对这两个主成分的意义作一个合理的解释,并给两个主成分 命名。四、SPSS操作题1 下面是 8 个学生两门课程的成绩表123456

14、78英语xl10090707085555545数学x26585709085455565(1)求出两个特征根及其对应的单位特征向量;(2)求出主成分,并写出表达式;(3)求出主成分的贡献率,并解释主成分的实际意义;(4)求出两个主成分的样本协方差矩阵;(5)第 1 个样本主成分与第 2 个变量样本之间的相关系数为多少(6)求出 8 个学生第一主成分得分并进行排序2.某中学十二名女生的身高xl,体重x2的数据如下:123456789101112身高155153157154158152160156158157159161体重4846484549464845514748501)两个变量的协方差矩阵与相

15、关系数阵2)两个特征根及其对应的单位特征向量 (3)主成分的表达式并解释各贡献率的大小意义和主成分的实际意 义;(4)如果舍弃主成分y2,则哪一个原变量的信息损失量最大;(5)画出全部样本的主成分散点图。3根据下列某地区 11 年数据X1(总产值)X2 (存储量)X3 (总消费)y(进口额)1149.34.2108.115.92161.24.1114.816.43171.53.1123.219.04175.53.1126.919.15180.81.1132.118.86190.72.2137.720.47202.12.1146.022.78212.45.6154.126.59226.15.01

16、62.328.110231.95.1164.327.611239.00.7167.626.3(1)计算地区总产值、存储量和总消费的相关系数矩阵。(2)求特征根及其对应的特征向量。(3) 求出主成分及每个主成分的方差贡献率;利用主成分方法建立y与xl,x2,x3的回归方程(取两个主成分)。第四章 因子分析一、填空题1因子分析是把每个原始变量分解为两部分因素,一部分是 ,另一部分为。2变量共同度是指因子载荷矩阵中。3公共因子方差与特殊因子方差之和为。二、简答题 1比较因子分析和主成分分析模型的关系,说明它们的相似和不同 之处。2能否将因子旋转的技术用于主成分分析,使主成分有更鲜明的实 际背景。三、

17、计算题1 已知x=(xl,x2,x3,x4,x5)的样本相关系数矩阵R为0.810 1R = 0.451 0.64210.902 0.886 0.720 10.725 0.522 0.882 0.934 1试用主对角线外每一行的最大值来估计约化相关系数矩阵R*的主对角线上的相应元素,并近似地计算出因子载荷矩阵A的第一列元素。2. 设变量xl,x2和x3已标准化,其样本相关系数矩阵为:_ 10.63 0.45R 二 0.6310.350.45 0.351(1) 对变量进行因子分析。(2) 取q=2进行正交因子旋转。3为了考察学生的知识水平,常用学生的考试成绩来评定,某校对33 个学生的 3 门功

18、课进行分析,得相关系数矩阵:-102数.6学43(音乐R =0.641.000.510.510.511.00取两个公因子(1) 计算约化相关系数矩阵(2) 计算因子载荷矩阵(3) 计算各变量的公共因子方差和特殊因子方差(4) 写出因子模型四、SPSS操作题110 名初中男生身高、胸围、体重的数据资料如下身高xl(cm)胸围x2(cm)体重x3(kg)149.569.538.5162.577.055.5162.778.550.8162.287.565.5156.574.549.0156.174.545.5172.076.551.0173.281.559.5159.574.543.5157.779

19、.053.5(1)利用因子法、方差最大旋转法计算因子载荷阵A2)分别计算各变量的公共因子方差和特殊因子方差,判断哪个因子能概括原始信息的大部分,为什么3)写出方差最大正交旋转因子模型,并分析各因子的实际含义(4)计算各个样本点的因子得分第五章 聚类分析一、填空题1聚类分析是建立一种分类方法,它将一批样哂或变量按照它们在性质上的进行科学的分类。2. Q型聚类法是按进行聚类,R型聚类法是按进行聚类。3. Q 型聚类统计量是 ,而 R 型聚类统计量通常采用4. 在聚类分析中需要对原始数据进行无量纲化处理,以消除不同量 纲或数量级的影响,达到数据间可同度量的目的。常用的无量纲化方 法有以下几种:、。5

20、 .六种Q型聚类方法分别为、6.快速聚类在SPSS中由过程实现。二、简答题1. 简述系统聚类法的基本思想及主要步骤。2. 简述最长聚类法的聚类步骤。3. 简述快速聚类的基本思想及主要步骤。三、计算题使用按批修改法进行聚类,采用欧氏距离(取 1、3、7 号样本为聚点)。2从20 个工厂抽了同类产品,每个产品测了两个指标,欲将各厂的质量进行分类,测得的数据如下(已作了适当变换)12345678910111213141516171819XI0022445667-4-2-3-3-5100-1X26553431210322021-1-2-120-1-3试用欧氏距离,将每个样本与其距离最近的凝聚眯进行初始

21、归类 (用密度法取聚点)。四、SPSS操作题1某校从高中二年级女生中随机抽取 16 名,测得身高和体重数据如下表:序号身高(cm)体重(kg)序号身高(cm)体重(kg)1160499160452159461016044316041111574341694912163505162501316151616548141584571655215159488154431616148试分别利用最短距离法、最长距离法、重心法、类平均法、中间距离法将它们聚类(分类统计量采用绝对距离),并画出聚类图。试作如下分析:(1)样本间用欧氏距离,并用系统聚类的诸方法对样本进行聚类。(2)将数据标准化后,仍用欧氏距离,

22、然后用系统聚类的诸方法对样本进行聚类。(3) 对五个变量进行聚类第六章 判别分析一、填空题1判别分析是要解决在研究对象已的情况下,确定新的观测数据属于已知类别中哪一类的多元统计方法。2用判别分析方法处理问题时,通常以作为衡量新样本点与各已知组别接近程度的指标。3进行判别分析时,通常指定一种判别规则,用来判定新样本的归 属,常见的判别准则有、。4在 p 维空间 Rp 中,点与点之间的接近和疏远尺度用来衡量,最简单的就是或。5类内样本点接近,类间样本点疏远的性质,可以通过与的大小差异表现出来,而两者的比值能把不同的类区别开来。这个比值越大,说明类与类间的差异越,分类效果越6. Fisher判别法就

23、是要找一个由p个变量组成的,使得各自组内点的尽可能接近,而不同组间点的尽可能疏远。二、简答题1. 判别分析的分类2. 判别的基本思想 3简述两个类别的判别及判别准则。4简述 Fisher 判别规则及具体判别步骤。 5简述逐步判别基本原理。三、计算题1.某地区将农村经济类型分为三类:G1较富裕类型,G2中等类 型,G3较贫困类型。每种类型以五个指标为依据:x1= 土地生产率 =农村社会总产值/总土地面积(百元/每亩),乂2=劳动生产率二农村社会 总产值/农村劳动力(百元/每个劳动力),x3=人均收入二农村经济纯收 入/农业人口 (百元/每人),x4=费用水平=总费用/总收入,x5=农村工 业比重

24、 =农村工业产值 /农村社会总产值。每种类型分别有容量为 n1=5,n2=8,n3=4 的样本(每个个体以县为单位),其数据如下12345678G1(较X13.853.514.125.013.67富裕)X26.755.734.454.685.84X34.794.013.683.644.27X40.850.810.890.780.87X50.590.600.480.530.64G2(中X13.613.654.112.983.212.873.354.00等)X24.053.744.133.693.553.783.814.27X32.652.863.152.903.132.602.712.97X40

25、.900.910.930.890.880.940.950.90X50.450.430.410.410.480.390.380.44G3(较X13.233.032.542.11贫困)X24.083.213.502.98X31.852.031.511.07X40.960.940.970.99X50.380.250.340.21(1)试作费歇尔判别试以x3,x5为变量,建立三个类别的直线判别函数试以xl,x2,x3,x4,x5为变量,建立马氏距离判别函数(4) 进行逐步判别分析2设两个二维总体有公共协方差,从二总体中分别抽取了容量为 9和8 的样本,其数据如下:(2) 采用费歇尔判别来确定(23.1

26、, 9.2)的归属(3) 采用马氏距离判别法则确定点(23.1, 9.2)属于哪一类。四、SPSS操作题1一个城市的居民家庭,按其有无割草机分为两组,有割草机的一 组记为G1,另一组记为G2。割草机工厂欲判断一些家庭是否习割草 机,从G1和G2分别随机抽取12个样本单位,调查两项指标:x1= 家庭收入,x2=房前房后土地面积。资料如下表,试用Fisher判别法 建立判别函数。G1有割草机家庭G2无割草机家庭X1(千美兀)X2(平方千英尺)X1(千美兀)X2(平方千英尺)20.09.225.09.828.58.417.610.421.610.821.68.620.510.414.410.229.

27、011.828.08.836.79.616.48.836.08.819.88.027.611.222.09.223.010.015.88.231.010.411.09.417.011.017.07.027.010.021.07.42.胜利油田某地段三条地震测线提供构造指标xl,x2,及速度变量x3,x4,x5 共 5 个指标。表中给出的有油气显示的5个指标数据(共 10 组数据)设为G1类,表中给出的无油气显示的5个指标数据(共11组 数据)设为G2类。已知G1类与G2类的协方差阵桢,试判别给定的 三组数据归属哪一类。G1 类有油气显示的数据表构造指标速度指标X1X2X3X4X5120214242202142432024424420274245203041462030421715442248324712492744411103644225G2 类无油气显示的数据表构造指标速度指标X1X2X3X4X5120181752203617733217414432178005325341462021177732324148154442492030176103211800112144441待判样本数据表构造指标速度指标XIX2X3X4X5120551632321480031544214

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!