概率论与数理统计_浙大四版_习题解_第9章_回归分析

上传人:无*** 文档编号:188938003 上传时间:2023-02-20 格式:PDF 页数:22 大小:517.01KB
收藏 版权申诉 举报 下载
概率论与数理统计_浙大四版_习题解_第9章_回归分析_第1页
第1页 / 共22页
概率论与数理统计_浙大四版_习题解_第9章_回归分析_第2页
第2页 / 共22页
概率论与数理统计_浙大四版_习题解_第9章_回归分析_第3页
第3页 / 共22页
资源描述:

《概率论与数理统计_浙大四版_习题解_第9章_回归分析》由会员分享,可在线阅读,更多相关《概率论与数理统计_浙大四版_习题解_第9章_回归分析(22页珍藏版)》请在装配图网上搜索。

1、 1 概率论与数理统计(浙大四版)习题解 第 9 章 回归分析【习题 9.8】下表数据是退火温度)(x对黄铜延性y效应的试验结果,y是以延长度计算的。x()300 400 500 600 700 800 y()40 50 55 60 67 70 画出散点图并求y对于x的线性回归方程。解 采用 MATLAB 编程绘),(iiyx的散点图。由图可见,变量y与x之间具有较强的线性相关趋势。图 9.8-1 试验点的线性相关趋势 分别求x、y的样本和、样本平方和及它们的乘积和,详见下表。样本数据预处理表 x y 300 40 400 50 500 55 600 60 700 67 800 70 n=6

2、xy=198400 x=3300 y=342 2x=1990000 2y=20114 设,xySP SSSS分别表xy的校正叉积和、x的校正平方和与y的校正平方和,其值计算如下 111111984003300 342103006nnniiiiiiiSPx yxyn 2 2221111199000033001750006nnxiiiiSSxxn 2221111201143426206nnyiiiiSSyyn 回归参数估计如下 103000.058857142175000 xSPbSS 110300330034224.6285714361750006aybx 故线性回归方程为 24.6285714

3、30.058857142yabxx 图 9.8-2 试验点的线性拟合【习题 9.9】在钢线碳含量对于电阻的效应的研究中,得到以下的数据:碳含量 x()0.10 0.30 0.40 0.55 0.70 0.80 0.95 电阻 y(20时,微欧)15 18 19 21 22.6 23.8 26 试完成下述任务:(1)画出散点图;(2)求线性回归方程xbay;(3)求的方差2的无偏估计;(4)检验假设0H:0b;1H:0b;(5)若回归效果显著,求b的置信水平为 0.95 的置信区间;(6)求50.0 x处)(x的置信水平为 0.95 的置信区间;(7)求50.0 x处观察值y的置信水平为 0.9

4、5 的预测区间。解(1)3 采用 MATLAB 编程绘),(iiyx的散点图。由图可见,变量y与x之间具有很强的线性相关趋势。图 9.9-1 试验点的线性相关趋势 解(2)分别求x、y的样本和、样本平方和及它们的乘积和,详见下表。样本数据预处理表 x y 0.10 15 0.30 18 0.40 19 0.55 21 0.70 22.6 0.80 23.8 0.95 26 n=7 xy=85.61 x=3.8 y=145.4 2x=2.595 2y=3104.2 设,xySP SSSS分别表xy的校正叉积和、x的校正平方和与y的校正平方和,其值计算如下 1111185.613.8 145.46

5、.678571437nnniiiiiiiSPx yxyn 22211112.5953.80.5321428577nnxiiiiSSxxn 22211113104.2145.484.03428587nnyiiiiSSyyn 回归参数估计如下 4 6.6785714312.550335580.532142857xSPbSS 16.678571433.8145.413.9583892670.5321428577aybx 故线性回归方程为 13.95838926 12.55033558yabxx 图 9.9-2 试验点的线性拟合 解(3)计算残差平方和及误差均方如下 226.6785714384.03

6、428580.2159731830.532142857yxSSESSSPSS 0.2159731830.043194636272SSEMSEn 方差2的无偏估计:20.043194636MSE 解(4)检验模型的显著性等价于检验下面的假设 01:0:0HbHb 一元线性回归可采用t检验法,但此处拟采用F检验法,故计算各个平方和并建立方差分析表如下 84.0342858ySSTSS 0.215973183SSE 5 226.6785714383.818312620.532142857xSPSSRSS 方差分析表 方差来源 平方和 自由度 均方 F值 0.051,5F 模型 83.81831262

7、 1 83.81831262 1940.479634 6.61 误差 0.215973183 5 0.043194636 总和 84.0342858 6 因为1940.4796346.61MSR MSE,故 0.05 水平上拒绝0H,即确认回归显著。解(5)在回归模型中假定误差是均值为 0 的正态随机偏差,则统计量b及其变换遵从下面的该旅分布 2,xbN bSS Exbbt dfMSE SS 故b的置信水平为 0.95 的置信区间为:20.0250.043194636()12.55033558(5)0.5321428570.04319463612.550335582.57060.5321428

8、5712.550335580.732378006ExMSEbtdftSS 解(6)为区别计,样本数据采用,x y表示,预测数据采用00,xy表示。则问题“50.0 x处)(x的置信水平为 0.95 的置信区间”指“00.50 x 处0 x的置信水平为 0.95 的置信区间”。考虑统计量0 y遵从下面的正态分布 2020001,xxxyabxNxnSS 00201Exyxt dfxxMSEnSS 于是,00.50 x 处0 x的置信水平为 0.95 的置信区间为 6 20021ExxxytdfMSEnSS 0013.95838926 12.55033558 0.520.23355705yabx

9、22020.0253.8 70.51150.04319463670.5321428572.5706 0.0794968680.20435465ExxxtdfMSEtnSS 2002120.233557050.20435465ExxxytdfMSEnSS 解(7)为区别计,样本数据采用,x y表示,预测数据采用00,xy表示。则问题“50.0 x处观察值y的置信水平为 0.95 的预测区间”指“00.50 x 处0y的置信水平为 0.95 的置信区间”。响应00yabx与其估计0 y之差遵从下面的正态分布 2020010,1xxxyyNnSS 002011Exyyt dfxxMSEnSS 于是,

10、00.50 x 处0y的置信水平为 0.95 的置信区间为 200211ExxxytdfMSEnSS 0013.95838926 12.55033558 0.520.23355705yabx 22020.0253.8 70.511150.043194636170.5321428572.5706 0.2225182870.572005508ExxxtdfMSEtnSS 2002120.233557050.572005508ExxxytdfMSEnSS【习题 9.10】下表列出了 18 名 58 岁儿童的重量(这是容易测得的)和体积(这是难以测 7 量的)。重量 x 17.1 10.5 13.8

11、15.7 11.9 10.4 15.0 16.0 17.8 体积 y 16.7 10.4 13.5 15.7 11.6 10.2 14.5 15.8 17.6 重量 x 15.8 15.1 12.1 18.4 17.1 16.7 16.5 15.1 15.1 体积 y 15.2 14.8 11.9 18.3 16.7 16.6 15.9 15.1 14.5(1)画出散点图。(2)求y关于x的线性回归方程xbay。(3)求0.14x时观察值y的置信水平为 0.95 的预测区间。解(1)采用 MATLAB 编程绘),(iiyx的散点图。由图可见,变量y与x之间具有较强的线性相关趋势。图 9.10-

12、1 试验点的线性相关趋势 解(2)分别计算x、y的样本和、样本平方和及它们的乘积和如下表。样本数据预处理表 x y 17.1 16.7 10.5 10.4 13.8 13.5 15.7 15.7 11.9 11.6 10.4 10.2 15.0 14.5 16.0 15.8 17.8 17.6 15.8 15.2 15.1 14.8 12.1 11.9 n=18 xy=4071.71 8 18.4 18.3 17.1 16.7 16.7 16.6 16.5 15.9 15.1 15.1 15.1 14.5 x=270.1 y=265 2x=4149.39 2y=3996.14 分别计算xy的校

13、正叉积和SP、x的校正平方和xSS、y的校正平方和ySS如下 111114071.71270.1 26595.23777818nnniiiiiiiSPx yxyn 22211114149.39270.196.389444518nnxiiiiSSxxn 22211113996.1426594.751111218nnyiiiiSSyyn 回归参数估计如下 95.2377780.98805194396.3894445xSPbSS 195.237778270.12650.1040461111896.389444518aybx 故线性回归方程为 0.1040461110.988051943yabxx 图

14、 9.10-2 试验点的线性拟合 解(3)为区别计,样本数据采用,x y表示,预测数据采用00,xy表示。则问题“求0.14x 9 时观察值y的置信水平为 0.95 的预测区间”指“014.0 x 处0y的置信水平为 0.95 的置信区间”。响应00yabx与其估计0 y之差遵从下面的正态分布 2020010,1xxxyyNnSS 002011Exyyt dfxxMSEnSS 于是,014.0 x 处0y的置信水平为 0.95 的置信区间为 200211ExxxytdfMSEnSS 000.1040461110.988051943 14.013.72868109yabx 2295.237778

15、94.75111120.65123952596.3894445yxSSESSSPSS 0.6512395250.040702472182SSEMSEn 20220.02511270.118 141160.0407024711896.38944452.1199 0.2083043310.441584351ExxxtdfMSEnSSt2002113.728681090.441584351ExxxytdfMSEnSS【习题 9.11】蟋蟀用一个翅膀在另一个翅膀上快速地滑动,从而发出吱吱喳喳的叫声。生物学家知到叫声的频率 x(叫声数秒)与气温 y 具有线性关系。下表列出了 15 对频率与气温的对应观察

16、结果:频率 x(1/s)20.0 16.0 19.8 18.4 17.1 15.5 14.7 17.1 气温 y()31.4 22.0 34.1 29.1 27.0 24.0 20.9 27.8 频率 x(1/s)15.4 16.2 15.0 17.2 16.0 17.0 14.4 气温 y()20.8 28.5 26.4 28.1 27.0 28.6 24.6 10 试求 y 关于 x 的线性回归方程。解 采用 MATLAB 编程绘),(iiyx的散点图。由图可见,变量y与x之间具有较弱的线性相关趋势。图 9.11-1 试验点的线性相关趋势 分别计算x、y的样本和、样本平方和及它们的乘积和如

17、下表。样本数据预处理表 x y 20.0 31.4 16.0 22.0 19.8 34.1 18.4 29.1 17.1 27.0 15.5 24.0 14.7 20.9 17.1 27.8 15.4 20.8 16.2 28.5 15.0 26.4 17.2 28.1 16.0 27.0 17.0 28.6 14.4 24.6 n=15 xy=6740.71 x=249.8 y=400.3 2x=4200.56 2y=10877.81 分别计算xy的校正叉积和SP、x的校正平方和xSS、y的校正平方和ySS如下 111116740.71249.8 400.374.3806715nnniiii

18、iiiSPx yxyn 11 22211114200.56249.840.5573315nnxiiiiSSxxn 222111110877.81400.3195.1373315nnyiiiiSSyyn 回归参数估计如下 74.380671.8339640.55733xSPbSS 174.38067249.8400.33.854941540.5573315aybx 故线性回归方程为 3.85494 1.83396yabxx 图 9.11-2 试验点的线性拟合【习题 9.12】下面列出了自 1952 年2004 年各届奥林匹克运动会男子 10000 米赛跑的冠军的成绩(时间以 min 计):年份(

19、x)1952 1956 1960 1964 1968 1972 1976 成绩(y)29.3 28.8 28.5 28.4 29.4 27.6 27.7 年份(x)1980 1984 1988 1992 1996 2000 2004 成绩(y)27.7 27.8 27.4 27.8 27.1 27.3 27.1(1)求 y 关于 x 的线性回归方程yabx。(2)检验假设01:0,:0HbHb,取显著性水平0.05。(3)求 2008 年冠军成绩的预测值。解(1)采用 MATLAB 编程绘),(iiyx的散点图。由图可见,变量y与x之间具有较弱的线性 12 相关趋势。图 9.12-1 试验点的

20、线性相关趋势 分别计算x、y的样本和、样本平方和及它们的乘积和如下表。样本数据预处理表 x y 1952 29.3 1956 28.8 1960 28.5 1964 28.4 1968 29.4 1972 27.6 1976 27.7 1980 27.7 1984 27.8 1988 27.4 1992 27.8 1996 27.1 2000 27.3 2004 27.1 n=14 xy=775035.6 x=27692 y=391.9 2x=54778416 2y=10977.99 分别计算xy的校正叉积和SP、x的校正平方和xSS、y的校正平方和ySS如下 11111775035.6276

21、92 391.9142.614nnniiiiiiiSPx yxyn 22211115477841627692364014nnxiiiiSSxxn 222111110977.99391.97.58928614nnyiiiiSSyyn 13 回归参数估计如下 142.60.03917583640 xSPbSS 1142.627692391.9105.482637414364014aybx 故线性回归方程为 105.48263740.0391758yabxx 图 9.12-2 试验点的线性拟合 解(2)检验假设01:0,:0HbHb,取显著性水平0.05 检验模型的显著性等价于检验下面的假设 01:

22、0:0HbHb 一元线性回归可采用t检验法,但此处拟采用F检验法,故计算各个平方和并建立方差分析表如下 7.589286ySSTSS 22142.65.5864733640 xSPSSRSS 27.5892865.5864732.002813yxSSESSSPSS 方差分析表 方差来源 平方和 自由度 均方 F值 0.051,12F 模型 5.586473 1 5.586473 33.4718 4.75 误差 2.002813 12 0.166901 总和 7.589286 13 因为33.47184.75MSR MSE,故 0.05 水平上拒绝0H,即确认回归显著。14 解(3)由回归方程预

23、测 2008 年冠军的成绩如下 00105.48263740.0391758 200826.8176 minyabx 结论:2008 年冠军的预测成绩为 26.82min。【习题 9.13】以 x 和 y 分别表示人的脚长(英寸,1inch=2.54cm)与手长(英寸),下面列出了 15 名女子的脚的长度 x 与手的长度 y 的样本值:脚长 x 9.00 8.50 9.25 9.75 9.00 10.00 9.50 9.00 手长 y 6.50 6.25 7.25 7.00 6.75 7.00 6.50 7.00 脚长 x 9.25 9.50 9.25 10.00 10.00 9.75 9.5

24、0 手长 y 7.00 7.00 7.00 7.50 7.25 7.25 7.25 (1)求 y 关于 x 的线性回归方程yabx。(2)求 b 的置信水平为 0.95 的置信区间。解(1)求 y 关于 x 的线性回归方程yabx 采用 MATLAB 编程绘),(iiyx的散点图。由图可见,变量y与x之间具有较弱的线性相关趋势。图 9.13-1 试验点的线性相关趋势 分别计算x、y的样本和、样本平方和及它们的乘积和如下表。样本数据预处理表 x y 9.00 6.50 8.50 6.25 9.25 7.25 9.75 7.00 9.00 6.75 10.00 7.00 9.50 6.50 n=1

25、5 xy=985.5 15 9.00 7.00 9.25 7.00 9.50 7.00 9.25 7.00 10.00 7.50 10.00 7.25 9.75 7.25 9.50 7.25 x=141.25 y=104.5 2x=1332.8125 2y=729.625 分别计算xy的校正叉积和SP、x的校正平方和xSS、y的校正平方和ySS如下 11111985.5141.25 104.51.458333315nnniiiiiiiSPx yxyn 22211111332.8125141.252.708333315nnxiiiiSSxxn 2221111729.625104.51.60833

26、3315nnyiiiiSSyyn 回归参数估计如下 1.45833330.538462.7083333xSPbSS 11.4583333141.25104.51.89615152.708333315aybx 故线性回归方程为 1.896150.53846yabxx 图 9.13-2 试验点的线性拟合 解(2)求 b 的置信水平为 0.95 的置信区间 回归模型中假定误差服从均值为 0 的正态分布,则统计量b及其变换遵从下面的分布 16 2,xbN bSS,Exbbt dfMSE SS 计算误差平方和与误差均方如下 221.45833331.60833330.82307692.7083333yx

27、SPSSESSSS 0.82307690.06331362152SSEMSEn 故b的置信水平为 0.95 的置信区间为:20.0250.0633136()0.53846(13)2.70833330.06331360.538462.16042.70833330.538460.330320.20814,0.86878ExMSEbtdftSS【习题 9.14】槲寄生是一种寄生在大树上部树枝上的寄生植物。它喜欢寄生在年轻的大树上。下面给出一定条件下完成的试验中采集的数据。大树的年龄 x 3 4 9 15 40 每株大树上槲寄生的株数 y 28 33 22 10 36 24 15 22 10 6 14

28、 9 1 1 (1)作出),(iiyx的散点图。(2)令iiyzln,作出),(iizx的散点图。(3)以模型2,(0,)bxyaeN拟合数据,其中2,ba与x无关,试求曲线回归方程ebxya。解(1)采用 MATLAB 编程绘),(iiyx的散点图。由图可见,变量y与x具有指数相关的趋势。图 9.14-1 原始数据试验点变量相关的动态特征 17 解(2)采用 MATLAB 编程绘(,ln)iixy的散点图。由图可见,变量ln y与x之间具有线性相关的趋势。图 9.14-2 对数变换后试验点变量相关的动态特征 解(3)设,x y表原始数据,,X Y表变换后的数据。由于模型bxyae可变换为线性

29、模型 lnlnlnlnbxYyXxyaeYXayabxb 故可采用线性回归实现模型bxyae对试验数据的拟合,即求回归函数bxyae的最小二乘估计bxyae。为求Y关于X的线性回归方程YX,先分别求X、Y的样本和、样本平方和及它们的乘积和,详见下表。样本数据预处理表 x y X Y 数据预处理 3 28 3 3.3322 4 10 4 2.3026 9 15 9 2.7081 15 6 15 1.7918 40 1 40 0 3 33 3 3.4965 4 36 4 3.5835 9 22 9 3.0910 15 14 15 2.6391 40 1 40 0 3 22 3 3.0910 18

30、4 24 4 3.1781 9 10 9 2.3026 15 9 15 2.1972 X=173 Y=33.7136315 n=14 2X=4193 2Y=98.3200266 XY=238.3516154 分别计算XY的校正叉积和、X的校正平方和、Y的校正平方和,XYSP SSSS如下 11111238.3516154173 33.7136315178.252545314nnniiiiiiiSPX YXYn 222111141931732055.21428614nnXiiiiSSXXn 222111198.320026633.713631517.133673114nnYiiiiSSYYn 回

31、归参数估计如下 178.25254530.08673192055.214286xSPSS 1178.252545317333.71363153.4798744142055.21428614YX 故线性回归方程为 3.47987440.0867319YXX 还原为原非线性回归方程,则得 0.086731932.4556454YbxxxyexXYXyaee eeaeb 19 图 9.14-3 非线性回归方程0.086731932.4556454xye拟合数据的效果【习题 9.15】一种合金在某种添加剂的不同浓度之下,各做三次试验,得数据如下:浓度 x 10.0 15.0 20.0 25.0 30.

32、0 抗压强度 y 25.2 27.3 28.7 29.8 31.1 27.8 31.2 32.6 29.7 31.7 30.1 32.3 29.4 30.8 32.8(1)做散点图。(2)以模型2012ybb xb x,2(0,)N拟合数据,其中2210,bbb与x无关,求回归方程2210 xbxbby。解(1)采用 MATLAB 编程绘),(iiyx的散点图。由图可见,变量y与x具有非线性相关趋势。图 9.10-1 原始数据试验点变量相关的动态特征 解(2)设1xx和22xx,则非线性回归模型2012ybb xb x可变换为线性回归模型01 122ybb xb x。多元线性回归的矩阵形式为

33、20 25.21 1010027.31 1010028.71 1010029.81 1522531.11 1522527.81 1522531.212040032.612040029.712040031.712562530.112562532.312562529.413090030.813090032.81309yX12345607182910111213141500bbbyXbb 回归参数的最小二乘估计为 011219.033333331.008571430.02038095TTbbbX XX yb 故回归方程为219.03333 1.008570.02038yxx 【习题 9.16】某种化

34、工产品的得率y与反应温度1x、反应时间2x及某反应物的浓度3x有关,今得试验结果如下表所示,其中321,xxx均为二水平且均以编码形式表达。1x 2x 3x 得率y-1-1-1 7.6-1-1 1 10.3-1 1-1 9.2 21-1 1 1 10.2 1-1-1 8.4 1-1 1 11.1 1 1-1 9.8 1 1 1 12.6(1)设3322110321),(xbxbxbbxxx,求y的多元线性回归方程;(2)若认为反应时间不影响得率,即认为33110321),(xxxxx,求y的多元线性回归方程。解(1)多元线性回归的矩阵方程为 1203142536787.6111110.3111

35、19.2111110.211118.4111111.111119.8111112.61111bbyXbyXbbb 回归参数的最小二乘估计为 011239.900.5750.551.15TTbbbX XX ybb 故回归方程为32115.1550.0575.090.9xxxy 解(2)若认为反应时间不影响得率,则多元线性回归的矩阵方程为 123041536787.611110.31119.211110.21118.411111.11119.811112.6111byXbbyXbb 回归参数的最小二乘估计为 22 01139.900.5751.15TTbbbX XX yb 故回归方程为139.900.5751.15yxx

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!