统计学课后练习题答案人大第四版

上传人:沈*** 文档编号:205212644 上传时间:2023-04-28 格式:PDF 页数:87 大小:8.03MB
收藏 版权申诉 举报 下载
统计学课后练习题答案人大第四版_第1页
第1页 / 共87页
统计学课后练习题答案人大第四版_第2页
第2页 / 共87页
统计学课后练习题答案人大第四版_第3页
第3页 / 共87页
资源描述:

《统计学课后练习题答案人大第四版》由会员分享,可在线阅读,更多相关《统计学课后练习题答案人大第四版(87页珍藏版)》请在装配图网上搜索。

1、第三章节:数据的图表展示.1第四章节:数据的概括性度量.15第六章节:统计量及其抽样分布.26第七章节:参数估计.28第八章节:假设检验.38第九章节:列联分析.41第十章节:方差分析.433.1为评价家电行业售后服务的质量,随 机 抽 取 了 由100个家庭构成的一个样本。服务质量的等级 卜别表示为:A.好;B.较好;c 一般;D.较差;E.差。调查结 果如下:BEccADCBAEDAcBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACEEABDDCADBCCAEDCBCBCEDBCCBC要求:(1)指出上面的数据属于什么

2、类型。顺序数据(2)用Excel制作一张频数分布表。用数据分析直方图制作:-04 S-E16D17C32B21A14(3)绘制一张条形图,反映评价等级的分布。用数据分析直方图制作:直方图40-1J 20-口频率E D C B A接收(4)绘制评价等级的帕累托图。逆序排序后,制作累计频数分布表:接收频数频率()累计频率()C323232B212153D171770E161686A1414100频 数T一累计频率(盼3.2某行业管理局所属40个企业2002年的产品销售收入数据如卜.:1521241291161001039295127104105119114115871031181421351251

3、171081051101071371201361171089788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。1、确定组数:=6.32,取 k=62、确定组距:组距=(最 大 值-最小值)小 组数=(152-87)4-6=10.83,取 103、分组频数表销售收入频数频率累计频数累计频率80.00-89.0025.025.090.00-99.0037.5512.5100.00-109.00922.51435.0110.00-119.001230.02665.0120.00-129.00717.53382.

4、5130.00-139.00410.03792.5140.00-149.0025.03997.5150.00+12.540100.0总和40100.0(2)按规定,销售收入在125万元以上为先进企业,115125万元为良好企业,105115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。3.3某百货公司连续40天的商品销售额如下:频数频率累计频数累计频率先进企业1025.01025.0良好企业1230.02255.()i般企业922.53177.5落后企业922.540100.()总和40100.0单位:万元412529473834303843404

5、63645373736454333443528463430374426384442363737493942323635要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。1、确定组数:K=+蛆+翅%+”*6.32,取 k=6lg(2)lg2 0.301032、确定组距:组距=(最大值-最小值)小组数=(49-25)4-6=4,取 53、分组频数表销售收入(万元)频数频率累计频数累计频率=2512.512.526-30512.5615.031-35615.01230.036-401435.02665.041-451025.03690.()46+410.()40100.()总和401

6、00.0频数销售收入3.4利用下面的数据构建茎叶图和箱线图。572929363123472328283551391846182650293321464152282143194220d a t a S t e m-a n d-L e a f P l o tFr e q u e n c yS t e m&L e a f3.0 01.8 8 95.0 02.0 1 1 3 37.0 02.6 8 8 8 9 9 92.0 03.1 33.0 03.5 6 93.0 04.1 2 33.0 04.6 6 73.0 05.0 1 21.0 05.7S t e m w i d t h:1 0E a c h

7、 l e a f:1c a s e(s)3.6一 种 袋 装 食 品 用 生 产 线 自 动 装 填,每 袋 重 量 大 约 为5 0 g,但 由 于 某 些 原 因,每 袋 重 量 不 会 恰 好 是5 0 g。卜.面是随机抽取的1 0 0袋 食 品,测 得 的 重 量 数 据 如下:单 位:g-5 7 4 6 4 9 5 4 5 5 5 8 4 9 6 1 5 1 4 9-5 1 6 0 5 2 5 4 5 1 5 5 6 0 5 6 4 7 475 35 14 85 35 05 24 04 55 75 35 25 14 64 84 75 34 75 34 44 75 05 25 34 7

8、4 54 85 45 24 84 64 95 25 95 35 04 35 34 65 74 94 94 45 75 24 24 94 34 74 64 85 15 94 54 54 65 25 54 74 95 05 44 74 84 45 74 75 35 85 24 85 55 35 74 95 65 65 75 34 14 8要 求:(1)构 建 这 些 数 据 的 频 数 分 布 表。(2)绘 制 频 数 分 布 的 直 方 图。(3)说 明 数 据 分 布 的 特 征。解:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。1、确定组数:直方图:23 =

9、1 +g()=1+2 g(1 0 0)=1+_ 2 _ =6.6 4,取 k=6 或 7l g(2)1g 2 0.30103、确定组距:组距=(最大值-最小值)小组数=(61-40)+6=3.5,取3或者4、5组距=(最 大 值-最小值):组数=(61-40)+7=3,、分组频数表组距3,上限为小于频数百分比累计频数累积百分比有效 40.00-42.0043.00-45.0046.00-48.0049.00-51.0052.00-54.0055.00-57.0058.00+合计392419241471003.09.024.019.024.014.07.0100.0312365579931003

10、.012.036.055.079.093.0100.0组距3,小于30oo21Aouanb工I I I4 6 8组距3,小于10M e a n =5.22S t d.D e v.=1.508N =100组距4,上限为小于等于频数百分比累计频数累积百分比有效=40.0011.011.041.00-44.0077.088.045.00-48.002828.03636.049.00-52.002828.06464.053.00-56.002222.08686.057.00-60.001313.09999.061.00+11.0100100.0介计100100.0直方图:组距4,小于等于M e a n

11、 =4.06S t d.D e v.=1.221N =100组距5,上限为小于等于频数百分比累计频数累积百分比有效=45.001212.012.012.046.00-50.003737.049.049.051.00-55.003434.083.083.056.00-60.001616.099.099.061.00+11.0100.0100.0会计100100.0直方图:组距5,小于等于50-ooO432Aouanb工o I I0 1I I I I I2 3 4 5 6组距5,小于等于Mean=2.57Std.Dev.=0.935N=100分布特征:左偏钟型。3.8 下 面 是 北 方 某 城

12、市 12月份各天气温的记录数据:-32-4-7-11-1789-614-18-15-9-6-105-4-96-8-12-16-19-15-22-25-24-19-8-6-15-11-12-19-25-24-18-17-14-22-13-9-60-15-4-9-32-4-4-16-175-6-5要 求:(1)指 出 上 面 的 数 据 属 于 什 么 类 型。数值型数据(2)对 上 面 的 数 据 进 行 适 当 的 分 组。1、确定组数:Kl J g()i J g(6。)J.778151lg(2)lg2 0.30103=6.9 0 9 8 9,取 k=72、确定组距:组距=(最 大 值-最 小

13、 值 户 组 数=(14-(-25)+7=5.57,取 53、分组频数表温度频数频率累计频数累计频率-25-21610.0610.()-20-16813.31423.3-15-11915.02338.3-10-61220.03558.3-5-11220.04778.30-446.75185.05-9813.35998.310+11.760100.()合计60100.0(3)绘 制 直 方 图,说 明 该 城 市 气 温 分 布 的 特 点。频数3.11对于卜面的数据绘制散点图。X234187y252520301618解:3.1 2 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:要求:

14、考试成绩人数甲班乙班优36良615中189及格98不及格42(1)根 据 上 面 的 数 据,画 出 两 个 班 考 试 成 绩 的 对 比 条 形 图 和 环 形 图。优良中及格 不及格口优 良口中口及格不及格(2)比 较 两 个 班 考 试 成 绩 分 布 的 特 点。甲 班 成 绩 中 的 人 数 较 多,高 分 利 低 分 人 数 比 乙 班 多,乙班学习成绩较甲班好,高 分 较 多,而 低 分 较 少。3.1 4已 知19952004年 我 国 的 国 内 生 产 总 值 数 据 如 下(按 当 年 价 格 计 算):单 位:亿元年份国内生产总值第一产业第二产业第三产业1995584

15、78.1119932853817947199667884.613844.23361320428199774462.614211.23722323029199878345.214552.43861925174199982067.514471.964055827038200089468.114628.24493529905200197314.815411.848750331532002105172.316117.352980360752003117390.216928.161274391882004136875.920768.077238743721要求:(1)用Excel绘制国内生产总值的线图。

16、国内生产总值160000140000120000100000800006000040000200000T国内生产总值LD 9t寸66666000006666600000*r-,n03网络用户的年龄为分组情况下的概率密度曲线:O2.Aunoo15 16 17 18 19 20 21 22 23 24 25 27 29 30 31 34 38 41网络用户的年龄分组:1、确定组数:K嘴曙小品=5.6 4,取 k=62、确定组距:组距=(最 大 值-最小值户组数=(41-15)+6=4.3,取 53、分组频数表网络用户的年龄(Binned)FrequencyPercentCumulative Fre

17、quencyCumulative PercentValid=1514.014.()16-20832.0936.021-25936.01872.026-30312.02184.031-3528.02392.036-4014.02496.041+14.025100.()Total25100.0分组后的均值与方差:Mean23.3000Std.Deviation7.02377Variance49.333Skewness1.163Kurtosis1.302分组后的直方图:Aounb.iq10.00o-30.00 35.00组中值40.0045.00 50.00Mean=23.30Std.Dev.=7.

18、024N=2520.0025.004.3某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另一种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.9 7分钟。第二种排队方式的等待时间(单位:分钟)如下:5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8要求:(1)画出第二种排队方式等待时间的茎叶图。第二种排队方式的等待时间(单位:分钟)Stem-and-Leaf P lotFrequencyStem&Le

19、af1.00 Extremes(=5.5)3.006.6783.007.1342.007.88Stem width:1.00Each le a f:1 case(s)(2)计算第二种排队时间的平均数和标准差。Mean7Std.Deviation 0.714143Variance 0.51(3)比较两种排队方式等待时间的离散程度。第二种排队方式的离散程度小。(4)如果让你选择一种排队方式,你会选择哪一种?试说明理由。选择第二种,均值小,离散程度小。4.4 某百货公司6月份各天的销售额数据如K:单位:万元2 572 7 62 9 72 522 3 83 1 02 4 02 3 62 6 52 7

20、82 7 12 9 22 6 12 8 13 0 12 7 42 6 72 8 02 9 12 582 7 22 8 42 6 83 0 32 7 32 6 33 2 22 4 92 6 92 9 5要求:(1)计算该百货公司日销售额的平均数和中位数。(2)按定义公式计算四分位数。(3)计算日销售额的标准差。解:百货公司每天的销售额(万元)StatisticsNValid30Missing0Mean274.1000Median272.5000Std.Deviation21.17472P ercentiles25260.250050272.500075291.25004.5甲乙两个企业生产三种产

21、品的单位成本和总成本资料如下:产品名称单位成本阮)总成本(元)甲企业乙企业A1 52 1 0 03 2 55B2 03 0 0 01 50 0C3 01 50 01 50 0要求:比较两个企业的总平均成本,哪个高,并分析其原因。产品名称单位成本(元)甲企业乙企业总成本(元)产品数总成本(元)产品数A1 52 1 0 01 4 03 2 552 1 7B2 03 0 0 01 501 50 07 5C3 01 50 0501 50 050平均成本(元)1 9.4 1 1 7 6 4 7 11 8.2 8 9 4 7 3 6 8调和平均数计算,得到甲的平均成本为1 9.4 1;乙的平均成本为1 8

22、.2 9。甲的中间成本的产品多,乙的低成本的产品多。4.6在某地区抽取120家企业,按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200 30019300 40030400 50042500 60018600以上11合 计120要求:(1)计 算 120家企业利润额的平均数和标准差。(2)计算分布的偏态系数和峰态系数。解:Std.Error of Kurtosis企业利润组中值Mi(万元)StatisticsNValid120Missing0Mean426.6667Std.Deviation116.48445Skewness0.208Std.Error of Skewness0.

23、221Kurtosis-0.6250.438H i s t o g r a m-oO32Aounb工10-o200.00 300.00 400.00 500.00 600.00企业利润组中值Mi(万元)700.00Mean=426.67Std.Dev.=116.484N=1204.7为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名717岁的少年儿童作为样本,另一位调查人员则抽取了 1 000名717岁的少年儿童作为样本。请回答下面的问题,并解释其原因。(1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大?(2)两位调查人员所得到的样本的标准

24、差是否相同?如果不同,哪组样本的标准差较大?(3)两位调查人员得到这1 100名少年儿童身高的最高者或最低者的机会是否相同?如果不同,哪位调查研究人员的机会较大?解:(1)不一定相同,无法判断哪个更高,但可以判断,样本量大的更接近于总体平均身高。(2)不 定 相 同,样本量少的标准差大的可能性大。(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kgo请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大?为什么?女生,因为标准差一样,而均值男生大,所以,

25、离散系数是男生的小,离散程度是男生的小。(2)以磅为单位(lks=2.21b),求体重的平均数和标准差。都是各乘以2.21,男生的平均体重为60kgX2.21=132.6磅,标准差为5kgX2.21=11.05磅;女生的平均体重为50kgX2.21=110.5磅,标准差为5kgX2.21=lL05磅。(3)粗略地估计一下,男生中有百分之几的人体重在55kg-65kg之间?计算标准分数:Z l=九 二 丝=1;Z 2=竺 二 竺=1,根据经验规则,男生大约有68%s 5 s 5的人体重在55kg 65kg之间。(4)粗略地估计一下,女生中有百分之儿的人体重在40kg60kg之间?计算标准分数:x

26、 x 40 50 x x 60 50 3 3 八 八 上 1,,.,一Zl=-=-=-2;Z2=-=-=2,根据经验规则,女生大约有95%s5s 5的人体重在40kg-60kg之间。4.9-家公司在招收职员时,首先要通过两项能力测试。在 A 项测试中,其平均分数是100分,标准差是15分;在 B 项测试中,其平均分数是400分,标准差是50分。位应试者在A 项测试中得了 115分,在 B 项测试中得了 425分。与平均分数相比,该应试者哪一项测试更为理想?解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。x-x 115-100ZA=-=-=1;ZB=s 15因此,A 项测试结果理想。x

27、-x 425-400-=-=0.5504.10 一条产品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落人士 2 个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制?时间周一周二周三周四周五周六周日产量(件)3 8503 6703 6903 7203 6103 5903 700周六超出界限,失去控制。时间周一周二周三周四周五周六周日产量(件)3850367036903720361035903700日平均产量3700日产量标准差50标准分数Z3-0.6-0.20.4-1.8-2.20标准分数界限-2-2-2-

28、2-2-2-22222222要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么?4.11对 10名成年人和10名幼儿的身高进行抽样调查,结果如下:成年组166 169 172 177 180 170 172 174 168 173幼儿组68 69 68 70 71 73 72 73 74 75均值不相等,用离散系数衡量身高差异。(2)比较分析哪一组的身高差异大?成年组幼儿组平均172.1 平均71.3标准差4.201851 标准差2.496664离散系数0.024415 离散系数0.035016幼儿组的身高差异大。4.12 一种产品需要人工组装,现有三种可供选择的组装

29、方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量:单位:个方法A方 法 B方法C16412912516713012616812912616513012717013112616530128164129127168127126164128127162128127163127125166128126167128116166125126165132125要求:(1)你准备采用什么方法来评价组装方法的优劣?(2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。解:对比均值和离散系数的方法,选择均值大,离散程度小的。方

30、法A 方法B 方法C平均 165.6 平均 128.7333333 平均 125.5333333标准差 2.131397932 标准差 1.751190072 标准差 2.774029217离散系数:VA=0.0 1287076,VB=0.013603237,Vc=0.022097949均值A 方法最大,同时A 的离散系数也最小,因此选择A 方法。4.1 3 在金融证券领域,项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了 200种商业类股票和200种高科技类股票的收益率分布。在股票市场上

31、,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。(1)你认为该用什么样的统计量来反映投资的风险?标准差或者离散系数。(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?选择离散系数小的股票,则选择商业股票。(3)如果进行股票投资,你会选择商业类股票还是高科技类股票?考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差(7 =1.0 盎司的正态分布。随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值

32、不超过0.3 盎司的概率。解:总体方差知道的情况下,均 值 的 抽 样 分 布 服 从 的 正 态 分 布,由正态分布,标准化得到标准正态分布:N(0,l),因此,样本均值不超过总体均值的概率P=P(-0.9 z0.9)=2。(0.9)-1,查标准正态分布表得0(0.9)=0.8 1 5 9因此,P(|x-/|0.3)=0.6 3 1 86.3 4,Z2,,Z 6 表示从标准正态总体中随机抽取的容量,n=6 的一个样本,试确定常数b,使得P 辛。=0.9 5解:由于卡方分布是由标准正态分布的平方和构成的:设 Z j z2.Z 是来自总体M 0,1)的样本,则统计量/=Z;+Z;+Z;服从自由度

33、为 的 X2分布,记 为/2(n)因此,令/2=方 方,则z 2=之方/(6).那么由概率尸性Z:44=0.9 5,可知:/=1i=lV;=1)b=Z:o.9 5(6),查概率表得:b=1 2.5 96.4 在习题6.1 中,假定装瓶机对瓶子的灌装量服从方差=1 的标准正态分布。假定我们计划随机抽取1 0 个瓶子组成样本,观测每个瓶子的灌装量,得 到 1 0 个观测值,用这1 0 个观测值我们可以求出样本方差S 2($2=_L之(匕一力2),确定一个合适的范围使得有较大的概率保证S 2 落入其中是有用的,试求矫,b 2,使得 S2 2)=0.9 0解:更加样本方差的抽样分布知识可知,样本统计量

34、:%(-1)(T此处,n=1 0,T2=1,所以统计量空 叵=吐a=9 5 2 /(”1)(T2 1根据卡方分布的可知:尸 S2 /),)=P(池 9S2 9 A2)=0.9 0又因为:尸(建0/2 (T)4 9 s 2 焉(T)=1 -a因此:P(9 9 s 2 9b2)=尸(犹叽(-l)9 S2Zj/2(W-l)=l-a =0.9 0nP(9b,9 s 2 9b2)=P 保 s(f 9 S?W勾(T)=UO,(9)9S2 05(9)=0.90则:n 汕=疯(9),%=忌(9)=V熟 和 也=y y查概率表:就9 5(9)=3.3 2 5,点(9)=1 9.9 1 9,则b =.9 5(9)

35、=0 3 6 9,b、=1.8 81 9 2 97.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取4 9 名顾客组成了一个简单随机样本。(1)假定总体标准差为1 5 元,求样本均值的抽样标准误差。a 1 5 7;=-r=-=2.1 4 3V 4 9(2)在 9 5%的置信水平下,求边际误差。=tq,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=Z 0/2因此,=2 叽 仁=Z。=1 9 6 X 2.1 4 3=4.2(3)如果样本均值为1 2 0 元,求总体均值的9 5%的置信区间。置信区间为:(x-Av,x+A-)=(1 2 0-4.2,1 2 0 +4.

36、2)=(1 1 5.8,1 2 4.2)7.4 从总体中抽取一个n=1 0 0 的简单随机样本,得到=8 1,s=1 2。要求:(Q(-2 A大样本,样本均值服从正态分布:x N ,一 或 亍N /,V n)n)置信区间为:6 一5亩,也变我=急=2(1)构建的9 0%的置信区间。za/2=z0 0 5=1.6 4 5,置信区间为:(8 1-1.6 4 5 x 1.2,8 1 +1.6 4 5 x 1.2)=(7 9.0 3,8 2.9 7)(2)构建的9 5%的置信区间。Z a/2 =Z o.o 2 5=L 9 6,置信区间为:(8 1-1.9 6 x 1.2,8 1 +1.9 6 x 1.

37、2)=(7 8.6 5,8 3.3 5)(3)构建的9 9%的置信区间。za/2=z0 0 0 5=2.5 7 6,置信区间为:(8 1-2.5 7 6 x 1.2,8 1 +2.5 7 6 x 1.2)=(7 7.9 1,8 4.0 9)7.7 某大学为了解学生每天上网的时间,在全校7 5 0 0 名学生中采取重复抽样方法随机抽取3 6 人,调查他们每天上网的时间,得到下面的数据(单位:小时):3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40

38、.53.62.5求该校大学生平均上网时间的置信区间,置信水平分别为9 0%,9 5%和 9 9%。解:(1)样本均值亍=3.3 2,样本标准差s=1.6 1;(2)抽样平均误差:重:复抽样:=1.6 1/6=0.2 6 8G=0.2 6 8 X j 0.9 9 5 =0.2 6 8 X 0.9 9 8=0.2 6 7(3)置信水平下的概率度:1-=0.9,t=za/2=z0 0 5=1.6 4 51=0.9 5,t=Za/2=Z0 025=1 9 61-a=0.9 9,t=za/2=z0 0 0 5=2.5 7 6(4)边际 误 差(极限误差):%=,%=Z&/2,b至1-a=0 9,&=F=

39、Za/2.%=Zo.O5 q重复抽样:=Z q/2 ,0r.v=zo.O5。工=1.6 4 5 X 0.2 6 8=0.4 4 1不重复抽样:A-=Z a/2,c rx =z0.05=1.6 4 5 X 0.2 6 7=0.4 3 91 _a=0.9 5,A-=/c r-=za/2 q=zO O 25-c r-重复抽样:Z=z=/2 ,3 0,大样本,因此检验统计量:x 6 8 0 7 0 0 2s/4 n 6 0/V3 6 一当 a=0.0 5,查表得z =1.6 4 5。因为z-z。,故拒绝原假设,接受备择假设,说明这批产品不合格。8.4 糖厂用自动打包机打包,每包标准重量是1 0 0 千

40、克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9 包重量(单位:千克)如下:99.3 98.7 1 0 0.5 1 0 1.2 98.3 99.7 99.5 1 0 2.1 1 0 0.5已知包重服从正态分布,试检验该日打包机工作是否正常(a=0.0 5)?解:%:“=i o o;a:“#1 0 0经计算得:%=99.9778 S=1.2 1 2 2 1检验统计量:L 三-M o _ 99.9778-1 0 0 s/1.2 1 2 2 1/8=-0.0 55当 a=0.0 5,自由度”-1=9 时,查表得幻2(9)=2.2 62。因 为 上|0.0 5已知:p=6/50=0.1

41、2检验统计量:p%o _ 0.1 2-0.0 5小 万0(1一4 0)/0.0 5x(l-0.0 5)V 5 0=2.2 71当。=0.0 5,查表得=1.64 5。因为z z“样本统计量落在拒绝区域,故拒绝原假设,接受备择假设,说明该批食品不能出厂。8.7某种电子元件的寿命x(单位:小时)服从正态分布。现测得1 6只元件的寿命如下:1 59 2 8 0 1 0 1 2 1 2 2 2 4 3 79 1 79 2 642 2 2 3 62 1 68 2 50 1 4 9 2 60 4 8 5 1 70问是否有理由认为元件的平均寿命显著地大于2 2 5小时(a=0.0 5)?解:%:W2 2 5

42、;1:2 2 5经计算知:x=2 4 1.5 s=98.72 6检验统计量:x-n _ 2 4 1.5-2 2 5s/4 n 98.72 6/V 1 6=0.669当 a=0.0 5,自由度-1 =1 5时,查表得(1 5)=1.753。因为t兀2p i=43/205=0.2097 nl=205 0=13/134=0.097 n2=134检验统计量,.(Pi-P2dZ /川(1一夕2)V 4 2_ (0.20 9 8-0.0 9 7)-010.2098(1-0.2098)0.097(1-0.097)V 205+134=3当 a=0.0 5,查表得z&=1.645。因为z z 拒绝原假设,说明吸

43、烟者容易患慢性气管炎。8.1 2 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不能超过60万元。随着经济的发展,贷款规模有增大的趋势。银行经理想了解在同样项目条件下,贷款的平均规模是否明显地超过60万元,故一个n=144的随机样本被抽出,测得5=68.1万元,s=45o用 a=0.01的显著性水平,采用p 值进行检验。解:%:W60;H:60已知:x=68.1 s=45由于n=14430,大样本,因此检验统计量:x-从()68.1 60s/y/n 45/V144=2.16由于无 口,因此 P值=P (z22.16)=1-0(2.16),查表的0(2.16)=0.9846,P 值=

44、0.0154由于P a=0.0 1,故不能拒绝原假设,说明贷款的平均规模没有明显地超过60万元。8.1 3 有一种理论认为服用阿司匹林有助于减少心脏病的发生,为了进行验证,研究人员把自愿参与实验的22 000人随机平均分成两组,一组人员每星期服用三次阿司匹林(样本 1),另一组人员在相同的时间服用安慰剂(样 本 2)持 续 3 年之后进行检测,样 本 1中有104人患心脏病,样本2 中 有 189人患心脏病。以 a=0.05的显著性水平检验服用阿司匹林是否可以降低心脏病发生率。解:建立假设HQ:兀 2乃2;H:兀1兀2P i=104/11000=0.00945 nl=11000 p2=189/

45、11000=0.01718 n2=11000检验统计量(PP2)-dz-/=22(1一。2)4 2_(0.00945-0.01718)-010.00945(1-0.00945)0.01718(1-0.01718)11000+11000=-5当 a=0.0 5,查 表 得=1.645。因为z a=0.05,没有显著差异。1 0.9有5种 不 同 品 种 的 种 子 和4种不同的施肥方案,在2 0块同样面积的土地上,分别采用5种 种 子 和4种施肥方案搭配进行试验,取 得 的 收 获 量 数 据 如F表:品种施肥方案123411 2.09.51 0.49.721 3.71 1.51 2.49.63

46、1 4.31 2.31 1.41 1.141 4.21 4.01 2.51 2.051 3.01 4.01 3.11 1.4检验种子的不同品种对收获量的影响是否有显著差异?不同的施肥方案对收获量的影响是否有显著差异(a=0.05)?解:这线图:均值收获量施肥方法施肥方法1施肥方法2施肥方法3施肥方法4似乎交互作用不明显:(1)考虑无交互作用下的方差分析:主体间效应的检验因变量:收获量源I I I型平方和df均方FSig.校正模型37.249(a)75.3218.0820.001截距2,930.621I2,930.6214,451.0120.000FertilizationMethods18.1

47、8236.0619.2050.002Variety19.06744.7677.2400.003误差7.901120.658总计2,975.77020校正的总计45.15019a.R 方=.825(调整 R 方=.723)结果及明施肥方法和品种都对收获量有显著影响。(2)考虑有交互作用下的方差分析:主体间效应的检验因变量:收获量源川 型平方和 df 均方 F Sig.校正模型45.150(a)192.376截距2,930.62112,930.621FertilizationMethods18.18236.061Variety19.06744.767Fertilization Methods*Va

48、riety7.901120.658误差0.0000.总计2,975.77020校正的总计45.15019a.R 方=1.000(调整 R 方=.)由于观测数太少,得不到结果!10.11 一家超市连锁店进行一项研究,确定超市所在的位置和竞争者的数量对销售额是否有显著影响。下面是获得的月销售额数据(单位:万元)。超市位置竞争者数量0123 个以h位于市内居民小区413859473031484045395139位于写字楼252944433135484222305053位于郊区187229242917282733252632取显著性水平a=0.0 1,检验:(1)竞争者的数量对销售额是否有显著影响?(

49、2)超市的位置对销售额是否有显著影响?(3)竞争者的数量和超市的位置对销售额是否有交互影响?解:画折线图:均值月销售额(万元)55.00-50.00 45.00-40.00-35.00-30.00-超市位置位于市内居民小区位于写字楼位于郊区25.00-0个竞争者1个竞争者2个竞争者3个以上竞争者竞争者数量交互作用不十分明显。(1)进行无交互方差分析:主体间效应的检验因变量:月销售额(万元)源III型平方和df均方FSig.校正模型2814.556(a)5562.91115.2050.000截距44,802.778144,802.7781,210.1590.000Location_SuperMa

50、ket1,736.2222868.11123.4480.000Amount_competitors1,078.3333359.4449.7090.000误差1,110.6673037.022总计48,728.00036校正的总计3,925.22235a.R 方=.717(调整 R 方=.670)看到超市位置有显著影响,而竞争者数量没有显著影响,且影响强度仅为0.327,因此考虑是否存在交互作用。(2)有交互方差分析:看到超市位置有显著影响,而竞争者数量和交互作用均无显著影响。主体间效应的检验因变量:月销售额(万元)源III型平方和df均方FSig.校正模型3317.889(a)11301.62

51、611.9190.000a.R 方=.845(调整 R 方=.774)截距44,802.778144,802.778 1,770.4720.000Location_SuperMaket1,736.2222868.11134.3050.000Amount_competitors1,078.3333359.44414.2040.000Location_SuperMaketAmount_competitors503.333683.8893.3150.016误差607.3332425.306总计48,728.00036校正的总计3,925.2223511.5 一家物流公司的管理人员想研究货物的运输距离

52、和运输时间的关系,为此,他抽出了公司最近1 0 个卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下:运送距离X825 215 1 070 550 480 920 1 350 325 670 1 215运送时间y3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态:(2)计算线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。解:y运送时间(天)x运送距离(k m)可能存在线性关系。(2)相关性*.在.01水 平(双

53、侧)上显著相关。x 运送距离(km)y 运送时间(天)X运送距离(km)P earson相关性1.949(*)显著性(双侧)0.000N1010y 运送时间(天)P earson相关性.949(*)1显著性(双侧)0.000N1010有很强的线性关系。(3)系数(a)模型非标准化系数标准化系数B标准误B e tat显著性1(常量)0.1 1 80.3 5 50.3 3 30.7 4 8x运送距离(k m)0.0 0 40.0 0 00.9 4 98.5 0 90.0 0 0a.因变量:y运送时间(天)回归系数的含义:每公里增加0.0 0 4 天。要求:1 1.6 下面是7 个地区2 0 0 0

54、 年的人均国内生产总值(G D P)和人均消费水平的统计数据:地区人均G D P (元)人均消费水平(元)北京2 2 4 6 07 3 2 6辽宁1 1 2 2 64 4 9 0上海3 4 5 4 71 1 5 4 6江西4 8 5 12 3 9 6河南5 4 4 42 2 0 8贵州2 6 6 21 6 0 8陕西4 5 4 92 0 3 5(1)人均G D P 作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(4)计算判定系数,并解释其意

55、义。(5)检验回归方程线性关系的显著性(a=0.0 5)。(6)如果某地区的人均GDP为 5 0 0 0 元,预测其人均消费水平。(7)求人均G D P 为 5 0 0 0 元时,人均消费水平9 5%的置信区间和预测区间。解:人均消费水平(元)10000-8000-60004000-2000-12000-10000 20000 30000人均GDP(元)40000可能存在线性关系。(2)相关系数:相关性*.在.01水平(双侧)上显著相关。人均GDP(元)人均消费水平(元)人均GDP(元)Pearson相关性1.998(*)显著性(双侧)0.000N77人均消费水平(元)Pearson相关性.9

56、98(*)1显著性(双侧)0.000N77有很强的线性关系。(3)回归方程:系数(a)模型非标准化系数标准化系数B标准误Betat 显著性1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a.因变量:人均消费水平(元)回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。(4)模型摘要模型RR 方调整的R 方 估计的标准差ANOVA(b)I.998 0.996 0.996 247.303a.预测变量:(常量),人 均 GDP(元).人均GDP 对人均消费的影响达到99.6%。(5)F 检验:模型平方和df均方

57、F 与1回归81,444,968.680181,444,968.6801,331.692残差305,795.034561,159.007合计81,750,763.7146a.预测变量:(常量),人均G D P(元b.因变量:人均消费水平(元)系数(a)回归系数的检验:t 检验模型非标准化系数标准化系数B标准误Betat显著件1 (常量)734.693139.5405.2650.003人均GDP (元)0.3090.0080.99836.4920.000a.因变量:人均消费水平(元)(6)某地区的人均GDP 为 5 000元,预测其人均消费水平为2278.10657元。(7)人均GDP 为 5

58、000元时,人均消费水平95%的置信区间为1990.74915,2565.46399,预测区间为1580.46315,2975.749991 1.9 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:方差分析表变差来源d fS SM SFS i gn i f i c a n c e F回归11602708.61602708.6399.10000652.17E09残差1040158.074015.807一总计111642866.67参数估计表C o e f f i c i e n ts标准误差tS ta tP-va l ueI n te

59、 r c e p t363.689162.455295.8231910.000168XVa r i a b l e l1.4202110.07109119.977492.17E09要求:(1)完成上面的方差分析表。(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?(3)销售量与广告费用之间的相关系数是多少?(4)写出估计的回归方程并解释回归系数的实际意义。(5)检验线性关系的显著性(a=0.0 5)。解:(2)R 2=0.9 7 5 6,汽车销售量的变差中有9 7.5 6%是由于广告费用的变动引起的。(3)r=0.9 8 7 7 o(4)回归系数的意义:广告费用每增加个单位,汽车销量就

60、增加1.4 2 个单位。(5)回归系数的检验:p=2.1 7 E 0 9 a,回归系数不等于0,显著。回归直线的检验:p=2.1 7 E 0 9 a,回归直线显著。1 1.1 1 从 2 0 的样本中得到的有关回归结果是:S S R=6 0,S S E=4 0。要检验x 与 y之间的线性关系是否显著,即检验假设:。:笈=()。(1)线性关系检验的统计量F值是多少?(2)给定显著性水平a=0.05,F a是多少?(3)是拒绝原假设还是不拒绝原假设?(4)假定x 与 y之间是负相关,计算相关系数r。(5)检验x 与 y之间的线性关系是否显著?解:(1)S S R 的自由度为k=l:S S E 的自

61、由度为n-k-l =1 8;SSR 6 0因此:F=-=21SSE 4 0n-k-1 8(2)(1,1 8)=,0 5(1,1 8)=4.4 1(3)拒绝原假设,线性关系显著。(4)r=./-=j 0.6 =0.7 7 4 6,由于是负相关,因此 r=-0.7 7 4 6 S S R +SSE(5)从 F检验看线性关系显著。1 1.1 5 随机抽取7家超市,得到其广告费支出和销售额数据如下:超市广告费支出(万元)销售额(万元)A11 9B23 2C44 4D64 0E1 05 2F1 45 3G2 05 4要求:(1)用广告费支出作自变量X,销售额作因变量y,求出估计的回归方程。(2)检验广告

62、费支出与销售额之间的线性关系是否显著(a=0.05)。(3)绘制关于x 的残差图,你觉得关于误差项的假定被满足了吗?(4)你是选用这个模型,还是另寻找个更好的模型?解:系数(a)模型非标准化系数标准化系数B标准误Betat 显著性1(常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8313.3390.021a.因变量:销售额(万元)(2)回归直线的F 检验:ANOVA(b)模型平方和df均方F显著性1回归691.7231691.72311.147.021(a)残差310.277562.055合计1,002.0006a.预测变量:(常量),广告费支出(万

63、元)。b.因变量:销售额(万元)显著。回归系数的t 检验:系数(a)模型非标准化系数标准化系数B标准误Betat显著性1 (常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8313.3390.021a.因变量:销售额(万元)显著。(3)未标准化残差图:10.00000-5.OOOOO-pnplsapZIPHPPUc dgsuno.ooooo-5.OOOOO-10.00000-15.OOOOO-5 10 15广告费支出(万元)I20标准化残差图:IpnpISC DHP0.ooooo-1.0 0 0 0 0 -2.OOOOO-1.ooooo-I20I I

64、I5 10 15广告费支出(万元)学生氏标准化残差图:Ipnplsoxpezl4-uopn4-s1.00000-0.00000-1.00000-2.00000-2.00000-05101520广告费支出(万元)看到残差不全相等。(4)应考虑其他模型。可考虑对数曲线模型:y=b0+biln(x)=22.471+11.576ln(x)o1 2.2 根 据下面Excel输出的回归结果,说明模型中涉及多少个自变量、少个观察值?写出回归方程,并根据F,S。,R?及调整的总的值对模型进行讨论。SUMMARY OUTP UT回归统计Multiple RR SquareAdjusted R Square标准误

65、差观测值0.8424070.7096500.630463109.42959615解:自变量3 个,观察值15个。方差分析dfSSMSFSignificance F回归3321946.8018107315.60068.9617590.002724残差11131723.198211974.84总计14453670Coefficients标准误差t StatP-valueIntercept657.0534167.4595393.9236550.002378X Variable 15.7103111.7918363.1868490.008655X Variable 2-0.4169170.322193

66、-1.2939980.222174X Variable 3-3.4714811.442935-2.4058470.034870回归方程:y =657.0534+5.710311 Xr0.416917X2-3.471481X3拟合优度:判定系数R2=0.70965,调整的肥=0.630463,说明三个自变量对因变量的影响的比例占到63%o估 计 的 标 准 误 差=109.429596,说明随即变动程度为109.429596回归方程的检验:F 检验的P=0.002724,在显著性为5%的情况下,整个回归方程线性关系显著。回归系数的检验:/的 t 检验的P=0.008655,在显著性为5%的情况下,y 与 X1线性关系显著。夕 2的 t 检验的P=0.222174,在显著性为5%的情况下,y 与 X2线性关系不显著。区的 t 检验的P=0.034870,在显著性为5%的情况下,y 与 X?线性关系显著。因此,可以考虑采用逐步回归去除X 2,从新构建线性回归模型。1 2.3 根 据两个自变量得到的多元回归方程为户=-18.4+2.01*+4.74,并且已知n=10,S S T=6 7 2 4

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!