Excel在数理统计中的应用

上传人:沈*** 文档编号:46411398 上传时间:2021-12-13 格式:DOC 页数:20 大小:178KB
收藏 版权申诉 举报 下载
Excel在数理统计中的应用_第1页
第1页 / 共20页
Excel在数理统计中的应用_第2页
第2页 / 共20页
Excel在数理统计中的应用_第3页
第3页 / 共20页
资源描述:

《Excel在数理统计中的应用》由会员分享,可在线阅读,更多相关《Excel在数理统计中的应用(20页珍藏版)》请在装配图网上搜索。

1、Excel在数理统计中的应用Excel在数理统计中的应用2.1概率分布Excel提供概率函数PX=x和概率分布函数PXx或PX>x的一般形式xDIST(但泊松分布POISSON和韦伯分布WEIBULL例外),也提供累积概率分布函数的逆函数的一般形式xINV(但累积二项分布CRITBINOM例外)。具体相关函数请参考表2-2。按随机变量取值的特点,概率分布可以分为离散型随机变量的概率分布和连续型随机变量的概率分布。2.1.1离散概率分布以二项分布为例,Excel提供的常用二项分布函数有3个:二项分布函数BINOMDIST、累积二项分布的反函数CRITBINOM和负二项分布函数(即Pasca

2、l分布)NEGBINOMDIST。BINOMDIST(number_s,trials,probability_s,cumulative)返回一元二项式分布的概率值。Number_s为试验成功的次数。Trials为独立试验的次数。Probability_s为每次试验中成功的概率。Cumulative若为0,相当于FALSE,返回为概率函数,若为1,相当于TRUE,返回为概率分布函数。n?xn?x?一元二项式概率密度函数的计算公式为:b(x,n,p)=p(1?p),相当于?x?BINOMDIST(x,n,p,0)n?一元二项式累积分布函数的计算公式为:B(x,n,p)=b(x,n,p),相当于x=

3、0BINOMDIST(n,x,p,1)CRITBINOM(trials,probability_s,alpha)返回使累积二项式分布大于等于临界值的最小值。Trials伯努利试验次数。Probability_s每次试验中成功的概率。Alpha临界值。NEGBINOMDIST(number_f,number_s,probability_s)返回负二项式分布。当成功概率为常量probability_s时,函数NEGBINOMDIST返回在到达number_s次成功之前,出现number_f次失败的概率。Number_f失败次数。Number_s成功的极限次数。Probability_s成功的概率。

4、x+r?1?rx?负二项式(Pascal)分布概率为:f(x+r;r,p)=P(1?p),相当于?r?1?NEGBINOMDIST(x,r,p)例2.1.1某车间有200台车床,它们独立地工作着,开工率各为0.6,开工时耗电为1千瓦,第一问:至少需要120千瓦电力的概率是多少?第二问:供电所至少要供给给这个车间多少电力才能以99.9%的概率保证这个车间不会因供电不足而影响生产。步骤1:“插入”=>“函数”=>选择常用函数下选择函数中的BINOMDIST=>在“函数参数”窗口中,Number_s内输入119,Trials内输入200,Probability_s内输入0.6,Cu

5、mulative输入1(或直接输入=BINOMDIST(119,200,0.6,1)),得46.93%步骤2:“插入”=>“函数”=>选择常用函数下选择函数中的CRITBINOM=>在“函数参数”窗口中,Trials内输入200,Probability_s内输入0.6,Alpha输入0.999(或直接输入=CRITBINOM(200,0.6,0.999)),得141至少需要120千瓦电力的概率是1-46.93%=53.07%,对于第二问,用积分极限定理算出的与二项分布算出的一致,即同时开工的车床数不超过141台的概率大于99.9%。例2.1.2某仓库有两个同类型系统,每个系统

6、中都有50个备件,使用时,从两个系统中任取一个,然后从中抽取一个备件。问当第一次取到了一个空系统时,另一个系统中仍有10个备件的概率是多少?步骤:“插入”=>“函数”=>选择常用函数下选择函数中的NEGBINOMDIST=>在“函数参数”窗口中,Number_f内输入40,Number_s内输入51,Probability_s内输入0.5,(或直接输入=NEGBINOMDIST(40,51,0.5)),得2.41%当第一次取到了一个空系统时,另一个系统中仍有10个备件的概率是2.41%2.1.2对于连续概率分布以正态分布为例,Excel提供的正态分布函数有4个:正态分布函数N

7、ORMDIST、标准正态分布函数NORMSDIST、正态分布函数的反函数NORMINV和标准正态分布函数的反函数NORMSINV.NORMDIST(x,mean,standard_dev,cumulative)返回指定平均值和标准偏差的正态分布函数。X为需要计算其分布的数值。Mean分布的算术平均值。Standard_dev分布的标准偏差。如果Mean=0,Standard_dev=1且cumulative=1,则函数NORMDIST返回标准正态分布。2(x?)?x122?正态累积分布函数计算公式为:f(x)=edx,相当于?2 NORMDIST(x,?,1)NORMSDIST(z)返回标准正

8、态累积分布函数,该分布的平均值为0,标准偏差为1。Z为需要计算其分布的数值。2z?12?正态累积分布函数计算公式为:f(z;0,1)=e,相当于NORMSDIST(Z)2NORMSINV(probability)返回标准正态累积分布函数的反函数。该分布的平均值为0,标准偏差为1。如果已给定概率值,则NORMSINV使用NORMSDIST(z)=probability求解数值z。Probability正态分布的概率值。NORMINV(probability,mean,standard_dev)返回指定平均值和标准偏差的正态累积分布函数的反函数。如果已给定概率值,则NORMINV使用NORMDIS

9、T(x,mean,standard_dev,TRUE)=probability求解数值x。Probability正态分布的概率值。Mean分布的算术平均值。Standard_dev分布的标准偏差。例2.1.3假定某支股票的收益率呈正态分布,对应的正态分布的均值为5%,标准差为2%,试确定:(1)收益率为4%对应的概率密度函数值和股票收益率小于等于4%的概率。(2)股票获得收益率80%的可能性不超过某值,求该临界收益率。解:(1)在Excel单元格输入“=NORMDIST(0.04,0.05,0.02,0)”,回车得到收益率为4%对应的概率密度函数值17.60.在另一单元格输入“=NORMDIS

10、T(0.04,0.05,0.02,1)”,得到股票收益率小于等于4%的概率为30.85%.(2)在Excel单元格输入“=NORMINV(0.8,0.05,0.02)”,得到临界收益率为6.68%。2.2数字特征随机变量的概率分布函数或概率密度函数完整地描述了随机变量的统计特征。但是,在统计学应用中,往往不易求出随机变量的概率分布或概率密度函数,这时,就要研究随机变量的数字特征。本节主要研究的有数学期望、方差、协方差、相关系数。2.2.1期望与方差Excel只提供离散随机变量的数学期望,AVERAGE是计算算术平均值函数,SUMPRODUCT是成绩求和函数。Excel还提供函数VAR和VARP

11、计算样本和总体的方差。具体函数用法如下:AVERAGE(number1,number2,.)返回参数的平均值(算术平均值)。Number1,number2,.为需要计算平均值的1到30个参数。SUMPRODUCT(array1,array2,array3,.)在给定的几组数组中Array1,array2,array3,.为2到30个数组,将数组间对应的元素相乘,并返回乘积之和。例如,计算100.5+90.2+80.1+70.1+60.05+50.05+00,可以在单元格B6输入“=SUMPRODUCT(B1:H1,B2:H2)”回车得到8.85.如下图2-1图2-1VAR(number1,nu

12、mber2,.)计算基于给定样本的方差。Number1,number2,.为对应于n12样本的1到30个参数计算基于给定样本的方差。VAR(X?X)in?1i=1例如假设有10件工具在制造过程中是由同一台机器制造出来的,并取样为随机样本进行抗断强度检验。如图2-2如图2-2VARP(number1,number2,.)计算基于样本的另一个方差。Number1,number2,.为对n12应于样本总体的1到30个参数。VARP(X?X)ini=1例如假设全部10件工具在制造过程中是由同一台机器制造出来的,并取样进行抗断强度检验。如图2-3图2-3例2.2.1福建师范大学数计学院05级数本专业成绩

13、数据(具体数据附表2-1),计算数理统计成绩的平均值、方差和标准差。步骤1:“插入”=>“函数”=>选择常用函数下选择函数中的AVERAGE=>在“函数参数”窗口参数选择数据区域S4:S204(或直接输入=AVERAGEZ(S4:S204)),得68.37分步骤2:“插入”=>“函数”=>选择常用函数下选择函数中的VARP=>在“函数参数”窗口参数选择数据区域S4:S204(或直接输入=VARP(S4:S204)),得237.43步骤3:“插入”=>“函数”=>选择常用函数下选择函数中的STDEVP=>在“函数参数”窗口参数选择数据区域S4

14、:S204(或直接输入=STDEVP(S4:S204)),得15.41数理统计的平均成绩68.37分,方差为237.43,标准差为15.412.2.2协方差与相关系数n1?协方差计算公式为Cov(X,Y)=(x?x)(y?y)iini=1COVAR(array1,array2)返回协方差。Array1第一个所含数据为整数的单元格区域。Array2第二个所含数据为整数的单元格区域。Cov(X,Y)?相关系数计算公式为=x,yxyCORREL(array1,array2)返回相关系数。Array1第一组数值单元格区域。Array2第二组数值单元格区域。例2.2.2(续例2.2.1)数理统计成绩和概

15、率论成绩它们之间是否有关系呢?计算它们的协方差和相关系数。步骤1:“插入”=>“函数”=>选择常用函数下选择函数中的COVAR=>在“函数参数”窗口参数选择数据区域O4:O204和S4:S204(或直接输入=COVAR(O4:O204,S4:S204)),得122.60步骤2:“插入”=>“函数”=>选择常用函数下选择函数中的CORREL=>在“函数参数”窗口参数选择数据区域O4:O204和S4:S204(或直接输入=CORREL(O4:O204,S4:S204)),得0.64数理统计成绩和概率论成绩它们的协方差为122.60,相关系数为0.64,表明数理统

16、计成绩和概率论成绩还是有一定的相关性。3.点估计2矩法估计和极大似然估计都是点估计。设,L,是取自正态母体N(?,)的一个子1n22样,?和未知,=?<?<,>0。则均值?的矩估计和极大似然估计都是nn11222,方差的矩估计和极大似然估计都是=S=(?)ininni=1i=123.1甲、乙两班各有10名同学参加一场智力测验,其成绩如下表3-1所示。表3-1智力测验成绩表甲班98898778957693929362乙班91879496919397889186假设各班成绩服从正态分布,试用矩估计和极大似然的方法估计正态分布的均值?和方差2。2?解:由于和是正态分布的均值和方差,

17、因此样本均值和样本方差既是它们的矩估计,又是它们的极大似然估计。求样本均值,在Excel单元格中输入“=AVERAGE(B2:K2)”,回车得到样本均值为86.30在另一个单元格中输入“=AVERAGE(B3:K3)”,回车得到样本均值为91.40求样本方差,在Excel单元格中输入“=VAR(B2:K2)”,回车得到样本方差为123.12,在另一个单元格中输入“=VAR(B3:K3)”,回车得到样本方差为13.60.估计甲班平均成绩86.30,乙班平均成绩91.40,甲班成绩方差123.12,乙班成绩方差13.60.明显乙班的智力比甲班的强,且智力波动范围比甲班小。34.假设检验假设检验时涉

18、及到Excel中相关的函数如下:ZTEST(array,x,sigma)返回z检验的单尾概率值。对于给定的假设总体平均值,0ZTEST返回样本平均值大于数据集(数组)中观察平均值的概率,即观察样本平均值。array为数据区域,x为被检验的值,sigma为样本总体的标准偏差,如果省略,则使用样本标准偏差。不省略sigma时,函数ZTEST的计算公式如下:x?0ZTEST(array,?,sigma)=1-NORMSDIST0?/n?省略sigma时,函数ZTEST的计算公式如下:x?0ZTEST(array,?)=1-NORMSDIST0?s/n?TDIST(x,degrees_freedom,

19、tails)返回学生t分布的百分点(概率)。X为需要计算分x<0布的数字,不允许。Degrees_freedom为表示自由度的整数。Tails指明返回的分布函数是单尾分布还是双尾分布。如果tails=1,函数TDIST返回单尾分布,即P(X>x);如果tails=2,函数TDIST返回双尾分布,即P(X>x)。若x<0,应该注意TDIST(-x,df,1)=1TDIST(x,df,1)=P(X>-x)和TDIST(-x,df,2)=TDIST(xdf,2)=P(|X|>x)。TINV(probability,degrees_freedom)返回作为概率和自由

20、度函数的学生t分布的t值,P(|X|>t)=probability。Probability为对应于双尾学生t分布的概。Degrees_freedom为分布的自由度。单尾t值可通过用两倍概率替换概率而求得。如果概率为0.05而自由度为10,则双尾值由TINV(0.05,10)计算得到,它返回2.28139。而同样概率和自由度的单尾值可由TINV(2*0.05,10)计算得到,它返回1.812462。2CHIDIST(x,degrees_freedom)返回分布的单尾概率。CHIDTST=P(X>x)。X为用来计算分布的数值。Degrees_freedom自由度。2CHIINV(pro

21、bability,degrees_freedom)返回分布单尾概率的反函数值。Probability2为分布的单尾概率。Degrees_freedom自由度。TTEST(array1,array2,tails,type),用于判断两个样本是否可能来自两个具有相同均值的总体,返回与学生氏-t检验相关的概率。Array1为第一个数据集,Array2为第二个数据集。Tails指示分布曲线的尾数。如果tails=1,函数TTEST使用单尾分布。如果tails=2,函数TTEST使用双尾分布。Type为t检验的类型:type=1,成对双样本检验;type=2,等方差双样本检验;type=3,异方差双样本

22、检验。FTEST(array1,array2),用于判断两个样本的方差是否不同,返回是当数组1和数组2的方差无明显差异时的单尾概率。array1为第一个数据集,array2为第二个数据集。Excel不仅提供统计函数,通过单独或组合使用这些函数,可以解决大多数概率统计问题。而且还提供了一组称作“数据分析”的统计分析工具包,一共包括19个工具,如下表4-1。表4-1统计分析工具基础分析检验分析相关与回归方差分析其他分析工具描述统计Z-检验协方差单因素分析移动平均直方图F-检验相关系数可重复双因素分析指数平滑排位与百t-检验:双样本等回归分析无重复双因素分析傅立叶分析分比位方差假设随机数发t-检验:

23、双样本异生器方差假设t-检验:平均值的抽样分析成对二样本分析Excel在下载完整版安装后并不直接提供这些分析工具,在使用前在“工具”菜单上,单击“加载宏”,在“可用加载宏”列表中,选中“分析工具库”,单击“确定”。在打开“工具”菜单,就会发现多出了“数据分析”项目。单击它,可以打开“分析工具”对话框,如图4-1图4-14.1单个正态总体的假设检验设2设,L,是取自正态母体N(?,)的一个子样,均值检验考虑假设12n2222H:?=? H:?,方差检验考虑假设H:= H:。0010010024.1.1已知时,均值?的检验?0使用统计量U=进行假设检验,进行检验时有3种方法:/n?运用函数ZTES

24、T。双侧检验计算双尾概率:2*MIN(ZTEST(array,0,sigma),1-ZTEST(array,0,sigma)。单侧检验若原假设H:?,备择假设H:?<?,单尾概率:1-0010ZTEST(array,0,sigma);若原假设H:?,备择假设H:?>?,单尾概率:0010ZTEST(array,0,sigma)。?临界值法。计算z统计量值和接受域的临界值z,双侧检验:若z<z,则/2/2表其落在接受域内,接受H,否则应接受H。单侧检验:若原假设H:?,0100备择假设H:?<?,拒绝域为?,z;若原假设H:?,备择假设()1000H:?>?,拒绝域

25、为z,+。()10?P值法。双侧检验计算概率值P:2*MIN(NORMSDIST(z),1-NORMSDIST(z)。单侧检验计算概率值P:MIN(NORMSDIST(z),1-NORMSDIST(z)。例4.1.1已知全国高校男生百米跑成绩均数?=14.5,标准差=0.72,为了比较某高校00与全国高校的百米跑水平,现从该校随机抽测男生13人的百米跑成绩,数据如表4-2:表4-2男生13人的百米跑成绩15.214.814.414.213.913.613.713.513.313.814.214.114.6如果标准差不变,问该校的百米跑均值与全国高校有无显著差异?分析:百米跑成绩服从正态分布N(

26、?,),依题可知原假设H:?=?=14.5,备择000假设H:?=14.5,取显著性水平=0.0510用Excel求解方法一运用统计函数ztest,如图4-2图4-2从图4-2可以看出双侧检验的概率仅为0.045168<0.05,说明拒绝原假设,即该校的百米跑成绩均数与全国高校有显著差异。方法二临界值法和P值法。如图4-3图4-3从图4-3可以看出Z统计量?2.00(?,?1.961.96,)或P值为0.045<0.05,因此拒绝原假设,即该校的百米跑成绩均数与全国高校有显著差异。例4.1.2(续例4.1.1)问该校的百米跑均值是否比全国高校的百米跑均值显著小?分析:原假设H:?=

27、14.5,备择假设H:?<?=14.50010用Excel求解方法一运用统计函数ztest在Excel单元格输入“=1-ZTEST(A2:A14,14.5,0.72)”,回车可得概率为0.022584<0.05,说明拒绝原假设,即该校的百米跑成绩均数与全国高校有显著差异。方法二临界值法和P值法。如图4-4图4-4从上图可以看出Z统计量?2.00(?,?1.64或P值为0.023<0.025,于是拒绝原假设,即该校的百米跑均值比全国高校的百米跑均值显著小24.1.2未知时,均值?的检验?0使用统计量T=进行假设检验s/n?临界值法。计算t统计量值和接受域的临界值t,双侧检验:若

28、t<t,则1?/21?/2表其落在接受域内,接受H,否则应接受H。单侧检验:若原假设H:?,0100备择假设H:?<?,拒绝域为?,?t;若原假设H:?,备择假设()101?00H:?>?,拒绝域为t,+。()101?P值法。计算t统计量值,双侧检验计算概率值P:TDIST(t,自由度,2)。单侧检验计算概率值P:TDIST(t,自由度,1).例4.1.3(续例4.1.1)若全国高校男生百米跑成绩标准差未知,问该校的百米跑均值与全国高校有无显著差异?分析:百米跑成绩服从正态分布N(?,),依题可知原假设H:?=?=14.5,备择000假设H:?=14.5,取显著性水平=0.0

29、510用Excel求解如图4-5图4-5从图4-5可以看出T统计量?2.63(?,?2.182.18,)或P值为0.02<0.05,因此拒绝原假设,即该校的百米跑成绩均数与全国高校有显著差异。例4.1.4(续例4.1.3)问该校的百米跑均值是否比全国高校的百米跑均值显著小?分析:原假设H:?=14.5,备择假设H:?<?=14.50010用Excel求解如图4-6图4-6从图4-6可以看出T统计量?2.63(?,?1.78或P值为0.01<0.025,拒绝原假设,即该校的百米跑均值比全国高校的百米跑均值显著小。4.1.3?为未知常数时,方差的检验n2(?)*2i(n?1)S2

30、ni=1使用统计量= 进行假设检验2200222?临界值法。计算统计量值和接受域的临界值和,双侧检验:若1?/2/2222 , ,则表其落在接受域内,接受H,否则应接受H。单侧()/21?/20122222检验:若原假设H: ,备择假设H:<,拒绝域为0,;若()/2010022222原假设H: ,备择假设H:>,拒绝域为,+。()1?/2010022?P值法。计算统计量值,双侧检验计算概率值P:2*MIN(CHIDIST(),1-222CHIDIST()。单侧检验计算概率值P:MIN(CHIDIST(),1-CHIDIST()。2例4.1.5若全国高校男生百米跑成绩均数?未知,标

31、准差=0.72,问该校的百米跑成绩00与全国高校成绩稳定性有无显著差异?22分析:百米跑成绩服从正态分布N(?,),依题可知原假设H:=0.72,备择00022假设H:,取显著性水平=0.05。10用Excel求解如图4-7图4-72从图4-7可以看出x统计量6.94?(0,4.4023.34,)或P值为0.28>0.05,接受原假设,即可以认为该校的百米跑比全国高校的百米跑稳定性一样。4.2两个正态总体的假设检验设2设,L,是取自正态母体N(?,)的字样,,L,是取自正态母体12n1112m2N(?,)的字样,并且这两个字样相互独立。检验两个正态总体均值的考虑假设22H:?=? H:?

32、,检验两个正态总体方差的考虑假设0121122222H:= H:012112224.2.1,已知时,均值?的检验12?(?)12使用统计量U=进行假设检验2212+nm例4.2.1下面给出的是两个大文学家马克.吐温的8篇小品文及斯诺特格拉斯的10篇小品文中由3个字母组成的词的比例。马克吐温0.2250.2620.2170.2400.2300.2290.2350.217斯诺特格拉斯0.2090.2050.1960.2100.2020.2070.2240.2230.2200.2012设两组数据分别来自正态总体,并且第一组数据的方差为0.001856,第二组数据的方差12为0.000084.试检验两

33、位作家写的小品文稿中包含由3个字母组成的词的比例是否有显2著的差异?分析:依题可知原假设,备择假设,取显著性水平H:?=?H:?=0.05012112用Excel求解:“工具”=>“数据分析”=>在“数据分析”框中选“Z-检验:双样本均值差检验”=>单击“确定”=>在“Z-检验:双样本均值差检验”框中输入如下图4-8图4-8单击“确定”,得到下图4-9。图4-9从图4-9可以看出z值为3.944755>1.959964或P(Z<=z)双尾为0.000080<0.05,所以要拒绝原假设,即两位作家写的小品文稿中包含由3个字母组成的词的比例有显著的差异。“

34、P(Z<=z)单尾”表示与z统计量值沿着相同的方向远离0的z值的概率“。z单尾临界”P(Z>z临界值)=。从图中可看出P(Z<=z)单尾为0.000040<0.05,z单尾临界为1.644854,。即马克吐温写的小品文稿中包含由3个字母组成的词的比例3.9447551.644854, +()比斯诺特格拉斯的大。224.2.2,未知时,均值?的检验12?22假定=,使用统计量T=其中1211S+wnm*2*2(n?1)S+(m?1)S1n1mS=S进行假设检验wwn+m?222例4.2.2(续例4.2.1)若方差和未知。试检验两位作家写的小品文稿中包含由3个12字母组成的

35、词的比例是否有显著的差异?22分析:假定,依题可知原假设,备择假设,取显著性水=H:?=?H:?12012112平=0.05用Excel求解:方法一:运用统计函数TTEST步骤:“插入”=>“函数”=>“函数参数”对话框中输入如下图4-10图4-10单击“确定”,得到如下图4-11图4-11从上图可以看出TTEST=0.001334<0.05,说明拒绝原假设,即两位作家写的小品文稿中包含由3个字母组成的词的比例有显著的差异。方法二运用统计分析工具中的“t-检验:双样本等方差假设”“工具”=>“数据分析”=>在“数据分析”框中选“t-检验:双样本等方差假设”=>

36、;单击“确定”=>在“t-检验:双样本等方差假设”框中输入如下图4-12图4-12单击“确定”,得到下图4-13。图4-13从上图可以看出t值为3.878138>2.11990(5双尾临界)或P(T<=t)双尾为0.001334<0.05,所以要拒绝原假设,即两位作家写的小品文稿中包含由3个字母组成的词的比例有显著的差异。如果t<0,“P(T<=t)单尾”返回t-统计的观察值比t更趋向负值的概率。如果t>=0,则“P(T<=t)单尾”返回t-统计的观察值比t更趋向正值的概率。“t单尾临界值”返回截止值,这样,t-统计的观察值将大于或等于“t单尾临

37、界值”的概率就为Alpha。从图中可看出“P(T<=t)单尾”为0.000667<0.05,t单尾临界为1.745884,t统计量值为3.8781381.745884, +。即马克吐温写的小品文稿中包含由3个字母组成的词的比例()比斯诺特格拉斯的大。4.2.3?,?未知时,方差的检验12*2S1n使用统计量F=进行假设检验*2S2m22例4.2.3(续例4.2.1)若方差和未知。试检验两位作家写的小品文稿中包含由3个12字母组成的词的比例的方差是否有显著的差异?2222分析:依题可知原假设,备择假设,取显著性水平H:=H:=0.05012112用Excel求解,运用统计函数FTES

38、T步骤:“插入”=>“函数”=>在“插入函数”对话框中选FTEST=>单击“确定”=>在“函数参数”对话框中输入如下图4-14图4-14单击“确定”,得到下图4-15。图4-15从上图可以看出FTEST=0.250073>0.05,说明接受原假设,即两位作家写的小品文稿中包含由3个字母组成的词的比例有显著的差异。22例4.2.4(续例4.2.1)若方差和未知。试检验马克吐温写的小品文稿中包含由3个12字母组成的词的比例的方差是否明显比斯诺特格拉写的小品文稿中包含由3个字母组成的词的比例的方差大?2222分析:依题可知原假设H:,备择假设H:>,取显著性水平=

39、0.05012112用Excel求解,运用统计分析工具中的“F-检验:双样本方差”步骤:“工具”=>“数据分析”=>在“数据分析”框中选“F-检验:双样本方差”=>单击“确定”=>在“F-检验:双样本方差”框中输入如下图4-16图4-16单击“确定”,得到下图4-17。图4-17如果F<1,则当总体方差相等且根据所选择的显著水平“F单尾临界值”返回小于1的临界值时,“P(F<=f)单尾”返回F-统计的观察值小于F的概率Alpha。如果F>1,则当总体方差相等且根据所选择的显著水平,“F单尾临界值”返回大于1的临界值时,“P(F<=f)单尾”返回F

40、-统计的观察值大于F的概率Alpha。从上图可以看出“P(F<=f)单尾”0.125037>0.05,f单尾临界为3.292746,f统计量值为。即马克吐温写的小品文稿中包含由3个字母组成的词的2.272497?3.292746, +()比例比斯诺特格拉斯的大.5.区间估计设母体具有概率函数,为未知参数。,L,为取自这个母体的一个字样。fx;()1n若对于事先给定的,,存在两个统计量和使得,L,L,()()1n1n,则称区间(,)为参数的置信度为的P,L,<<,L,=1?1?()()1n1n置信区间,和分别称为置信度的置信下限和置信上限。1?25.1已知,单正态总体期望

41、的区间估计?的置信度为1?的置信区间u?1?n?2?Excel提供函数CONFIDENCE单正态总体期望的置信区间CONFIDENCE(alpha,standard_dev,size),该值构建总体平均值的置信区间xCONFIDENCE。Alpha是用于计算置信度的显著水平参数。置信度等于100*(1-alpha)%,亦即,如果alpha为0.05,则置信度为95%。Standard_dev数据区域的总体标准偏差,假设为已知。Size样本容量。5.1.1某校为迎接评估,要检查学生的英语口语水平,从全校学生中随机抽取80个学生进行测试,得到的成绩(具体附表5-1),假设成绩服从正态分布,且标准差

42、为=10,现要以95%的置信度估计全校学生英语口语的平均水平?步骤:“插入”=>“函数”=>选择常用函数下选择函数中的CONFIDENCE=>在“函数参数”窗口中,alpha内输入0.95,Standard_dev内输入10,Size内输入80,(或直接输入=CONFIDENCE(40,51,0.5)),得2.19(76.52,80.90).即?的置信度为 90%的置信区间为25.2未知,单正态总体期望的区间估计?S?的置信度为1?的置信区间t?1?n?2?5.2.1某校为迎接评估,要检查学生的英语口语水平,从全校学生中随机抽取80个学生进行测试(数据见附表5-1),得到的成

43、绩如下图5-1,现要以95%的置信度估计全校学生英语口语的平均水平?图5-1如图5-1所示,置信度为95%的全校学生英语口语平均成绩的置信区间为(76.35,81.08)注意:由于TINV函数返回的是双尾分布,因此其中的概率值用双倍的0.0255.3?未知,单正态总体方差的区间估计*2*2?(n?1)S(n?1)S2nn的置信度为1?的置信区间,. ?22(n?1)(n?1)1?/2/2?5.3.1(续4.1.2)问在95%置信度下全校学生英语口语成绩方差的置信区间?图5-2如图5-2所示,置信度为95%的全校学生英语口语平成绩方差的置信区间为(84.42,158.13)225.4,已知,二正

44、态总体均值差的区间估计1222?12?-?的置信度为1?的置信区间?u+.?12?1?nn122?5.4.1对厦门市海沧区的三叉路口小轿车和摩托车进行调查,每十分钟经过的小轿车和摩托车的数量如表5-2,要求计算在95%置信度下的小轿车和摩托车数量均值差的置信区间?图5-3如图5-3所示,置信度为95%的小轿车和摩托车数量均值差的置信区间为(-8.54,11.69)5.5?,?未知,二正态总体方差比的区间估计122*2*2?S1S1111的一个置信度为 1?的置信区间,?2*2*2SF(n?1,n?1)SF(n?1,n?1)221?/2122/212?5.5.1某学校要更新明年校车服务合同,准备

45、在A、B两公交公司中选择一个。公交公司的服务质量以到达时间的方差来衡量。较低的方差说明服务质量较高。今分别抽取A、B公司服务的13个和11个到达时间组成两个独立样本,如表5-3。试问置信度为95%的A公司的服务质量与B乙公司服务质量比的区间估计?(=0.05)图5-4如图5-4所示,置信度为95%的A公司的服务质量与B乙公司服务质量比的置信区间为(0.23,1.50)。6.一元线性回归由一个或一组非随机变量来估计或预测某一个随机变量的观测值时,所建立的数学模型及所进行的统计分析,称为回归分析。回归分析是研究随机变量与非随机变量之间的数量关系的一种数学方法。如果所建立的模型是线性的就称为线性回归

46、分析。线性回归分析中最简单的是一元线性回归。直线的公式为y=bx+b。10由最小二乘法可得:(x?x)(y?y)iib= 12(x?x)ixy?(xy)/niiii = 22x?(x)/niib=y?bx01对于描述现象间的相关程度与变动关系,Excel提供提供图表进行回归分析,它具有直观方便,利于理解的优点。Excel还提供回归分析工作表函数,主要有以下几个:(1)INTERCEPT(known_ys,known_xs)利用现有的x值与y值计算直线与y轴的截距。Known_ys为因变的观察值或数据集合。Known_xs为自变的观察值或数据集合。(2)SLOPE(known_ys,known_

47、xs)返回根据known_ys和known_xs中的数据点拟合的线性回归直线的斜率。Known_ys为数字型因变量数据点数组或单元格区域。Known_xs为自变量数据点集合。(3)RSQ(known_ys,known_xs)返回根据known_ys和known_xs中数据点计算得出的Pearson乘积矩相关系数的平方。Known_ys为数组或数据点区域。Known_xs为数组或数据点区域。(4)STEYX(known_ys,known_xs)返回通过线性回归法计算每个x的y预测值时所产生的标准误差。Known_ys为因变量数据点数组或区域。Known_xs为自变量数据点数组或区域。6.1一家大

48、型商业银行在多个地区设有分行,为弄清楚不良贷款形成的原因,抽取了该银行所属的25家分行2002年的有关业务数据(具体数据附表6-1).试建立不良贷款(y)与累计应收贷款(x)、的线性回归方程并求出相关系数的平方。解:用Excel提供的工作表函数进行相关计算如下图6-1:图6-1?根据计算结果可以得出直线方程:y=0.42x?0.32。每个观察值y与y的平均离差为2.51;R平方值为0.54.也可用用Excel图表进行回归分析步骤:“插入”=>“图表”=>在“图表向导”对话框选择图表类型“XY散点图”,点击“下一步”=>在图表向导步骤2“数据区域”中输入“=Sheet3!$A$

49、2:$B$26”,选择”系列产生在为“列”,单击“下一步”=>在图表向导步骤3中,数值(X)轴输入“累计应收贷款”,数值(Y)轴输入“不良贷款”,单击“下一步”=>单击“完成”=>在散点图中,把鼠标放在任一数据点上,游记,选择“添加趋势线”=>在“添加趋势线”对话框中打开“类型”,选择“线性”选项,在“选项”页面中选择“显示公式”和“显示R平方”选项,单击“确定”。得到如下图?由图中保留2位小数后所得的回归方程y=0.42x?0.32,R平方值为0.54,和上述用工作表函数计算出来的一样。附表5-1成绩4679947688578196768862819977886382

50、537790648362779166846379946784647996698466829872856683738567837386688374876884768871847788728478897385788974867890758779927587附表6-1累计应收货款不良货款6.812.70.93.519.815.61.110.27.78.94.837.20.63.20.216.55.97.80.42.252.7110.77.21.66.827.116.812.511.61.73.811.69.110.32.61.22.115.80.37.211.21243.260.8附表2-1概率论4

51、数理统计3478363697463.562.564.55350.583.562076.5756131.581.5889715.581.588.596.5063.572.560.5291677160.554.56691.5526236.575.547.551.565.56760.56049.567657566.56960.5636478.545.574.561.565666061647064.57651.57665.547.53785.55755.57260.54769.574.560.56060.57157505172577479.560636993.569.566.57478.5717676

52、.57568.5639156.570.560.590.531.563.57232.583.54960.544.5866266.585.579.5566062.565.517.56374.57488.550754785.525.56863.569.555.575.5777765647376.5486567.5913563.55847.577.5617062.584.568.574.5718060.564678870.58238.589.57564288081.575.56650.5767767.56067.56843.579.570657483.567.58350.56479.566.58079

53、74.57776.57473.589.577.584.589.57270.58088.574.568608168.564.5448578.577738771.56994.594.57657.565.567.560.582.56373.580.5677364.56944.573.5797584.563.58688.568479379.56177.560.59161.590.5648568.56960.560.5506966.564.5738471.57349.5688274666870.573.55068.572.572.56184.561.5607390.582.575.566.5707678

54、.539748687.566.581.5716367.57183.56976.571.567.56175.578.57967.571.550.562627235.56066.585.58063.577747052797958.56748.575.562.567.55568625668687155.577.580.57179.572.586.57275.5847474.567.553.580.5688180.574.576.564657573.579.575.59071.5677786.577.573.583.573.58946.58077.589.575.5877042.561.563.57660.55664.569.569

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!