区间估计与假设检验课件

上传人:痛*** 文档编号:214656788 上传时间:2023-05-30 格式:PPT 页数:89 大小:756.50KB
收藏 版权申诉 举报 下载
区间估计与假设检验课件_第1页
第1页 / 共89页
区间估计与假设检验课件_第2页
第2页 / 共89页
区间估计与假设检验课件_第3页
第3页 / 共89页
资源描述:

《区间估计与假设检验课件》由会员分享,可在线阅读,更多相关《区间估计与假设检验课件(89页珍藏版)》请在装配图网上搜索。

1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程第三章 区间估计与假设检验n3.1 区间估计与假设检验的基本概念区间估计与假设检验的基本概念n3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现n3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现n3.4 总体方差的区间估计与假设检验的总体方差的区间估计与假设检验的SAS实现实现n3.5 分布检验分布检验区间估计与假设检验课件STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n3.1 3.1 区间估计与假设检验的基本概念区

2、间估计与假设检验的基本概念n3.1.1 区间估计区间估计n3.1.2 假设检验假设检验区间估计与假设检验课件STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.1.1 区间估计区间估计1.1.点估计和区间估计点估计和区间估计 参数的估计方法主要有两种:点估计和区间估计。参数的估计方法主要有两种:点估计和区间估计。点点估估计计是是用用样样本本的的观观测测值值估估计计总总体体未未知知参参数数的的值值。由由于于样样本本的的随随机机性性,不不同同样样本本观观测测值值计计算算得得出出的的参参数数的的估估计计值值间间存存在在着着差差异异,因因此此常常用用一一个个区区间间估估

3、计计总总体体的的参参数数,并并把把具具有有一一定定可可靠靠性性和和精精度度的的估估计计区区间间称称为为置置信信区区间间。利利用用构构造造的的统统计计量量及及样样本本观观测测值值,计计算算得得出出参参数数的的置置信信区间的方法称为参数的区间估计。区间的方法称为参数的区间估计。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.参数的置信区间参数的置信区间 在在区区间间估估计计中中,对对于于总总体体的的未未知知参参数数,需需要要求求出出两两个个统统计计量量1(X1,X2,.,Xn)和和2(X1,X2,.,Xn)来来分分别别估估计计总总体体参参数数的的上上限限和和

4、下下限限,使使得得总总体体参参数数在在区间(区间(1,2)内的概率为)内的概率为P1 2=1 其其中中1 称称为为置置信信水水平平,而而(1,2)称称为为的的置置信信区区间间,1,2分分别别称称为为置置信信下下限限和和置置信信上上限限。置置信信水水平平为为1 的的含含义义是是随随机机区区间间(1,2)以以1 的的概概率率包包含含了了参数参数。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.正态总体均值和方差的置信区间正态总体均值和方差的置信区间 参参数数的的区区间间估估计计大大多多是是对对正正态态总总体体的的参参数数进进行行估估计计,如如对对单单总总体体

5、均均值值、方方差差的的估估计计、两两总总体体均均值值差差的的估估计计和和两总体方差比的估计等。两总体方差比的估计等。正态总体参数的各种置信区间见表正态总体参数的各种置信区间见表3-1。被估参数条件枢轴量及其分布参数的置信区间单正态总体2已知2未知2已知未知STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程正态总体参数的各种置信区间见表正态总体参数的各种置信区间见表3-1。其中被估参数条件枢轴量及其分布参数的置信区间两正态总体1-2两样本独立,12,22已知两样本独立,12=22=2 未知两样本独立,1,2未知STATSTATSTATSTATSASSAS软件与统计应

6、用教程软件与统计应用教程4.4.总体比例与比例差的置信区间总体比例与比例差的置信区间 实实际际应应用用中中经经常常需需要要对对总总体体比比例例进进行行估估计计,如如产产品品的的合合格格率率、大大学学生生的的就就业业率率和和手手机机的的普普及及率率等等。记记和和P分分别别表表示示总总体体比比例例和和样样本本比比例例,则则当当样样本本容容量量n很很大大时时(一一般般当当nP和和n(1 P)均均大大于于5时时,就就可可以以认认为为样样本本容容量量足足够够大大),样样本本比比例例P的的抽抽样样分分布布可可用用正正态态分分布布近近似似。总体比例与比例差的置信区间如表总体比例与比例差的置信区间如表3-2所

7、示。所示。待估参数枢轴量及其分布参数的置信区间总体比例两总体比例差1-2其中P1,P2为两个样本比例 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.1.2 假设检验假设检验1.1.假设检验的基本原理假设检验的基本原理 对对总总体体参参数数进进行行假假设设检检验验时时,首首先先要要给给定定一一个个原原假假设设H0,H0是是关关于于总总体体参参数数的的表表述述,与与此此同同时时存存在在一一个个与与H0相相对对立立的的备备择择假假设设H1,H0与与H1有有且且仅仅有有一一个个成成立立;经经过过一一次次抽抽样样,若若发发生生了了小小概概率率事事件件(通通常常把把概

8、概率率小小于于0.05的的事事件件称称为为小小概概率率事事件件),可可以以依依据据“小小概概率率事事件件在在一一次次实实验验中中几几乎乎不不可可能能发发生生”的的理理由由,怀怀疑疑原原假假设设不不真真,作作出出拒拒绝绝原原假假设设H0,接接受受H1的的决决定定;反反之之,若若小小概概率率事事件件没没有有发发生生,就就没没有有理理由由拒拒绝绝H0,从从而而应应作作出出拒绝拒绝H1的决定。的决定。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.假设检验的步骤假设检验的步骤 1)根据问题确立原假设根据问题确立原假设H0和备选假设和备选假设H1;2)确确定定一一

9、个个显显著著水水平平,它它是是衡衡量量稀稀有有性性(小小概概率率事事件)的标准,常取为件)的标准,常取为0.05;3)选选定定合合适适的的检检验验用用统统计计量量W(通通常常在在原原假假设设中中相相等等成成立立时时,W的的分分布布是是已已知知的的),根根据据W的的分分布布及及 的的值值,确定确定H0的拒绝域。的拒绝域。4)由由样样本本观观测测值值计计算算出出统统计计量量W的的观观测测值值W0,如如果果W0落落入入H0的的拒拒绝绝域域,则则拒拒绝绝H0;否否则则,不不能能拒拒绝绝原原假假设设H0。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 注注意意:在在SA

10、S系系统统中中,是是由由样样本本观观测测值值计计算算出出统统计计量量W的的观观测测值值W0和和衡衡量量观观测测结结果果极极端端性性的的p值值(p值值就就是是当当原原假假设设成成立立时时得得到到样样本本观观测测值值和和更更极极端端结结果果的的概概率率),然然后后比比较较p和和 作作判判断断:p ,拒拒绝绝原原假假设设H0;p,不不能拒绝原假设能拒绝原假设H0。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 p值通常由下面公式计算而得到。值通常由下面公式计算而得到。p=P|W|W0|=2 P W|W0|(拒绝域为两边对称的区域时)(拒绝域为两边对称的区域时)p=m

11、inPW W0,PW W0(拒绝域为两边非对称区域时)(拒绝域为两边非对称区域时)p=PW W0 (拒绝域为右边区域时)(拒绝域为右边区域时)p=PW W0 (拒绝域为左边区域时)(拒绝域为左边区域时)只只需需根根据据SAS计计算算出出的的p值值,就就可可以以在在指指定定的的显显著著水水平下,作出拒绝或不能拒绝原假设的决定。平下,作出拒绝或不能拒绝原假设的决定。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.正态总体均值和方差的假设检验正态总体均值和方差的假设检验 对对正正态态总总体体的的参参数数进进行行假假设设检检验验是是假假设设检检验验的的重重要要内

12、内容容,如如对对单单总总体体均均值值、方方差差的的检检验验、两两总总体体均均值值之之差差的的检检验验和和两两总总体体方方差差比比的的检检验验等等。正正态态总总体体参参数数的的各各种种检检验方法见下表验方法见下表3-3至表至表3-5。表3-3 单正态总体N(,2)均值的检验法检验名称条件检验类别H0H1检验统计量分布拒绝域Z检验已知双边检验=0 0N(0,1)|Z|Z/2左边检验 0 0Z Zt检验未知双边检验=0 0t(n 1)|t|t/2(n 1)左边检验 0 0t t(n 1)STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表3-4 单正态总体N(,2)方差

13、2的检验法或检验名称条件检验类别H0H1检验统计量分布拒绝域2检验已知双边检验左边检验右边检验未知双边检验左边检验右边检验STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表3-5 两正态总体的均值差与方差比的检验名称条件类别H0H1检验统计量分布拒绝域Z检验两样本独立,12=22=2未知双边检验1-2=01-20t(n1+n2 2)左边检验1-201-20t检验成对匹配样本,12,22未知双边检验d=0d0左边检验d0d0F检验两样本独立,1,2未知双边检验F(n11,n21)左边检验右边检验STATSTATSTATSTATSASSAS软件与统计应用教程软件与统

14、计应用教程4.4.总体比例与比例差的检验总体比例与比例差的检验 当当样样本本容容量量n很很大大时时,可可根根据据表表3-6对对总总体体比比例例与与比比例例差进行假设检验。差进行假设检验。表3-6 总体比例与比例差的检验检验名称检验类别H0H1 检验统计量分布拒绝域比例检验双边检验=0 0N(0,1)|z|z/2左边检验 0 0|z|z两总体比例差检验双边检验1=21 2N(0,1)|z|z/2左边检验1 21 2|z|zSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n3.2 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SASSAS实现实

15、现n3.2.1 使用使用INSIGHT模块模块n3.2.2 使用使用“分析家分析家”n3.2.3 使用使用TTEST过程过程区间估计与假设检验课件STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.2.1 使用使用INSIGHT模块模块1.1.总体均值的区间估计总体均值的区间估计【例例3-1】某某药药材材生生产产商商要要对对其其仓仓库库中中的的1000箱箱药药材材的的平平均均重重量量进进行行估估计计,药药材材重重量量的的总总体体方方差差未未知知,随随机机抽抽取取16箱样本称重后结果如表箱样本称重后结果如表3-7所示。所示。表3-7 16箱药材重量(单位:千克)设

16、设药药材材重重量量数数据据存存放放于于数数据据集集Mylib.yczl中中,其其中中重重量量变变量量名名为为weight。求求该该仓仓库库中中每每箱箱药药材材平平均均重重量量在在95%置信水平下的置信区间。置信水平下的置信区间。50505651495347525353495355485055STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程步骤如下:步骤如下:1)启动启动INSIGHT模块,并打开数据集模块,并打开数据集Mylib.yczl;2)选择菜单选择菜单“Analyze”“Distribution(Y)”;3)在在打打开开的的“Distribution(Y

17、)”对对话话框框中中进进行行区区间间估计的设置(如图)。估计的设置(如图)。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 结结果果包包括括一一个个名名为为“95Confidence Intervals(95%置置信信区区间间)”的的列列表表,表表中中给给出出了了均均值值、标标准准差差、方方差差的的估估计计值值(Parameter)、置置信信下下限限(LCL)和和置置信信上上限限(UCL),如如图图3-2所所示示。结结果果表表明明,根根据据抽抽样样样样本本,该该仓仓库库中中药药材材的的平平均均重重量量以以95%的的可可能能性性位位于于50.08千千克至克至52

18、.92千克之间。千克之间。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.单样本总体均值的假设检验单样本总体均值的假设检验【例例3-2】一一家家食食品品厂厂以以生生产产袋袋装装食食品品为为主主,每每天天的的产产量量大大约约为为8000袋袋,每每袋袋重重量量规规定定为为100克克。为为了了分分析析每每袋袋重重量量是是否否符符合合要要求求,质质检检部部门门经经常常进进行行抽抽检检。现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了25袋袋,测测得得每每袋袋重重量量如如表表3-8所示。所示。表3-8 25袋食品的重量(单位:克)试试从从抽抽检

19、检的的样样本本数数据据出出发发,检检验验变变量量WEIGHT的的均均值值与与100克克是是否否有有显显著著差差异异。假假定定表表3-8数数据据存存放放在在数数据据集集Mylib.spzl中,重量变量名为中,重量变量名为WEIGHT。112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 设设变变量量WEIGHT的的均均值值为为,问问

20、题题是是希希望望通通过过样样本本数数据检验变量据检验变量WEIGHT均值的如下假设:均值的如下假设:H0:=100,H1:100。使用使用INSIGHT对均值进行检验的步骤如下:对均值进行检验的步骤如下:1)首先启动首先启动INSIGHT,并打开数据集,并打开数据集Mylib.spzl;2)选择菜单选择菜单“Analyze”“Distribution(Y)”;3)在在打打开开的的“Distribution(Y)”对对话话框框中中选选定定分分析析变量变量WEIGHT;4)单击单击“OK”按钮,得到变量的描述性统计量;按钮,得到变量的描述性统计量;STATSTATSTATSTATSASSAS软件与

21、统计应用教程软件与统计应用教程 5)选选 择择 菜菜 单单“Tables(表表)”“Tests for Location(位位 置置 检检 验验)”;在在 弹弹 出出 的的“Tests for Location”对对话话框框中中输输入入100,单单击击“OK”按按钮钮得得到到输输出出结果如图所示。结果如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 结结果果显显示示,观观测测值值不不等等于于100克克的的观观测测有有24个个,其其中中19个观测值大于个观测值大于100。图图中中第第一一个个检检验验为为t检检验验(Students t),需需要要假假定定

22、变变量量服服从从正正态态分分布布,检检验验的的p值值为为0.0105,这这个个检检验验在在0.05水水平平下下是是显显著著的的,所所以以可可认认为为均均值值与与100克克有有显显著著差差异异。第第二二个个检检验验(Sign)是是叫叫做做符符号号检检验验的的非非参参数数检检验验,其其p值值为为0.0066,在在0.05水水平平下下也也是是显显著著的的,结结论论不不变变。第第三三个个检检验验(Sgned Rank)是是叫叫做做符符号号秩秩检检验验的的非非参参数数检检验验,其其p值为值为0.0048,在,在0.05水平下是显著的,结论不变。水平下是显著的,结论不变。STATSTATSTATSTATS

23、ASSAS软件与统计应用教程软件与统计应用教程3.3.两样本总体均值的比较:成对匹配样本两样本总体均值的比较:成对匹配样本 在在INSIGHT中中比比较较成成对对样样本本均均值值是是否否显显著著差差异异,可可以以计计算算两两变变量量的的差差值值变变量量,再再检检验验差差值值变变量量的的均均值值是是否否显著为显著为0。【例例3-3】由由10名名学学生生组组成成一一个个随随机机样样本本,让让他他们们分分别别采用采用A和和B两套试卷进行测试,结果如表两套试卷进行测试,结果如表3-9所示。所示。表3-9 10名学生两套试卷的成绩试从样本数据出发,分析两套试卷是否有显著差异。试从样本数据出发,分析两套试

24、卷是否有显著差异。试卷A78637289914968768555试卷B71446184745155607739差值71911517-21316816STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 步骤如下:步骤如下:1)首先生成差值变量:首先生成差值变量:启启动动INSIGHT,并并打打开开数数据据集集Mylib.sjcj。选选择择菜菜单单“Edit”“Variables”“Other”,打打 开开“Edit Variables”对对话话框框,选选择择A为为Y变变量量,B为为X变变量量,然然后后选选择择变变换换(Transformation):Y X,如如图图

25、,生生成成新新的差值变量的差值变量d;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2)然后对变量然后对变量d的均值做如下假设:的均值做如下假设:H0:d=0,H1:d 0。3)选选择择菜菜单单“Analyze”“Distribution(Y)”;在在打打开开的的“Distribution(Y)”对对话话框框中中选选定定分分析析变变量量:选选择择变变量量差差值值d,单单击击“Y”按按钮钮,将将变变量量d移移到到右右上上方方的列表框中的列表框中;4)单单击击“Output”按按钮钮,在在打打开开的的对对话话框框中中选选中中“Tests for Location

26、(位置检验)(位置检验)”复选框;复选框;5)两次单击两次单击“OK”按钮,得到变量的描述性统计量;按钮,得到变量的描述性统计量;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 6)选选 择择 菜菜 单单“Tables(表表)”“Tests for Location(位位 置置 检检 验验)”;在在 弹弹 出出 的的“Tests for Location”对对话话框框中中输输入入0,单单击击“OK”按按钮钮得得到到输输出出结结果如图所示。果如图所示。结结果果显显示示三三个个检检验验的的结结论论都都是是p值值小小于于0.05,所所以以应应拒拒绝绝原原假假设设,即

27、即总总体体的的均均值值与与0有有显显著著差差异异。所所以以两两套套试卷有显著差异。试卷有显著差异。虽虽然然SAS给给出出三三个个检检验验结结果果,其其实实作作结结论论时时只只需需其其中中一一个个。如如果果可可以以认认为为分分析析变变量量服服从从正正态态分分布布只只要要看看t检检验验结结果果;否否则则只只须须看看符符号号秩秩检检验验结结果果。只只有有在在数数据据为为两两两比较的大小结果而没有具体数值时符号检验才有用。两比较的大小结果而没有具体数值时符号检验才有用。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.2.2 使用使用“分析家分析家”1.1.总体均值的

28、置信区间总体均值的置信区间【例例3-4】在在“分分析析家家”中中求求例例3-1中中每每箱箱药药材材平平均均重重量量在在95%置信水平下的置信区间。置信水平下的置信区间。步骤如下:步骤如下:1)在在“分析家分析家”模块中打开数据集模块中打开数据集Mylib.yczl;2)选选择择菜菜单单“Statistics(统统计计)”“Hypothesis Tests(假假设设检检验验)”“One Sample t test for a Mean(单样本均值(单样本均值t-检验)检验)”;3)在在打打开开的的“One Sample t test for a Mean”对对话话框框中设置均值的置信区间(如图中

29、设置均值的置信区间(如图3-6)。)。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3)在在打打开开的的“One Sample t test for a Mean”对对话话框框中设置均值的置信区间(如图中设置均值的置信区间(如图3-6)。)。结结果果表表明明(下下图图),根根据据抽抽样样样样本本,该该仓仓库库中中药药材材的的平平均均重重量量以以95%的的可可能能性性位位于于50.08千千克克至至52.92千千克克之之间。间。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.单样本总体均值的假设检验单样本总体均值的假设检验

30、【例例3-5】使使用用“分分析析家家”检检验验例例3-2中中食食品品重重量量是是否否符符合合要要求求。希希望望通通过过样样本本数数据据检检验验变变量量WEIGHT均均值值的的如下假设:如下假设:H0:=100,H1:100。由于此时的方差未知,所以使用由于此时的方差未知,所以使用t检验法。步骤如下:检验法。步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.spzl;2)选选择择菜菜单单“Statistics(统统计计)”“Hypothesis Tests(假假设设检检验验)”“One Sample t test for a Mean(单单样样本本均均值值t-检检验验)”,打

31、打开开“One Sample t test for a Mean”对话框;对话框;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4)按按图图3-8所所示示设设置置均均值值检检验验,单单击击“OK”按按钮钮,得得到结果如图左所示。;到结果如图左所示。;显显示示结结果果(图图右右)表表明明t统统计计量量的的p值值为为0.01050.05,所以拒绝原假设,即认为总体的均值不等于所以拒绝原假设,即认为总体的均值不等于100。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.两样本总体均值的比较:成对匹配样本两样本总体均值的比较:

32、成对匹配样本【例例3-6】使使用用“分分析析家家”对对例例3-3中中两两套套试试卷卷检检验验有有无无显著差异。显著差异。这这是是一一个个(成成对对匹匹配配)双双样样本本均均值值检检验验问问题题,若若1和和2分别表示两套试卷的平均成绩,则检验的是:分别表示两套试卷的平均成绩,则检验的是:H0:1 2=0,H1:1 2 0;分析步骤如下:分析步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.sjdf;2)选选择择菜菜单单“Statistics(统统计计)”“Hypothesis Tests(假假设设检检验验)”“Two Sample Paired t-Test for a Me

33、an(均值的成对双样本(均值的成对双样本t-检验)检验)”;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3)在在打打开开的的“Two Sample Paired t-Test for a Mean”对对话话框框中中,按按图图左左所所示示设设置置双双样样本本均均值值检检验验,单单击击“OK”按钮,得到结果如图右所示按钮,得到结果如图右所示 结结果果显显示示,无无论论两两总总体体的的方方差差是是否否相相等等,t统统计计量量的的p值值=0.0005 0.05,所所以以在在95%的的置置信信水水平平下下,拒拒绝绝原假设,两总体的均值有显著差异。原假设,两总体的均值

34、有显著差异。结果表明可以结果表明可以95%的把握认为两套试卷有显著差异。的把握认为两套试卷有显著差异。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.两样本总体均值的比较:独立样本两样本总体均值的比较:独立样本【例例3-7】为为估估计计两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排一一些些个个工工人人进进行行操操作作试试验验,每每个个工工人人组组装装一一件件产产品品所所需需的的时时间间如如表表3-10所所示示。试试以以95%的的置置信信水水平平推推断断两两种种方方法法组组

35、装装产产品品所所需需平均时间有无差异。平均时间有无差异。表3-10 两种方法组装产品所需的时间(单位:分钟)这这是是一一个个(独独立立)两两样样本本均均值值检检验验问问题题,若若1和和2分分别别表表示示两两种种方方法法组组装装一一件件产产品品所所需需的的平平均均时时间间,则则检检验验的是:的是:H0:1 2=0,H1:1 2 0;方法128.330.129.037.632.128.836.037.238.534.428.030.0方法227.622.231.033.820.030.231.726.032.031.2STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程

36、 假假定定表表3-10数数据据存存放放在在数数据据集集Mylib.zzcpsj中中,将将两两个个样样本本中中被被比比较较均均值值的的变变量量的的观观测测值值记记在在同同一一分分析析变变量量F下下,不不同同的的样样本本用用一一个个分分类类变变量量g的的不不同同值值加加以以区区分分,而且分类变量而且分类变量g只能取两个值,否则无法进行。只能取两个值,否则无法进行。分析步骤如下:分析步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.zzcpsj;2)选选择择菜菜单单“Statistics(统统计计)”“Hypothesis Tests(假假 设设 检检 验验)”“Two Samp

37、le t-Test for Mean(两样本均值的(两样本均值的t-检验)检验)”;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3)在在打打开开的的“Two Sample t-Test for a Mean”对对话话框框中中,按按图图3-12所所示示设设置置双双样样本本均均值值检检验验,单单击击“OK”按按钮,得到结果如图钮,得到结果如图3-13所示所示 结结果果显显示示,由由于于t统统计计量量的的p值值=0.0433,所所以以在在95%的的置置信信水水平平下下,应应该该拒拒绝绝原原假假设设,即即两两种种方方法法所所需需时时间间有有差异。表明有差异。表明有

38、95%的把握认为两种方法所需时间有差异。的把握认为两种方法所需时间有差异。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.2.3 使用使用TTEST过程过程TTEST过过程程可可以以执执行行单单样样本本均均值值的的t检检验验、配配对对数数据据的的t检验以及双样本均值比较的检验以及双样本均值比较的t检验。检验。1.1.语法格式语法格式PROC TTEST;CLASS;VAR;PAIED;BY;RUN;其其中中,PROC TTEST和和RUN语语句句是是必必须须的的,其其余余语语句都是可选的,而且可调换顺序。句都是可选的,而且可调换顺序。STATSTATSTAT

39、STATSASSAS软件与统计应用教程软件与统计应用教程 CLASS语语句句所所指指定定的的分分组组变变量量是是用用来来进进行行组组间间比比较较的的;而而BY语语句句所所指指定定的的分分组组变变量量是是用用来来将将数数据据分分为为若若干干个个更更小小的的样样本本,以以便便SAS分分别别在在各各小小样样本本内内进进行行各各自自独立的处理。独立的处理。VAR语语句句引引导导要要检检验验的的所所有有变变量量列列表表,SAS将将对对VAR语句所引导的所有变量分别进行组间均值比较的语句所引导的所有变量分别进行组间均值比较的t检验。检验。STATSTATSTATSTATSASSAS软件与统计应用教程软件与

40、统计应用教程 PAIED语语句句用用来来指指定定配配对对t检检验验中中要要进进行行比比较较的的变变量量对对,其其后后所所带带的的变变量量名名列列表表一一般般形形式式及及其其产产生生的的效效果果见见表表3-11。表3-11 选项及其含义变量名列表形式产生的效果a*ba ba*b c*da b,c d(a b)*(c d)a c,a d,b c,b d(a b)*(c b)a c,a b,b cSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 PROC TTEST语语句句后后可可跟跟的的选选项项及及其其表表示示的的含含义义如如表表3-12所示。所示。表3-12 选项

41、及其含义选项代表的含义data=等号后为SAS数据集名,指定ttest过程所要处理的数据集,默认值为最近处理的数据集alpha=等号后为01之间的任何值,指定置信水平,默认为0.05ci=等号后为“equal,umpu,none”中的一个,表示标准差的置信区间的显示形式,默认为ci=equalcochran有此选项时,ttest过程对方差不齐时的近似t检验增加cochran近似法h0=等号后为任意实数,表示检验假设中对两均值差值的设定,默认值为0STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.总体均值的置信区间总体均值的置信区间【例例3-8】仍仍然然考考

42、虑虑例例3-3中中的的样样本本数数据据。假假定定其其中中数数据据使使用用如如下下数数据据步步存存放放在在数数据据集集sjcj中中,两两套套试试卷卷得得分分的的变量名分别为变量名分别为A和和B。data sjcj;input A B;cards;78 71 63 44 72 61 89 84 91 7449 51 68 55 76 60 85 77 55 39;run;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程【例例3-8】仍仍然然考考虑虑例例3-3中中的的样样本本数数据据。假假定定其其中中数数据据使使用用如如下下数数据据步步存存放放在在数数据据集集sjcj

43、中中,两两套套试试卷卷得得分分的的变量名分别为变量名分别为A和和B。使用最简代码求均值、标准差的置信区间:使用最简代码求均值、标准差的置信区间:proc ttest data=sjcj;run;代代码码运运行行结结果果给给出出两两个个变变量量在在95%置置信信水水平平下下的的均均值值、标标准准差差的的置置信信区区间间,以以及及对对原原假假设设0=0所所作作的的t检检验验的的p值,如图所示。值,如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.单样本总体均值的假设检验单样本总体均值的假设检验 在例在例3-8中增加原假设选项以及置信水平,代码如下:中

44、增加原假设选项以及置信水平,代码如下:proc ttest h0=70 alpha=0.01 data=sjcj;var A;run;代代码码运运行行结结果果除除了了给给出出变变量量A在在99%置置信信水水平平下下的的均均值值、标标准准差差的的置置信信区区间间外外,还还给给出出对对假假设设0=70,所所作作的的t-检验的检验的p值,如图值,如图3-15所示。所示。结结果果显显示示t统统计计量量的的p值值=0.5734,不不能能拒拒绝绝(57.34%的的把握)原假设:均值把握)原假设:均值=70。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.配对两样本均

45、值的假设检验配对两样本均值的假设检验 在例在例3-8中检验两套试卷有无显著差异,代码如下:中检验两套试卷有无显著差异,代码如下:proc ttest data=sjcj;paired A*B;run;代代码码运运行行结结果果给给出出了了对对原原假假设设1 2=0所所作作的的t检检验的验的p值,如图值,如图3-16所示。所示。结结果果显显示示t统统计计量量的的p值值=0.0005 0.05,因因此此拒拒绝绝原原假假设。说明两套试卷有显著差异。设。说明两套试卷有显著差异。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程5.5.独立两样本均值的假设检验独立两样本均值的

46、假设检验 过过程程TTEST还还可可以以用用于于进进行行独独立立双双样样本本均均值值比比较较的的t检验法。它的用法为检验法。它的用法为PROC TTEST DATA=;CLASS;VAR;RUN;使使用用这这一一格格式式要要求求将将两两个个样样本本中中被被比比较较均均值值的的变变量量的的观观测测值值记记在在同同一一分分析析变变量量下下,不不同同的的样样本本用用另另一一个个分分类类变变量量的的不不同同值值加加以以区区分分,而而且且分分类类变变量量只只能能取取两两个个值值,否则将报错。否则将报错。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程【例例3-9】仍仍然然

47、考考虑虑例例3-7中中的的样样本本数数据据。假假定定其其中中数数据据使用如下数据步存放在数据集使用如下数据步存放在数据集zzcpsj中:中:data zzcpsj;input f g$;cards;28.3 1 27.6 2 30.1 1 22.2 2 29 1 31 237.6 1 33.8 2 32.1 1 20 2 28.8 1 30.2 236 1 31.7 2 37.2 1 26 2 38.5 1 32 234.4 1 31.2 2 28 1 30 1;run;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 将将两两批批工工人人的的测测量量结结果果看

48、看作作两两个个样样本本,但但其其数数据据都都放放在在一一个个数数据据集集之之中中,所所需需的的时时间间值值是是记记录录在在同同一一分分析析变变量量f之之下下,而而两两种种方方法法的的差差别别是是由由变变量量g的的值值加加以以区区分分的的,所以所以g可作为分类变量。检验代码如下:可作为分类变量。检验代码如下:proc ttest data=zzcpsj;class g;var f;run;检验结果如图所示。检验结果如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程在在检检验验中中,先先看看其其最最后后关关于于方方差差等等式式的的检检验验结结果果,检检验验方

49、方差差相相等等是是用用的的F 统统计计量量,其其数数值值为为1.29,相相应应的的p值值为为0.67790.05=,所以不能拒绝方差相等的假设。,所以不能拒绝方差相等的假设。在在方方差差相相等等的的前前提提下下,检检验验均均值值差差异异使使用用Pooled方方法法,对对应应统统计计量量的的t值值为为2.16,相相应应的的p值值为为0.04330.05=,所以两种方法所需的时间是有显著差异的。,所以两种方法所需的时间是有显著差异的。在在异异方方差差的的情情况况下下,使使用用Satterthwaite法法检检验验均均值值的的差异。差异。STATSTATSTATSTATSASSAS软件与统计应用教程

50、软件与统计应用教程n3.3 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SASSAS实现实现n3.3.1 总体比例的置信区间总体比例的置信区间n3.3.2 单样本总体比例的假设检验单样本总体比例的假设检验n3.3.3 两总体比例的比较两总体比例的比较区间估计与假设检验课件STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.1 总体比例的置信区间总体比例的置信区间【例例3-10】2004年年底底北北京京市市私私家家车车拥拥有有量量已已达达到到129.8万万辆辆,位位居居全全国国之之首首,据据业业内内人人士士分分析析其其中中国国产产中中低

51、低档档汽汽车车的的比比例例较较大大,为为了了估估计计目目前前北北京京市市场场个个人人购购车车的的平平均均价价格格,调调查查人人员员于于某某日日在在北北京京最最大大的的车车市市随随机机抽抽取取36位位私人消费购车者,得到他们所购汽车的价格,见下表。私人消费购车者,得到他们所购汽车的价格,见下表。表3-13 年底购车价格(单位:万元)根根据据以以上上调调查查数数据据,试试以以95的的置置信信水水平平推推断断该该地地区区购购买私家车在买私家车在15万元以上的消费者占有的比例。万元以上的消费者占有的比例。6.8811.2819.9813.610.614.86.8811.7820.9824.412.31

52、4.86.8813.6813.630.314.614.88.2814.9814.79.614.617.49.615.6815.89.612.95.3810.1815.6820.510.614.87.38STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 设设购购车车价价格格数数据据存存放放在在数数据据集集Mylib.gcjg中中,价价格格变变量量名名为为price。这这是是一一个个单单样样本本比比例例的的区区间间估估计计问问题题。由由于于在在SAS中中只只能能对对两两水水平平的的分分类类变变量量作作比比例例的的区区间间估估计计与与检检验验,所所以以首首先先要要按按

53、变变量量price生生成成一一个个新新的的分分类类变量。步骤如下:变量。步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.gcjg;2)选选择择主主菜菜单单“Edit(编编辑辑)”“Mode(模模式式)”“Edit(编辑)(编辑)”,使数据集可以被编辑(修改);,使数据集可以被编辑(修改);STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3)选选择择主主菜菜单单“Data(数数据据)”“Transform(变变换换)”“Recode Ranges(重重编编码码范范围围)”,打打开开“Recode Ranges Information”对对话

54、话框框并并按按图图3-18(左左)设置有关内容;设置有关内容;4)单单击击“OK”按按钮钮,打打开开“Recode Ranges”对对话话框框,按图按图3-18右所示生成新变量右所示生成新变量price_f;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 6)选选择择菜菜单单“Statistics(统统计计)”“Hypothesis Tests(假假 设设 检检 验验)”“One Sample Test for a Proportion(单样本比例检验)(单样本比例检验)”;7)在在打打开开的的“One Sample Test for a Proportion

55、”对对话话框中,按图框中,按图3-19设置比例的置信区间。设置比例的置信区间。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程分分析析结结果果中中包包括括变变量量的的置置信信区区间间:按按95%的的置置信信水水平平变变量量price取取值值为为“15”的的比比例例在在区区间间(0.109,0.391)范范围围中中(如如图图3-20),即即可可以以95%的的概概率率估估计计该该地地区区所所购购买买车车辆辆在在15万万元元以以上上的的消消费费者者所所占占比比例例在在10.9%39.1%之间。之间。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统

56、计应用教程3.3.2 单样本总体比例的假设检验单样本总体比例的假设检验【例例3-11】考考虑虑例例3-10中中的的数数据据,试试检检验验总总体体中中购购买买车车辆在辆在15万元以上者所占比例是否超过万元以上者所占比例是否超过30%。这这是是一一个个单单样样本本比比例例检检验验问问题题,若若 表表示示总总体体中中购购买买车辆在车辆在15万元以上者所占比例,则检验的是:万元以上者所占比例,则检验的是:H0:0.3,H1:0.05,所所以以不能拒绝原假设。不能拒绝原假设。结结果果表表明明购购买买车车辆辆在在15万万元元以以上上者者所所占占比比例例在在95%的的置信水平下超过置信水平下超过30%。ST

57、ATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.3 两总体比例的比较两总体比例的比较【例例3-12】2004年年底底很很多多类类型型的的国国产产轿轿车车价价格格都都比比年年中中有有所所下下降降,为为了了对对比比2004年年底底与与年年中中私私家家购购车车族族购购车车价价格格的的差差异异,在在年年中中新新购购车车者者中中随随机机抽抽取取32人人,调调查查得得到到的价格数据如表的价格数据如表3-14。表3-14 年中购车价格(单位:万元):综综合合表表3-13与与表表3-14的的调调查查数数据据,试试以以95的的置置信信水水平平推推断断该该地地区区年年底底与与年

58、年中中购购买买私私家家车车在在15万万元元以以上上的的消消费费者占有比例有无差异。者占有比例有无差异。5.3810.7812.8814.718.8830.37.3811.213.61519.9815.287.9811.7813.6515.820.59.999.3811.7814.615.920.989.3610.312.314.71724.48.9911.3810.28STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 这这是是一一个个双双样样本本比比例例检检验验问问题题,若若 1和和 2分分别别表表示示总总体体中中年年底底和和年年中中购购买买私私家家车车在在15

59、万万元元以以上上的的消消费费者者所所占占的比例,则检验的是假设:的比例,则检验的是假设:H0:1 2=0,H1:1 2 0;首首先先将将3-7与与表表3-8的的调调查查数数据据存存入入一一个个数数据据集集Mylib.gcjgQ中中,价价格格变变量量名名为为price,使使用用变变量量period以以区区别别年年中中数数据据(2)与与年年底底数数据据(1)。按按例例3-10中中的的步步骤骤由由price生生成成两两水水平平分分类类变变量量price_F。图图3-23所所示示即即为为数数据据集集Mylib.gcjgQ中中的的部部分分数据。数据。STATSTATSTATSTATSASSAS软件与统计

60、应用教程软件与统计应用教程然后,对上面假设进行检验,步骤如下:然后,对上面假设进行检验,步骤如下:1)在在分分析析家家中中打打开开数数据据集集Mylib.gcjgQ后后,选选择择菜菜单单“Statistics”“Hypothesis Tests”“Two Sample Test for Proportion(双双样样本本比比例例检检验验)”,在在对对话话框框中,按图左设置双样本比例检验,分析结果如图右所示。中,按图左设置双样本比例检验,分析结果如图右所示。结结果果显显示示,由由于于Z统统计计量量的的p值值为为0.5664,所所以以在在95%的的置置信信水水平平下下,不不能能拒拒绝绝原原假假设设

61、。即即该该地地区区2004年年底底与与年年中私家购车价格在中私家购车价格在15万元以上者所占比例无明显差异。万元以上者所占比例无明显差异。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n3.4 3.4 总体方差的区间估计与假设检验的总体方差的区间估计与假设检验的SASSAS实现实现n3.4.1 总体方差的置信区间总体方差的置信区间n3.4.2 单样本总体方差的假设检验单样本总体方差的假设检验n3.4.3 两样本总体方差的比较两样本总体方差的比较区间估计与假设检验课件STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.4.1 总体

62、方差的置信区间总体方差的置信区间【例例3-13】表表3-15所所示示为为某某中中学学1980年年模模拟拟高高考考数数学学的的部分学生成绩,试估计本次模拟考试成绩的方差。部分学生成绩,试估计本次模拟考试成绩的方差。表3-15 部分学生成绩 假假定定表表3-15数数据据存存放放在在数数据据集集Mylib.kscj中中,成成绩绩变变量名为量名为score。分析步骤如下:。分析步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.kscj;2)选选择择菜菜单单“Statistics(统统计计)”“Hypothesis Tests(假假 设设 检检 验验)”“One Sample Tes

63、t for a Variance(方差的单样本检验)(方差的单样本检验)”;100969690921001009099921009810097979594100STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3)在在打打开开的的“One Sample Test for a Variance”对对话话框框中设置方差的置信区间(如图中设置方差的置信区间(如图3-26)。)。分析结果中包括方差的置信区间估计,如图分析结果中包括方差的置信区间估计,如图3-27所示。所示。结结果果表表明明,本本次次模模拟拟考考试试成成绩绩方方差差在在置置信信水水平平95%下下的置信区间

64、为的置信区间为(7.1692,28.614)。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.4.2 单样本总体方差的假设检验单样本总体方差的假设检验【例例3-14】考考虑虑例例3-13中中的的模模拟拟考考试试成成绩绩,检检验验考考试试成成绩是否太集中。绩是否太集中。这这是是一一个个单单样样本本方方差差检检验验问问题题,若若 表表示示总总体体方方差差,则检验的是:则检验的是:H0:2 52,H1:2 52;步骤如下:步骤如下:1)选选 择择 菜菜 单单“Statistics”“Hypothesis Tests”“One Sample Test for a V

65、ariance(单单样样本本方方差差检检验验)”,打打开开“One Sample Test for a Variance”对对话话框并按图设置;框并按图设置;2)单击单击“OK”按钮,得到结果。按钮,得到结果。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程结结果果(图图左左)显显示示,样样本本方方差差为为12.732,由由于于 2检检验验的的p值值=0.9504,所以不能拒绝方差,所以不能拒绝方差 25的原假设。的原假设。结结果果表表明明有有95%的的把把握握可可以以认认为为该该模模拟拟考考试试的的成成绩绩太太过集中。过集中。STATSTATSTATSTATS

66、ASSAS软件与统计应用教程软件与统计应用教程3.4.3 两样本总体方差的比较两样本总体方差的比较【例例3-15】已已知知两两只只股股票票深深发发展展(000001)和和万万科科A(000002)在在2004年年6月月21个个交交易易日日的的收收益益率率如如表表3-16所所示示。试试在在0.05的的显显著著水水平平下下判判断断深深发发展展的的风风险险是是否否高高于万科于万科A?表3-16 深发展和万科A在2004年6月21个交易日的收益率day深发展万科Aday深发展万科Aday深发展万科A0.00310.0099-0.00220.0041-0.00220.01310.0301-0.013700.0020.00330.028-0.0231-0.0139-0.0209-0.0123-0.0066-0.0147-0.00820.0060.04610.0186-0.01440.0085-0.0228-0.008-0.0097-0.002-0.0056-0.0127-0.02230.002-0.0228-0.0428-0.05190.0043-0.0109-0.02020.0111-0.025

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!