第4章 参数估计和假设检验

上传人:feng****heng 文档编号:177603588 上传时间:2022-12-26 格式:DOCX 页数:18 大小:297.08KB
收藏 版权申诉 举报 下载
第4章 参数估计和假设检验_第1页
第1页 / 共18页
第4章 参数估计和假设检验_第2页
第2页 / 共18页
第4章 参数估计和假设检验_第3页
第3页 / 共18页
资源描述:

《第4章 参数估计和假设检验》由会员分享,可在线阅读,更多相关《第4章 参数估计和假设检验(18页珍藏版)》请在装配图网上搜索。

1、第四章参数估计与假设检验掌握参数估计和假设检验的基本思想是正确理解和应用其他统计推断方法的基础,后面 将要学习的方差分析、非参数检验、回归分析、时间序列等统计推断方法都是在此基础上展 开的。需要特别指出的是,所有的统计推断都要以随机样本为基础。如果样本是非随机的, 统计推断方法就不适用了。由于相关知识在先修课程中已经学习过,本章主要在回顾相关知识的基础上,补充讲解 必要样本容量的计算、p值、参数估计和假设检验方法的软件操作和结果分析等内容。本章的主要内容包括:(1)参数估计的基本思想和软件实现。(2)简单随机抽样情况下样本容量的计算。(3)假设检验的基本原理。(4)假设检验中的 p 值。(5)

2、几种常用假设检验的软件实现。第一节 参数估计一、参数估计的基本概念参数估计是指利用样本信息对总体数字特征作出的估计。例如,我们可以通过估计一部 分产品的合格率对整批产品的合格率作出估计,通过调查一个样本的人口数来对全国的人口 数作出估计,等等。参数估计可以分为点估计和区间估计。点估计是指根据样本数据给出的总体未知参数的一个估计值。对总体参数进行估计的方 法可以有多种,例如矩估计法、极大似然估计法等,得到的估计量(样本统计量)并不是唯 一的。例如我们可以使用样本均值对总体均值作出估计,也可以使用样本中位数对总体均值 进行估计。因此,在参数估计中我们需要对估计量的好坏作出评价,这就涉及到估计量的评

3、 价准则问题。常用的估计量评价准则包括无偏性、有效性、一致性等。无偏性是指估计量的 数学期望与总体参数的真实值相等;有效性的含义是,在两个无偏估计量中方差较小的估计 量较为有效,方差越小越有效;一致性是指随着样本容量的增大,估计量的取值应该越来越 接近总体参数。样本的随机性决定了估计结果的随机性。由于每一个点估计值都来自于一个随机样本, 所以总体参数真值刚好等于一个具体估计值的可能性极小。区间估计的方法则以概率论为基 础,在点估计的基础上给出了一个置信区间,并给出了这一区间包含总体真值的概率,比点 估计提供了更多的信息。置信区间是根据事先确定的置信度1-a给出的总体参数的一个估计 范围。由于所

4、研究的问题不同,区间估计中使用的计算公式也有所不同。在区间估计中,置信度为100(1-)%的含义是:在同样的方法得到的所有置信区间中, 有100(1-的区间包含总体参数的真实值。也可以说,对于计算得到的一个具体区间“这 个区间包含总体真实值”这一结论有100(1-%的可能是正确的。但是说“总体参数有 100(1-0)%的概率落入某一区间”是不严格的,因为总体参数是非随机的。二、抽样分布1. 抽样分布的概念抽样分布(Sampling Distribution)是指统计量的概率分布,是区间估计和假设检验的基 本依据。从总体中抽取一个样本量为n的随机样本,我们可以计算出统计量的一个值;如果 从总体中

5、重复抽取样本量为n的样本,就可以得到统计量的多个值。统计量的抽样分布就是 这一统计量所有可能值的概率分布。注意抽样分布是统计量的分布而不是总体或样本的分布。在统计推断中总体的分布一般 是未知的,不可观测的(但常常被假设为正态分布);样本数据的统计分布是可以直接观测 的,最直观的方式是直方图,样本数据的统计分布可以用来对总体分布进行检验;抽样分布 则一般利用概率统计的理论推导得出,在应用中也是不能直接观测的,其形状和参数可能完 全不同于总体或样本数据的分布。2. 样本均值的抽样分布 下面我们用一个假设的例子来说明抽样分布的含义。设一个总体含有4 个个体,分别为为X为(X 卩)2X=l、X2=2、

6、X3=3、X4=4。则显然有总体的均值卩=f = 2.5 ;方差Q 2 = f= 1.25。1 2 3 4 N N 总体的频数分布如图 4-l。现从总体中抽取容量n=2的简单随机样本,在重复抽样条件下,共有42=16个可能样 本。所有的可能样本如表4-1,各样本的均值如表4-2,样本均值的频数分布(抽样分布) 如图4-2。从图4-1 和图4-2我可以看出,在这个例子中样本均值的抽样分布和总体的分布 是有很大差异的。&根据表4-2中的数据,16个样本均值的算术平均数卩- =pl = 1.0 +1.5 +人+ 4.0 = 2.5 ; x M 16(x -卩一)2方差G2 = 亠=(1. 2.5)2

7、 +A +(4. 2.5)2 = 0.625。容易验证,在这里样本均值抽x M 16样分布的均值等于总体的均值,方差等于总体方差的1/n。表4-1重复抽样条件下所有可能的n =2的样本(共16个)第一个观察值第二个观察值123411,11,21,31,422,12,22,32,433,13,23,33,444,14,24,34,4表4-2 16个样本的样本均值第一个观察值第二个观察值123411.01.52.02.521.52.02.53.0图 4-2 样本均值的抽样分布32.02.53.03.542.53.03.54.0一般的,关于样本均值的抽样分布有以下结论:当总体服从N,胆)时,来自该总

8、体的 容量为n的样本的均值X也服从正态分布,X的期望为,方差为呪/n。即XN,呪加)。正态分布是一种对称的钟形分布,两个参数R和o共同决定了正态曲线的形状:参数卩 决定了分布的中心位置,参数b决定了曲线的陡峭程度(图4-3)。图4-3参数卩和b对正态分布曲线形状的影响 当总体的分布不是正态分布时,样本均值抽样分布的形状如何呢?中心极限定理表明 从均值为“,方差为呪的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的 抽样分布近似服从均值为“、方差为oi/n的正态分布。在应用中习惯上认为n30时就可以 认为是大样本了。在统计学中,统计量的标准差被称为标准误(Standard Error)

9、。简单随机抽样、重复抽 样时,样本均值的标准误等于。这个指标在统计推断中经常用到,在对变量进行描述 统计时统计软件一般会输出这一结果。如果在简单随机抽样中采用的是不重复的方法,则样本均值抽样分布的方差略小于重复 抽样的方差,等于2 - N n。式中N n这一系数称为有限总体校正系数(Finite Population n N 1N 1Correction Factor)。在实际应用中,当抽样比n/Nv0.05时可以忽略有限总体校正系数。3. 统计推断中常用的概率分布除了正态分布以外,在参数估计和假设检验中经常用到的概率分布还包括t分布、F分 布、X 2分布等等。在根据样本比例对总体比例进行推断

10、时也经常使用正态分布。用p表示样本比例,n表示总体比例,则当np5、n(l-p)25时,在简单随机抽样的情况下样本比例近似服从以下正态分布:在重复抽样时pN“,亘匕巴、I n丿在不重复抽样时p ,牛-记丿t 分布的形状在根据样本均值推断总体均值时,在总体方差未知的情况下需要使用样本方差 s2 来估计总体方差b 2,这时统计推断中需要使用t分布:随机变量 V 服从自由度为n-1的t分 s hin布。t分布是类似于标准正态分布的一种对称分布,有一个称为自由度的参数,随着自由度 的增大t分布会逐渐趋于标准正态分布(如图4-4)。在大样本的情况下t分布可以使用标准 正态分布代替。图 4-4在对总体方差

11、的推断和非参数检验中,相关检验统计量服从X 2分布。X 2分布的自由度n 决定了该分布的形状。该分布的变量值为正值,形状通常为不对称的右偏分布,但随着自 由度的增大逐渐趋于对称(图4-5)。在对两个总体方差的推断、方差分析和回归分析中,还要用到F分布。F分布是由统计 学家费希尔(R. A. Fisher)提出的,其形状由两个自由度参数n1和n2决定(图4-6)。F分 布的变量值也大于 0,为右偏分布。三、总体均值和比例的区间估计和软件实现1. 单个总体均值的区间估计 如前所述,在总体正态、方差已知,或者总体分布未知,但为大样本的情况下,样本均 值的抽样分布是正态分布或者可以用正态分布近似。设给

12、定的置信度为1,在重复抽样的 情况下我们有:P”=”Z血=1 -a,从而可以得出总体均值卩的100(1-a) %的置信区 间为:4-1)X 土 42(n - 1)s在不重复抽样的情况下,我们有。x弋加在实际应用中,总体方差一般是未知的,需要用样本方差来估计。在这种情况下需要按 照t分布来计算置信区间,见式(4-2)。在手工计算的情况下,大样本时公式中的t值可以 用z值来近似;使用统计软件进行计算时都是按照t值来计算的。( 4-2)式(4-1)和式(4-2)需要做如下的修改:X 土 Z :iN-na 2 寸n、N 1X 士 ta 2(n 1)s 、N -n、.:n N 14-3)4-4)2. 总

13、体比例的区间估计当np三5、n(1-p)25时,根据样本比例的抽样分布可知,重复抽样时总体比例的置信区 间为式( 4-5 ),不重复抽样时总体比例的置信区间为式( 4-6):(4-5)(4-6)丄P(1 P):N nP 士 Za 2N1下面我们来看一个用 SPSS 计算置信区间的例子。【例 4. 1 】儿童电视节目的赞助商希望了解儿童每周看电视的时间。表4-3是对1 00名 儿童进行随机调查的结果(数据文件:看电视时间.sav)(1)计算平均看电视时间95% 的置信区间; (2)计算每周看电视时间大于30小时的儿童比例的95%的置信区间。表4-3100名儿童每周看电视的时间(小时)39.719

14、.534.727.041.315.120.531.318.317.021.529.915.016.436.823.424.128.923.424.440.646.423.639.435.519.529.331.220.634.915.531.638.938.727.226.514.715.628.424.043.920.629.19.521.042.413.932.829.832.933.038.028.720.619.738.637.117.015.123.421.021.829.321.322.823.432.511.343.830.815.823.220.333.530.037.824.

15、426.929.027.727.122.036.123.022.126.522.926.930.225.223.835.321.635.730.822.724.521.926.550.3解:(1)在SPSS软件中依次选择“分析” 9 “描述统计” 9 “探索”,对“时间” 变量进行描述统计分析,可以得到表 4-4。从表中可以直接得到 95%的置信区间为25.53, 28.85。表4-4 SPSS输出的“时间”变量的部分描述统计结果统计量标准误时间均值均值的95%置信区间 下限 上限峰度27.19125.53028.852-.278.8373.478(2)为了计算每周看电视时间大于30小时的儿童

16、比例及其95%的置信区间,我们先 在SPSS中生成一个取值为0或1的变量,每周看电视时间大于30小时时取值为1,否则取 值为 0。具体操作为:选择“转换” 9“计算变量”,在对话框中按照图4-7 进行设置,即 可生成名称为“大于 30”的新变量。对这个变量使用“探索”模块进行描述统计分析,结 果如表 4-5。根据表4-5,样本中每周看电视时间大于30小时的儿童比例为33%。由于样本量n=100, 显然满足np三5、n(1-p)25的条件,因此可以按照正态分布来计算比例的置信区间。表4-5 给出比例的95%的置信区间为0.2362, 0.4238。需要注意的是,在实际应用中,如果在计算置信区间时

17、需要考虑有限总体校正系数,则 需要根据软件的描述统计结果,按照式(4-3)、式(4-4)或者式(4-6)进行手工计算,软 件不能直接提供最终的计算结果。表4-5 SPSS输出的“大于30 ”变量的部分描述统计结果统计量标准误大于30均值均值的95%置信区间 下限 上限峰度.3300.2362.4238-1.491.04726.478因券姐tlgg-Iii 11 畝消 I ; Wii计僚曼呆(FTi&K-T-SAKtffJI站B-CCT耳斗中心CUF HP.当屯日理彌冋00 CZE ii J0冋冋丨癥图 4-7 在 SPSS 中计算新变量四、样本容量的计算很显然,在抽样调查中样本容量越大抽样误差

18、越小。由于调查成本方面的原因,在调查 中我们总是希望抽取满足误差要求的最小的样本容量。下面我们根据置信区间的相关知识来 看一下必要样本容量的计算问题。1. 关于抽样误差的几个概念(1)实际抽样误差样本估计值与总体真实值之间的绝对离差称为实际抽样误差,用公式I。-9 I表示。由于 在实践中总体参数的真实值是未知的,因此实际抽样误差是不可知的;由于样本估计值随样 本而变化,因此实际抽样误差是一个随机变量。(2)抽样平均误差抽样平均误差反映了所有可能样本的估计值)与相应总体参数(。)的平均误差程 度。计算公式为:GfE (0-9 )2(4-7)9,不重复抽样条件下有式(4-7)实际上就是统计量。抽样

19、分布的标准差,也就是一般所说的标准误(StandardError) 。例如在简单随机抽样时,重复抽样条件下有G N n厂爲飞N 1我们通常所说的“抽样调查中可以对抽样误差进行控制”,就是指的抽样平均误差。影响抽样误差的因素包括:总体内部的差异程度,样本容量的大小,以及抽样的方式方法。(3)最大允许误差(Allowable Error)在参数估计中,我们一方面希望误差小一些,误差越小,估计的精确程度就越高;另一 方面误差也不是越小越好,误差越小需要的样本量就越大,费用就越高。因此,需要确定- 个允许的误差范围,这种在一定概率下抽样误差的允许范围,即为最大允许误差,也称为抽 样极限误差。我们用E来

20、表示最大允许误差,则有|X- E,从而有X - E r X + E。可 见,最大允许误差就是计算置信区间时样本均值(或样本比例)加减的量。置信区间和最大 允许误差之间的关系是:置信区间=X土E。最大允许误差是人为确定的,是调查可以容忍的 误差水平。2. 样本容量的计算(1)必要样本容量的影响因素 总体标准差。总体的变异程度越大,必要样本容量也就越大。 最大允许误差。最大允许误差越大,需要的样本容量越小。 置信度1。要求的置信度越高,需要的样本容量越大。 抽样方式。其它条件相同,在重复抽样、不重复抽样;简单随机抽样与分层抽样等 不同抽样方式下要求的必要样本容量也不同。(2)简单随机抽样、重复抽样

21、情况下,估计总体均值和估计总体比例时样本容量的确 定方法根据前面的分析,在简单随机抽样、重复抽样条件下,在估计总体均值时有E =纭2汐(4-8)从而有E 2I在估计估计总体比例时有E = Z:旦上心,从而有:/2片nZ 2冗(1 冗)n =(4-9)式中的总体方差可以通过以下方式估计:根据历史资料确定;通过试验性调查估计。g E 2式中的总体比例兀可以通过以下方式估计:根据历史资料确定;通过试验性调查估计; 取为0.5。这是因为兀=0.5时兀(1-兀)取得最大值。(3)简单随机抽样、不重复抽样情况下,估计总体均值和估计总体比例时样本容量的 确定方法在不重复抽样时的必要样本容量要比重复抽样小一些

22、。用n0表示重复抽样时的样本容 量,则不重复抽样时的必要样本容量如式(4-10)所示:(4-10)F面我们来看几个例子。【例4.2】需要多大规模的样本才能在90%的置信水平上保证均值的误差在5之内?前期研究表明总体标准差为45。解:Z 2b 21.6452(45)252=219.2 Q 220注意在最后取整数时不是四舍五入,而是向上取整,这样才能保证满足对允许误差的要 求。【例4.3】一家市场调研公司想估计某地区有电脑的家庭所占的比例。该公司希望对比 例兀的估计误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的 兀估计值)?解:已知E=0.05, 0=0.05, Z/

23、2=1.96,由于没有可利用的兀的信息,我们将其取为0.5。n = 萤(1一兀)=(1.96)2(0.5)(1-0.5) = 384.16,因此需要抽取385户居民进行调查。 E2(0.05)2【例 4.4】假设在【例4.3】采用的是不重复抽样,并且已知该地区共有1000 户居民 则应抽多大容量的样本?解:0384.16384.16二277.54,因此需要抽取278户居民进行调查。1000第二节 假设检验一、假设检验的基本原理假设检验是事先作出关于总体参数、分布形式、相互关系等的命题,然后通过样本信息 来判断该命题是否成立的统计方法。假设检验有着非常广泛的应用,可以说是最重要的推断统计方法。例

24、如可以根据样本数 据对以下各类问题进行检验:产品生产线工作是否正常?某种新生产方法是否会降低产品成 本?治疗某疾病的新药是否比旧药疗效更高?厂商声称产品质量符合标准,是否可信?等 等。1. 假设检验的基本原理 假设检验的基本原理是:小概率事件在一次试验中几乎不会发生。如果对总体的某种假 设是真实的(例如产品合格率95%),那么不利于或不能支持这一假设的事件A (小概率 事件,例如抽样合格率=55%)在一次试验中几乎不可能发生的;要是在一次试验中A竟然 发生了(抽样合格率=55%),就有理由怀疑该假设的真实性,拒绝提出的假设。假设检验采用的是反证法的思想,从假设条件出发,如果能够推导出一个矛盾的

25、结论, 就可以证明假设条件不成立。2. 假设检验中的基本概念(1)假设检验的步骤假设检验一般可以分为以下几个步骤:根据实际问题提出一对假设(零假设和备择假 设);构造某个适当的检验统计量,并确定其在零假设成立时的分布;根据观测的样本计算 检验统计量的值;根据指定的显著性水平确定检验统计量的临界值并进而给出拒绝域;根据 决策规则得出拒绝或不能拒绝零假设的结论。注意这里“不能拒绝零假设”不同于“接受零假设”。“不能拒绝零假设”只是说明根 据现有样本不能认为零假设有问题,但重新抽取一个样本就有可能推翻零假设。如果说成“接 受零假设”,就等于说你认为零假设在任何条件下都是成立的。(2)零假设和备择假设

26、的选择在假设检验中零假设和备择假设是互斥的,等号必须出现在零假设中;最常用的有三种 情况:双侧检验、左侧检验和右侧检验。以单个总体均值的假设检验为例,零假设和备择假 设的三种情况如表 4-6。表4-6零假设和备择假设的三种情况双侧检验左侧检验右侧检验H。P=oMoMo卩丰MoM Mo单侧检验一般根据以下几个原则设置零假设和备择假设:把研究者要证明的假设作为备 择假设;将所作出的声明作为零假设;把现状(Status Quo)作为零假设;把不能轻易否定 的假设作为零假设。在单侧检验中,零假设和备择假设设置不同,有可能得出不同的结论。对于一个实际问 题,究竟将哪个假设作为零假设不是可以随意选择的,而

27、要遵循一定的原则:零假设通常是 指观测结果表现出的差异仅是由随机因素引起,不是由于某种结构性原因引起,备择假设则 相反,认为观测到的差异是由于某种原因造成的,不仅仅是随机差异;很多问题往往将研究 者要证明的结论放在备择假设,这样如果通过假设检验作出拒绝零假设选择备择假设的判 断,会使得我们要证明的结论更具有说服力。例如,某种汽车原来平均每加仑汽油可以行驶24 英里。研究小组提出了一种新工艺来 提高每加仑汽油的行驶里程。为了检验新的工艺是否有效,需要生产一些产品进行测试。这 里要证明的结论是卩24,因此零假设和备择假设的选择为:Ho : 8,纠:卩8。(3)检验统计量和拒绝域 我们决策时所依据的

28、样本统计量称为检验统计量。检验统计量所有可能的取值集合可分成两个不相交的部分,可以拒绝零假设的检验统计量取值的集合称为拒绝域;不能拒绝零假 设的检验统计量取值的集合称为接受域;划分拒绝域和接受域的数值称为临界值。一旦有了 样本,计算检验统计量的观测值,就可以根据规则决定是否拒绝零假设。(4)假设检验中的两类错误 在假设检验中可能出现两类错误,如表4-7。在零假设正确的情况下我们作出拒绝零假设的判断,这时发生的错误称为第一类错误(拒真错误);相反地,在零假设错误的情况下 我们作出接受零假设的判断,这种错误称为第二类错误(取伪错误)。表4-7假设检验中的两类错误决策实际情况H0为真H0为假接受H0

29、正确第二类错误拒绝H0第一类错误正确在假设检验中这两类错误是不可避免的。通常来说要减小其中的一种错误,只能通过增 加另一种错误的方法实现。在假设检验中通常的做法是控制犯第一类错误的概率不超过某个 水平在满足该条件的前提下使犯第二类错误的概率尽量小。允许犯第一类错误的概率a称为显著性水平,通常a取为0.01,0.05,0.1。根据o可以确 定检验统计量的临界值,从而进一步得出检验结论。二、假设检验中的 p 值在计算机和统计软件得到广泛应用之前,假设检验的决策规则一般是根据检验统计量的 临界值给出的:当根据样本计算出的检验统计量的观测值落到拒绝域时拒绝零假设。传统方 法的不足之处是,检验统计量的临

30、界值一般需要根据给定的显著性水平查表得出,在实际应 用中不够方便,如果显著性水平有所变化,还需要重新查表得到新的临界值。在统计软件中最常用的假设检验方法是根据检验统计量的观测值计鑰值,然后将p值与 Q比较得出检验结论,当p值小于u时拒绝零假设。简单的说,p值是在零假设成立的条件下, 出现检验统计量的样本观测结果或更极端结果的概率,也称为观测到的显著性水平,是能拒 绝H0的a的最小值。p值几乎不可能通过手工方式来计算,但在统计软件中它的计算非常容 易。根据p值进行假设检验与传统的根据临界值的检验方法完全等价,但由于使用p值更方便, 因而在实际应用中这种方法已经取代了根据临界值进行检验的方法。根据

31、p值进行假设检验时,决策规则是不变的:p值小于a时拒绝H。,但p值的计算方法 与检验的种类(双侧检验、左侧检验还是右侧检验)以及分布的类型有关。对于t分布,用 tobs表示t统计量的观测值,双侧检验时p值=P(ltl2ltobsl);右侧检验时p值=P(t2tobs);左侧检验 时;值=P(tWtbs)。正态分布时p值的计算与t分布类似,只是将t统计量换成z统计量。p值的含义可以用以下三个图形来说明。假设t统计量的样本观测值等于2,在双侧检验 时的p值等于右侧阴影面积的两倍,如图4-8所示;右侧检验时的p值等于右侧的阴影面积,如图4-9所示;左侧检验时的p值等于观测值左侧的阴影面积,如图4-1

32、0所示。3 2 1 1 2 3图4-8 tobs=2,双侧检验时的p值等于阴影部分的面积3 2 1 1 2 3图4-9 tobs=2,右侧检验时的p值等于阴影部分的面积3 2 1 1 2 3图4-10 tobs=2,左侧检验时的p值等于阴影部分的面积三、几种常用假设检验方法的软件实现和结果分析接下来我们来看三种常用的假设检验的软件实现和结果分析:单个总体均值的t检验, 基于两个独立样本的t检验,以及基于两个匹配样本的t检验。1.单样本t检验 根据单个样对总体均值进行假设检验,要求是大样本或者总体服从正态分布,如果不满 足条件则需要使用非参数检验方法。由于应用中一般需要根据样本方差估计总体方差,

33、因此 实际中都是根据t统计量进行检验。【例4.5】使用数据文件“学生调查.sav”,以5%的显著性水平检验能否认为总体中学 生的平均体重等于60公斤。解:在SPSS中打开相应的数据文件,选择“分析”9 “比较均值”弓“单样本t检验”, 在弹出的对话框中将体重变量作为检验变量,检验值框中填入60,其余使用系统默认值,输 出结果如表4-8。表4-8单样本t检验检验值=60tdfSig.(双侧)均值差值差分的95%置信区间下限上限体重-1.87234.070-3.057-6.38.26根据题目的要求,这里应采用双侧检验,零假设和备择假设为:H屮二60分H屮工60。01表4-8中给出的Sig.(双侧)

34、就是双侧检验时的p值。这里p值=0.07,大于0.05,因此检验的结 论是不能拒绝总体均值等于60的零假设。图4-11显示了本题中p值和u的大小关系,图中深色 阴影部分的面积为浅色阴影的面积为p值。-5-4-3-2-1012345图4-11双侧检验时p值和a的大小关系在这个题目中如果希望证明的是总体均值大于60,则是一个右侧检验的问题,零假设和 备择假设为:H屮60分H屮60。这时SPSS软件的输出结果保持不变,但p值和d的大 01小关系如图4-12所示,由于p值大于d因此检验的结论是不能拒绝零假设。而如果我们希望证明的是总体均值小于60,则是一个左侧检验的问题,零假设和备择假 设为:H :6

35、0分H屮 60。这时SPSS软件的输出结果仍然保持不变,但p值和d的大小01关系如图4-13所示,由于p值小于d因此检验的结论是拒绝零假设。图4T2右侧检验时p值和 的大小关系图4T3左侧检验时p值和 的大小关系2.两个独立样本的脸验两个独立样本的t检验需要首先判断两个样本数据是否是大样本或者来自正态总体,如 果不满足条件则需要使用非参数检验方法。然后,在正态分布或大样本时,需要检验两个总 体的方差是否相等(F检验);方差相等时采用等方差的t检验,方差不相等时采用不等方 差的t检验。与一个总体的情况类似,两个总体均值假设检验中也可以进行单侧或双侧检验。两个总 体均值假设检验中的备择假设也可以有

36、以下三种情况:H :; H :; H :。1 1 2 1 1 2 1 1 2 下面我们来看使用SPSS进行独立样本t检验的过程。【例4.6】使用数据文件“学生调查.sa”,用SPSS检验在5%的显著性水平下男女生的 平均身高是否相等,假设身高服从正态分布。选择“分析”“比较均值”“独立样本t佥验”,弹出的对话框如图4-14。把身高变量作为检验变量,性别作为分组变量。然后单击“定义组”按钮来设置分组规则,这里在 两个矩形框中分别输入0和1,单击“继续”返回主对话框,单击“确定”就可以了。输出结 果如表4-9。图4-14独立样本t检验的相关设置表4-9 SPSS两个独立样本均值t检验的输出结果方差

37、是否相等的Levene检验均值是否相等的t检验差分95%置信区 间FSig.tdfSig.(双 侧)均值差 值标准误差值下限上限身假设方差相等 咼假设方差不相等4.195.0497.8457.4493321.459.000.00010.20710.2071.3011.3707.5607.36112.85413.053注意表4-9中包含了等方差的检验、等方差时的t检验以及异方差时的t检验结果。读这个 表时先看等方差的检验的结果(数据的前两栏),这里SPSS使用的是Levene检验,这种检 验不需要正态性的假设条件,比F检验更稳健。如果Levene检验的p值小于显著性水平(如 5%),则认为总体是

38、异方差的,接下来在t检验中要使用方差不等时的检验结果;如果方差 检验中认为两个总体是等方差的,则在t检验中使用方差相等时的检验结果。在这个例子中, 方差检验的p值等于0.0490.05,因此拒绝方差相等的原假设,认为男女生身咼的方差不等。 接下来的t检验中使用方差不等的检验结果(下面的一行),检验的4直保留三位小数时等于 0.000,小于常用的 值,因此认为总体中男女生的身高均值不相等。3. 匹配样本的t检验如果两个样本中的数据有一一对应的关系,也就是说属于匹配样本(paired-sample),由 此对两个总体的均值进行假设检验时,需要先将两个样本的对应数据相减,得到一个新的变 量d然后对新

39、的变量d应用单个样本的t检验。匹配样本的t检验中需要变量d服从正态 分布,或者是大样本,否则需要使用非参数的检验方法。【例4.7】随机选择了 8名肥胖儿童试验一种减肥方案,减肥前后的体重如表4-10。根 据实验结果,在5%的显著性水平下能否认为减肥方案有效?表4-10 一种减肥方案的试验数据减肥前4555544856536249减肥后4348504750475946解:把数据输入SPSS数据表,选择“分析”弓“比较均值”弓“配对样本t检验”,在 弹出的对话框中将两个变量作为一组数据选为分析变量,相关设置见图4-15,输出结果如表 4-11。图4-15匹配样本t检验的相关设置表4-11成对样本t

40、检验的输出结果成对差分tdfSig.(双侧)均值标准差均值的标准误差分的95%置信区间下限上限对1减肥前-减肥后4.000002.13809.755932.212515.787495.2927.001根据本题的题意,将假设检验的零假设设为卩-卩 0,备择假设设为卩-卩 0。如 1 2 1 2 果拒绝零假设则说明减肥方案有效。根据表4-11,检验的t统计量等于5.292,双侧检验的p值为0.01,因此右侧检验的p值为 0.01/2=0.005。在5%的显著性水平下显然应拒绝零假设,结论是减肥方案有效。小结参数估计和假设检验是根据随机样本的信息对总体进行统计推断的两类基本方法,有着 广泛的应用。由

41、于相关知识在先修课程中已经学习过,本章主要在回顾相关知识的基础上, 补充讲解必要样本容量的计算、P值、参数估计和假设检验方法的软件操作和结果分析等内 容。抽样分布是指统计量的概率分布,是区间估计和假设检验的基本依据。抽样分布则一般 利用概率统计的理论推导得出,在应用中也是不能直接观测的,其形状和参数可能完全不同 于总体或样本数据的分布。参数估计是指利用样本信息对总体数字特征作出的估计。在SPSS软件中可以直接给出简单随机抽样、有放回条件下按照t统计量计算的置信区间。在SPSS软件中进行假设检验时 也会输出相应的置信区间。样本容量的确定受到多方面因素的影响,具体的确定方法会因为抽样方法的不同而不

42、 同,本章给出了简单随机抽样情况下的样本量的计算方法。不重复抽样时的必要样本容量要 小于重复抽样的情况。假设检验是确定根据样本观测数据能否拒绝关于总体的某种陈述的统计方法。假设检验 的基本原理是:小概率事件在一次试验中不可能发生。在双侧检验和单侧检验中假设检验的零假设和备择假设的设置方法有所不同。具体问题 不同,假设检验中的检验统计量也可能不同。主要有Z统计量,t统计量,咒2统计量和F统计在统计软件中一般根据检验统计量的样本观测值计算出一个概率值提供给用户,由用户 根据实际情况(单侧还是双侧检验等)确定3值的大小,然后根据p值和Q的大小关系得出检 验结论。p值是零假设成立时,出现检验统计量的样

43、本观测结果或更极端结果的概率。p值越 小,说明结果越不可能发生,拒绝零假设的证据就越强。在大部分情况下SPSS软件提供的 sig.值就是需要的p值,但在单侧检验时的p值需要根据sig.值进行推算。本章介绍了三种常用假设检验的软件实现和结果分析:单个总体均值的t检验,基于两 个独立样本的t检验,以及基于两个匹配样本的t检验。思考与练习1. 怎样确定假设检验问题的零假设和备择假设?2. 什么是抽样分布?常用的抽样分布有哪些?3. 假设检验有哪些步骤?4. 单侧和双侧假设检验问题的拒绝域有何区别?5. 怎样理解假设检验问题的p值?如何根据p值和显著性水平的关系得出检验结论?6. 根据表4-3对100

44、名儿童随机调查的结果(数据文件:看电视时间sav),能否认为(1)该地区儿童平均看电视的时间等于25.5小时?(2)该地区儿童平均看电视的时间小于25.5 小时?(3)该地区儿童平均看电视的时间大于25.5 小时?7. 一培训机构拟在会计学和管理学之间选择一门专业进行培训,在确定培训专业之前 在当地进行了一项薪水调查。分别从两个专业的大学毕生中抽取10 个人调查他们的年薪, 结果得到数据如表 4-12。假设总体服从正态分布,把数据整理成两个变量(专业、收入) 的形式,使用统计软件检验在5%的显著性水平下检验总体中两个专业的平均年薪有无显著 差异。表 4-12 两个专业大学毕业生的年薪(单位: 万元)会计4.63.84.25.05.54.88.06.26.73.2管理4.56.94.09.03.66.35.07.93.52.48. 某市场研究公司调查了10 个人在广告播出前后的购买潜力等级分值,分数越高说明 购买潜力越高。试检验广告是否有明显效果?假设两个总体服从正态分布,显著性水平 =0.05。表4-1310个人在广告播出前后的购买潜力等级分值个体12345678910广告后6674397656广告前5473585646

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!