人大版贾俊平第五版统计学第8章假设检验.ppt
《人大版贾俊平第五版统计学第8章假设检验.ppt》由会员分享,可在线阅读,更多相关《人大版贾俊平第五版统计学第8章假设检验.ppt(93页珍藏版)》请在装配图网上搜索。
第8章假设检验 假设检验在统计方法中的地位 什么是假设 对总体参数的一种看法总体参数包括总体均值 比例 方差等分析之前必需陈述 我认为该企业生产的零件的平均长度为4厘米 什么是假设检验 概念事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立类型参数假设检验非参数假设检验特点采用逻辑上的反证法依据统计上的小概率原理 假设检验的基本思想 因此我们拒绝假设 50 样本均值 m 50 抽样分布 H0 假设检验的过程 提出假设 抽取样本 作出决策 8 1假设检验的基本问题 8 1 1假设问题的提出由统计资料得知 1989年某地新生儿的平均体重为3190克 现从1990年新生儿中随机抽取100个 测得平均体重为3210克 问1990年的新生儿与1989年相比 体重有无显著差异 8 1 2假设的表达式 原假设 NullHypothesis 1 待检验的假设 又称 0假设 2 总是有等号 或 3 表示为H0H0 某一数值指定为 号 或 或 例如 H0 3190 克 为什么叫0假设 备择假设 AlternativeHypothesis 1 与原假设对立的假设2 总是有不等号 或 3 表示为H1H1 某一数值 或 某一数值例如 H1 3190 克 或 3190 克 8 1 3两类错误 H0 无罪 假设检验中的两类错误 决策结果 假设检验就好像一场审判过程 统计检验过程 错误和 错误的关系 8 1 4假设检验的流程提出原假设和备择假设确定适当的检验统计量规定显著性水平 计算检验统计量的值作出统计决策 什么检验统计量 1 用于假设检验问题的统计量2 选择统计量的方法与参数估计相同 需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为 确定适当的检验统计量 规定显著性水平 什么显著性水平 1 是一个概率值2 原假设为真时 拒绝原假设的概率被称为抽样分布的拒绝域3 表示为 常用的 值有0 01 0 05 0 104 由研究者事先确定 作出统计决策 计算检验的统计量根据给定的显著性水平 查表得出相应的临界值Z 或Z 2将检验统计量的值与 水平的临界值进行比较得出接受或拒绝原假设的结论 假设检验中的小概率原理 什么小概率 1 在一次试验中 一个几乎不可能发生的事件发生的概率2 在一次试验中小概率事件一旦发生 我们就有理由拒绝原假设3 小概率由研究者事先确定 8 1 5利用p值进行决策P值 当原假设为真时 所得到的样本观察结果或更极端结果出现的概率如果P值很小 而这种情况又出现了 就有理由拒绝原假设 将P与显著性水平比较 如果P 则拒绝原假设 8 1 6单侧检验 双侧检验与单侧检验 假设的形式 双侧检验 原假设与备择假设的确定 双侧检验属于决策中的假设检验 也就是说 不论是拒绝H0还是接受H0 我们都必需采取相应的行动措施例如 某种零件的尺寸 要求其平均长度为10厘米 大于或小于10厘米均属于不合格建立的原假设与备择假设应为H0 10H1 10 双侧检验 确定假设的步骤 1 例如问题为 检验该企业生产的零件平均长度为4厘米2 步骤从统计角度陈述问题 4 从统计角度提出相反的问题 4 必需互斥和穷尽提出原假设 4 提出备择假设 4 有 符号 提出原假设 H0 4提出备择假设 H1 4 该企业生产的零件平均长度是4厘米吗 属于决策中的假设 双侧检验 例子 双侧检验 显著性水平与拒绝域 双侧检验 显著性水平与拒绝域 双侧检验 显著性水平与拒绝域 单侧检验 原假设与备择假设的确定 检验研究中的假设将所研究的假设作为备择假设H1将认为研究结果是无效的说法或理论作为原假设H0 或者说 把希望 想要 证明的假设作为备择假设先确立备择假设H1 单侧检验 原假设与备择假设的确定 例如 采用新技术生产后 将会使产品的使用寿命明显延长到1500小时以上属于研究中的假设建立的原假设与备择假设应为H0 1500H1 1500例如 改进生产工艺后 会使产品的废品率降低到2 以下属于研究中的假设建立的原假设与备择假设应为H0 2 H1 2 单侧检验 原假设与备择假设的确定 检验某项声明的有效性将所作出的说明 声明 作为原假设对该说明的质疑作为备择假设先确立原假设H0除非我们有证据表明 声明 无效 否则就应认为该 声明 是有效的 单侧检验 原假设与备择假设的确定 例如 某灯泡制造商声称 该企业所生产的灯泡的平均使用寿命在1000小时以上除非样本能提供证据表明使用寿命在1000小时以下 否则就应认为厂商的声称是正确的建立的原假设与备择假设应为H0 1000H1 1000 提出原假设 H0 1000选择备择假设 H1 1000 该批产品的平均使用寿命超过1000小时吗 属于检验声明的有效性 先提出原假设 单侧检验 例子 提出原假设 H0 25选择备择假设 H1 25 学生中经常上网的人数超过25 吗 属于研究中的假设 先提出备择假设 单侧检验 例子 单侧检验 显著性水平与拒绝域 左侧检验 显著性水平与拒绝域 观察到的样本统计量 观察到的样本统计量 左侧检验 显著性水平与拒绝域 右侧检验 显著性水平与拒绝域 右侧检验 显著性水平与拒绝域 8 2一个总体参数的检验 8 2 1检验统计量的确定 大 小 已知 未知 一个总体的检验 8 2 2总体均值的检验1 大样本使用z 统计量 例 某机床厂加工一种零件 根据经验知道 该厂加工零件的椭圆度近似服从正态分布 其总体均值为 0 0 081mm 总体标准差为 0 025 今换一种新机床进行加工 抽取n 200个零件进行检验 得到的椭圆度为0 076mm 试问新机床加工零件的椭圆度的均值与以前有无显著差异 0 05 均值的双尾Z检验 H0 0 081H1 0 081 0 05n 200临界值 s 检验统计量 决策 结论 拒绝H0 有证据表明新机床加工的零件的椭圆度与以前有显著差异 例 某批发商欲从生产厂家购进一批灯泡 根据合同规定 灯泡的使用寿命平均不能低于1000小时 已知灯泡使用寿命服从正态分布 标准差为20小时 在总体中随机抽取100只灯泡 测得样本均值为960小时 批发商是否应该购买这批灯泡 0 05 均值的单尾Z检验 计算结果 H0 1000H1 1000 0 05n 100临界值 s 检验统计量 在 0 05的水平上拒绝H0 有证据表明这批灯泡的使用寿命低于1000小时 决策 结论 2 小样本 已知使用z 统计量 例 根据过去大量资料 某厂生产的灯泡的使用寿命服从正态分布N 1020 1002 现从最近生产的一批产品中随机抽取16只 测得样本平均寿命为1080小时 试在0 05的显著性水平下判断这批产品的使用寿命是否有显著提高 0 05 均值的单尾Z检验 计算结果 H0 1020H1 1020 0 05n 16临界值 s 检验统计量 在 0 05的水平上拒绝H0 有证据表明这批灯泡的使用寿命有显著提高 决策 结论 3 小样本 未知使用t统计量 例 某厂采用自动包装机分装产品 假定每包产品的重量服从正态分布 每包标准重量为1000克 某日随机抽查9包 测得样本平均重量为986克 样本标准差为24克 试问在0 05的显著性水平上 能否认为这天自动包装机工作正常 均值的双尾t检验 计算结果 H0 1000H1 1000 0 05df 9 1 8临界值 s 检验统计量 在 0 05的水平上接受H0 有证据表明这天自动包装机工作正常 决策 结论 例 一个汽车轮胎制造商声称 某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里 对一个由20个轮胎组成的随机样本作了试验 测得平均值为41000公里 标准差为5000公里 已知轮胎寿命的公里数服从正态分布 我们能否根据这些数据作出结论 该制造商的产品同他所说的标准相符 0 05 均值的单尾t检验 计算结果 H0 40000H1 40000 0 05df 20 1 19临界值 s 检验统计量 在 0 05的水平上接受H0 有证据表明轮胎使用寿命显著地大于40000公里 决策 结论 8 2 3总体比例的检验 假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的z统计量 P0为假设的总体比例 一个总体比例的Z检验 实例 例 某研究者估计本市居民家庭的电脑拥有率为30 现随机抽查了200的家庭 其中68个家庭拥有电脑 试问研究者的估计是否可信 0 05 一个样本比例的Z检验 结果 H0 p 0 3H1 p 0 3 0 05n 200临界值 s 检验统计量 在 0 05的水平上接受H0 有证据表明研究者的估计可信 决策 结论 8 2 4总体方差的检验 1 检验一个总体的方差或标准差2 假设总体近似服从正态分布3 原假设为H0 2 024 检验统计量 卡方 2 检验实例 例 根据长期正常生产的资料可知 某厂所产维尼纶的纤度服从正态分布 其方差为0 0025 现从某日产品中随机抽取20根 测得样本方差为0 0042 试判断该日纤度的波动与平日有无显著差异 0 05 卡方 2 检验计算结果 H0 2 0 0025H1 2 0 0025 0 05df 20 1 19临界值 s 统计量 在 0 05的水平上接受H0 有证据表明该日纤度的波动比平时没有显著差异 决策 结论 某公司生产的发动机部件的直径服从正态分布 该公司称它的标准差为厘米 现随机抽取5个部件 测得它们的直径为1 32 1 55 1 36 1 40 1 44问 1 我们能否认为该公司生产的发动机部件的直径的标准差确实为厘米吗 2 我们能否认为 8 3两个总体参数的检验 8 3 1检验统计量的确定 8 3 2两个总体均值之差的检验1 总体标准差已知 1 假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布 可以用正态分布来近似 n1 30和n2 30 2 原假设 H0 1 2 0 备择假设 H1 1 2 0 3 检验统计量为 两个总体均值之差的Z检验 假设的形式 两个总体均值之差的Z检验 例子 例 有两种方法可用于制造某种以抗拉强度为重要特征的产品 根据以往的资料得知 第一种方法生产出的产品其抗拉强度的标准差为8公斤 第二种方法的标准差为10公斤 从两种方法生产的产品中各抽取一个随机样本 样本容量分别为n1 32 n2 40 测得 x2 50公斤 x1 44公斤 问这两种方法生产的产品平均抗拉强度是否有显著差别 0 05 两个总体均值之差的Z检验 计算结果 H0 1 2 0H1 1 2 0 0 05n1 32 n2 40临界值 s 检验统计量 决策 结论 拒绝H0 有证据表明两种方法生产的产品其抗拉强度有显著差异 2 总体标准差未知 1 检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等 12 22检验统计量 其中 两个总体均值之差的t检验 例子 例 一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同 让一个组的10名工人用第一种工艺组装该产品 平均所需时间为26 1分钟 样本标准差为12分钟 另一组8名工人用第二种工艺组装 平均所需时间为17 6分钟 样本标准差为10 5分钟 已知用两种工艺组装产品所用时间服从正态分布 且s12 s22 试问能否认为用第二种方法组装比用第一中方法组装更好 0 05 两个总体均值之差的t检验 计算结果 H0 1 2 0H1 1 2 0 0 05n1 10 n2 8临界值 s 检验统计量 决策 结论 接受H0 没有证据表明用第二种方法组装更好 2 检验统计量 t分布的自由度为 8 3 3两个总体比例之差的检验 1 假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似检验统计量 两个总体比例之差的检验 假设的形式 两个总体比例之差的Z检验 例子 例 对两个大型企业青年工人参加技术培训的情况进行调查 调查结果如下 甲厂 调查60人 18人参加技术培训 乙厂调查40人 14人参加技术培训 能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂 0 05 两个总体比例之差的Z检验 计算结果 H0 P1 P2 0H1 P1 P2 0 0 05n1 60 n2 40临界值 s 检验统计量 决策 结论 接受H0 没有证据表明乙厂工人参加技术培训的人数比例高于甲厂 8 3 4两个总体方差比的检验 8 3 5检验中的匹配样本 两个总体均值之差的检验 配对样本的t检验 1 检验两个相关总体的均值配对或匹配重复测量 前 后 2 假定条件两个总体都服从正态分布如果不服从正态分布 可用正态分布来近似 n1 30 n2 30 配对样本的t检验 假设的形式 注 Di X1i X2i 对第i对观察值 配对样本的t检验 数据形式 配对样本的t检验 检验统计量 样本均值 样本标准差 自由度df nD 1 统计量 例 一个以减肥为主要目标的健美俱乐部声称 参加其训练班至少可以使减肥者平均体重减重8 5公斤以上 为了验证该宣称是否可信 调查人员随机抽取了10名参加者 得到他们的体重记录如下表 配对样本的t检验 例子 在 0 05的显著性水平下 调查结果是否支持该俱乐部的声称 属于检验某项声明的假设 配对样本的t检验 计算表 配对样本的t检验 计算结果 样本均值 样本标准差 H0 m1 m2 8 5H1 m1 m2 8 5a 0 05df 10 1 9临界值 s 检验统计量 决策 结论 接受H0 有证据表明该俱乐部的宣称是可信的 配对样本的t检验 计算结果 8 4检验问题的进一步说明 8 4 1关于检验结果的解释检验过程中 用显著性水平控制弃真错误的概率 如果出现拒绝原假设的结果 可以说备择假设为真出错的概率不超过 不拒绝原假设 不表示原假设为真 只能说没有充足的证据反对原假设 8 4 2单侧检验中假设的建立同一个问题 不同的原假设 可以得到不同的检验结论 在实践中 假设的建立 与问题的背景 现实情况有关 一般把希望证明的命题放在备择假设上 把原有的 传统的观点或结论放在原假设上 利用P 值进行假设检验 是一个概率值如果我们假设原假设为真 P 值是观测到的样本均值不同于 实测值的概率左侧检验时 P 值为曲线上方小于等于检验统计量部分的面积右侧检验时 P 值为曲线上方大于等于检验统计量部分的面积被称为观察到的 或实测的 显著性水平H0能被拒绝的 的最小值 利用P值进行决策 单侧检验若p 值 不能拒绝H0若p 值 拒绝H0双侧检验若p 值 2 不能拒绝H0若p 值 2 拒绝H0 双尾Z检验 P 值计算实例 例 欣欣儿童食品厂生产的盒装儿童食品每盒的标准重量为368克 现从某天生产的一批食品中随机抽取25盒进行检查 测得每盒的平均重量为 x 372 5克 企业规定每盒重量的标准差 为15克 确定P值 双尾Z检验 P 值计算结果 双尾Z检验 P 值计算结果 计算的检验统计量为 单尾Z检验 P 值计算结果 例 欣欣儿童食品厂生产的某种盒装儿童食品 规定每盒的重量不低于368克 现从某天生产的一批食品中随机抽取25盒进行检查 测得每盒的平均重量为 x 372 5克 企业规定每盒重量的标准差 为15克 确定P 值 单尾Z检验 P 值计算结果 计算的检验统计量为 p 值为P Z 1 50 0668 样本统计量的Z值 用备择假设找出方向H1 从Z分布表 查找1 50 0 5000 0 4332 0 0668 检验统计量未在拒绝区域 p 值 0 0668 05 不能拒绝H0- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人大 版贾俊平 第五 统计学 假设检验
装配图网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文