统计学第五章抽样推断.ppt

上传人:za****8 文档编号:14177264 上传时间:2020-07-09 格式:PPT 页数:37 大小:362.06KB
收藏 版权申诉 举报 下载
统计学第五章抽样推断.ppt_第1页
第1页 / 共37页
统计学第五章抽样推断.ppt_第2页
第2页 / 共37页
统计学第五章抽样推断.ppt_第3页
第3页 / 共37页
资源描述:

《统计学第五章抽样推断.ppt》由会员分享,可在线阅读,更多相关《统计学第五章抽样推断.ppt(37页珍藏版)》请在装配图网上搜索。

1、2020/7/9,统计学讲义 游士兵,1,统计学 Statistics,武 汉 大 学 商 学 院 副教授 游 士 兵 经济学博士 电 话:62054287 13307175789 E-mail: ,2020/7/9,统计学讲义 游士兵,2,第五章 抽样推断 sampling and sampling inferences,章前导语: 我们必须确信运气的存在,否则对那些我们不喜欢的人的成功,我们又何得以能安然呢? 台湾政治大学:詹世煌教授,2020/7/9,统计学讲义 游士兵,3,一、基本问题 core issues,1、什么是抽样推断? sampling inferences 抽样推断是在遵

2、守随机原则的条件下,从总体中抽选样本,并且以样本指标推断总体指标的一种统计分析方法。 这里注意:一是对随机原则的理解 一是抽样推断的目的(平均数和成数),2020/7/9,统计学讲义 游士兵,4,2、抽样推断的适用范围,对大量现象的观察 对不可能进行全面调查,而又需要了解全面情况的现象 虽然可以进行全面调查,但不必要进行全面调查的现象 对普查或全面调查的统计数据的质量进行检查或修正,2020/7/9,统计学讲义 游士兵,5,3、样本单位的抽选方法,重复抽样 不重复抽样 请注意: A、重复抽样和不重复抽样对抽样结果和误差的差异 B、理论上和实际中的认识和运作的差异,2020/7/9,统计学讲义

3、游士兵,6,4、抽样推断的组织形式,简单随机抽样 分层随机抽样 等距随机抽样(又称系统或机械随机抽样) 整群随机抽样,2020/7/9,统计学讲义 游士兵,7,5、本章的主要内容,抽样误差sampling error 点估计和区间估计 point estimation and interval estimation 抽样数目的确定 determining the sample size 假设检验hypothesis testing,2020/7/9,统计学讲义 游士兵,8,二、抽样误差sampling error,1、抽样误差的含义 抽样误差是指样本指标值与被推断的总体指标值之差。 主要包括:

4、 样本平均数与总体平均数之差 样本成数与总体成数之差,2020/7/9,统计学讲义 游士兵,9,2、抽样误差的来源,一类:登记性误差 二类:代表性误差 A、系统性误差 B、偶然性误差 注意:抽样误差特指偶然性误差,2020/7/9,统计学讲义 游士兵,10,3、影响抽样误差的因素,抽样单位数的多少 总体中被研究标志的变动程度的大小,2020/7/9,统计学讲义 游士兵,11,4、抽样误差的统计度量方法,(1)理论准备 总体指标在抽样之前,甚至在抽样之后是无法知道的; 请大家回忆一下标准差的含义及计算方法,2020/7/9,统计学讲义 游士兵,12,抽样误差实际上是用抽样平均误差来代替的,因为:

5、,所有可能样本平均数或成数的平均数等于总体平均数或成数 抽样平均误差是所有可能样本平均数(或成数)与总体平均数(或成数)的平均误差程度,即所有可能样本平均数或成数的标准差,2020/7/9,统计学讲义 游士兵,13,因此,样本平均数或样本成数的标准差实际上就反映了样本平均数或样本成数与总体平均数或总体成数的平均误差程度,即抽样误差。 由于不可能,也没有必要把所有的样本都抽出来,因此,计算方法另求。,2020/7/9,统计学讲义 游士兵,14,(2)公式应用,抽样误差的计算公式可分为两种条件下的两种推断的计算公式: 两种条件:重复抽样和不重复抽样 两种推断:以样本平均数推断总体平均数;以样本成数

6、推断总体成数 这样,就有四个计算公式。,2020/7/9,统计学讲义 游士兵,15,公式的验证:,请大家看一例子。,2020/7/9,统计学讲义 游士兵,16,从验证例子中,我们可以看出:,样本平均数的平均数等于总体平均数。 抽样平均误差要比总体的标准差小得多。 抽样误差和总体标准差成正比,和样本单位数成反比。,2020/7/9,统计学讲义 游士兵,17,特别提示:,在计算抽样误差时,往往遇到总体方差缺少的情况,通常采取以下方法解决: 用估计的资料 用过去调查所得到的资料 用样本方差代替,2020/7/9,统计学讲义 游士兵,18,特别注意,如果同时有几个方差供选择,则选择其中最大的; 如果同

7、时有几个成数供选择,则选择靠近0.5的那个成数。,2020/7/9,统计学讲义 游士兵,19,(3)计算举例,例1:某企业生产一批产品20000件,今随机抽样100件作耐用时间试验,结果表明:每件样本的平均寿命为3600小时,所抽样本的标准差为150小时,求抽样误差。,2020/7/9,统计学讲义 游士兵,20,例2:随机抽取500名某国私人对外投资者,发现对外投资额在5000万元以上的人数有80人,求抽样误差。 例3:一批食品随机抽查50箱,发现一箱不合格,求合格率的抽样误差。,2020/7/9,统计学讲义 游士兵,21,三、点估计和区间估计 point estimation and int

8、erval estimation,1、点估计 点估计是直接用样本指标推断总体指标的一种方法。 点估计的特点是只考虑了样本指标,而没有考虑抽样误差。,2020/7/9,统计学讲义 游士兵,22,2、区间估计,(1)理论准备 所谓区间估计就是在一定概率保证下,确定总体参数值的可能范围。 所谓概率就是指在随机事件进行大量实验中,某种事件出现的可能性的大小。 抽样估计的概率保证程度就是指抽样误差不超过一定范围的概率大小。,2020/7/9,统计学讲义 游士兵,23,(2)几个概念,允许误差(又称极限误差):是指扩大或缩小以后的抽样误差。 概率度t:是指扩大或缩小抽样误差的倍数。 置信度1-(俗称可靠度

9、)是指由样本指标估计的总体区间中有100(1- )%的估计区间包括了总体的实际值。,2020/7/9,统计学讲义 游士兵,24,(3)计算举例。,2020/7/9,统计学讲义 游士兵,25,四、抽样数目的确定 determining the sample size,由于有两种条件和两个推断,所以,抽样数目确定的公式也有四个公式。但其基本来源公式为: =t 确定举例:,2020/7/9,统计学讲义 游士兵,26,五、假设检验hypothesis testing,(一)什么是假设检验? 1、假设检验的应用背景 2、假设检验是在两种互相对立的行动之间,通过对样本的试验,在一定的保证条件下进行决策的统

10、计分析方法。,2020/7/9,统计学讲义 游士兵,27,(二)假设检验的一些理论准备,1、抽样误差判断风险 统计学上的风险概率通常用 表示,又称显著性水平。如: =0.1 =0.05 =0.01 即:分别的含义是指所作的决策有10%、5%和1%的风险。 或者说:所作的决策有90%的把握,10%的风险 95%的把握,5%的风险 99%的把握,1%的风险,2020/7/9,统计学讲义 游士兵,28,2、所抽样本的几种可能总体来源及由此作出决策而冒的风险 (1)总体分布本身就没有变动,样本分布也正常,这样通过样本进行观察,认为“总体没有变”这一结论的把握性为(1- )% ,这一结论的风险为% (2

11、)总体分布本身没有变动,只是抽样的样本分布偏了。这样通过样本认为“总体发生变化”这一结论的把握性为%,这一结论的风险为(1- )% (3)总体分布发生了变化,而抽样分布按照已经变动的总体抽取,且落在原总体可以接受的区域,这样通过样本犯认为“总体没有变”这一错误结论的可能性为%,不犯这一错误的把握为(1- )% (4)总体分布发生了变化,且抽样分布偏了,通过样本认为“总体变了”这一结论的概率为(1- )%,认为“总体没有变”的概率为 %,2020/7/9,统计学讲义 游士兵,29,3、在区间估计里,关于 t称为检验统计量的问题,4、双侧检验和单侧检验 通常在判断是否“多于”、“少于”、“好于”、

12、“差于”、“大于”、“小于”、“至少”等时,采用单侧检验是比较合适的,这种检验所关心的是估计值是否偏高(或者偏低),是单向的。 但在判断“不同于”、“不相等”以及某些现象“太好了也不行,太坏了也不行”、“太多了也不行,太少了也不行”、“太薄了也不行,太厚了也不行”、太重了也不行、太轻了也不行“等时,往往需要进行双侧检验。 5、假设检验的基本思路: (1)反证法:先假定原假设为真,如果检验中出现了不合理的现象,则表明原假设是错误的,应该拒绝原假设,接受备用假设。反之,亦反。 (2)小概率原理:小概率原理认为:小概率事件在一次试验中几乎不可能发生,如果小概率事件在一次试验中居然发生了,则有理由怀疑

13、原假设的真实性,从而拒绝原假设。,2020/7/9,统计学讲义 游士兵,30,(三)假设检验的程序,1、根据抽样目的决定假设形式 A、双侧检验的假设 B、单侧检验的假设 2、选择显著性水平 3、计算检验统计量 A、大样本检验(Z检验法) B、小样本检验(t检验法) 4、查表,决策。,2020/7/9,统计学讲义 游士兵,31,几点说明:,原假设通常要包括等号,以便使能明确算出。双侧检验用=号,左侧检验用号,右侧检验用号。 关于Z分布和T分布问题 Z分布主要用于大样本检验,其前提是: 1、总体方差已知;2、服从正态分布;3、样本数大于30 T分布主要用于小样本检验,其前途是: 1、服从正态分布;

14、2、总体方差未知;3、样本数小于30,2020/7/9,统计学讲义 游士兵,32,(四)应用举例,例1、某茶叶厂产生袋装茶叶,正常情况下每袋茶叶净重平均为500克,标准差为13克。最近,厂质检部门接到消费者投诉,认为该厂新投放市场的一批茶叶似乎普遍分量不足。为此,从生产线是随机抽取了40袋茶叶,测得其平均重量为495克,能否认为该厂最近生产的茶叶包装分量确实不足?(显著性水平=1%),2020/7/9,统计学讲义 游士兵,33,例2 根据经验,某高校历年入学新生的平均数为167厘米,标准差为10厘米。现从今年入学新生中随机抽查了30名学生,测得其平均身高为169厘米,如果标准差与往年一样,能否

15、在=0.05的水平上认定今年入学新生的平均身高与往年有显著变化?,2020/7/9,统计学讲义 游士兵,34,例3、某公司引进一自动包装线包装大米,合同规定设计规格为每袋大米10公斤,标准差为0.6公斤,生产调试后随机抽取100袋大米平均重量为9.8公斤。问可靠程度为95%下,该生产线的设计规格是否符合要求?,2020/7/9,统计学讲义 游士兵,35,例4、取8台新型发动机进行测试,其结果是使用柴油每公升的运转时间分别为28、27、31、29、30、27、30、27分钟。根据设计要求,平均每公升运转应在30分钟以上。问根据实验结果,在显著性水平为5%和总体标准差不明确的条件下,能否说明这种发动机符合设计要求?,2020/7/9,统计学讲义 游士兵,36,例5、某产品的耐用时间为1000小时,现随机抽取10件新工艺条件下的产品作测试,测得平均耐用时间为1077小时,标准差为51.97小时,能否认为新工艺条件下产生的产品明显不同于老产品?,2020/7/9,统计学讲义 游士兵,37,例6、我国出口的特产参茸药酒畅销某国市场,据以往的调查,购买此药酒的有50%为40岁以上的男子。经营该要酒的进口公司关心这个百分比是否发生了变化,委托国外一个调查公司随机抽选了400名调查,结果有210名为40岁以上的男子,按显著性水平5%计算,能否根据调查结果认为原百分比已经改变?,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!