统原PP第七章抽样估计(上)

上传人:沈*** 文档编号:170025795 上传时间:2022-11-18 格式:PPT 页数:15 大小:258.57KB
收藏 版权申诉 举报 下载
统原PP第七章抽样估计(上)_第1页
第1页 / 共15页
统原PP第七章抽样估计(上)_第2页
第2页 / 共15页
统原PP第七章抽样估计(上)_第3页
第3页 / 共15页
资源描述:

《统原PP第七章抽样估计(上)》由会员分享,可在线阅读,更多相关《统原PP第七章抽样估计(上)(15页珍藏版)》请在装配图网上搜索。

1、1第七章 抽样估计科学有险阻苦战能过关 陈 毅2第七章 抽样估计笫一节 抽样估计的意义和作用 一、抽样估计的基本概念 1、全及总体和样本总体 全及总体 被调查研究的事物的全体,母体。样本总体 从全及总体中随机抽取的部分,样本。总体单位 总体单位数 总体总量 N 有限 无限 特大 样本单位 样本单位数 样本容量 n 有限 大样本 n50 n30(精度不高,方差小)方法易 社会经济统计 小样本 n50 n不考虑顺序所有可能样本数重置抽样所有可能样本数不重置抽样所有可能样本数Xx)!(!nNNAnNnnNNB!)!(!nnNNCnN!)!1()!1(nNnNDnN1624B1224A624C1024

2、D4 4、抽样误差 统计误差 登记性误差(登记或计算)(统计值与实际值之差)代表性误差 系统性误差(偏差 违反随机原则)(非全面调查)随机误差 实际误差(某一样本)(不同样本带来)平均误差(全部样本)抽样平均误差(抽样误差):由于抽样的随机性而产生的,样本指标与总体指标之间的平均误差,是所有可能出现的样本指标的标准差。5、置信区间和置信概率置信区间:估计的总体指标所在的范围。置信概率:置信区间的可靠性大小。二、抽样估计的意义 抽样估计按照随机原则,从全及总体中抽取部分单位组成样本,对样本进行调查并计算出各种统计指标,以此对全及指标所在范围进行概率估计的统计方法。5三、抽样估计的作用 1、用于无

3、限总体或特大总体 如环境污染 、大气测量、含水率等。2、用于破坏性试验 3、用于其它特殊总体 没必要或不可能全面调查的总体。4、验证和修正全面调查的结果 如人口普查。6 第二节 抽样估计的理论基础 对概率论与数理统计知识的简单回顾。一、正态分布 1、密度函数数学期望 决定正态分布曲线的位置标准差 决定正态曲线的形状,当值变小时,中心分布升高,正态曲线趋于集中;当值变大时,中心分布降低,正态曲线趋于平缓。2、标准正态分布 =0 =1的正态分布t=1 =68.27%t=2 =95.45%t=3 =99.73%t=1.96 =95%t=2.58 =99%3、标准化 变量代换22221)(xexfx2

4、221)(xexfxz7 二、样本的分布 1、样本的代表性 分布越接近于总体的样本代表性越强,然而有些接近,有些不接近。总希望接近总体的样本数量多一些,抽到它们的概率高一些。样本平均数是样本的代表值,研究它的分布规律是研究样本代表性问题的关践。总 体 的 分 布 单位数N 分布未知 均数 标准差样 本 的 分 布 单位数n 不太偏 均数 标准差s样本均数分布 单位数 正态分布 均数 标准差 2、大数定理:只要n充分大,样本的分布一致于总体的分布,样本均数趋近于总体均数,样本标准差趋近于总体标准差。XxnNCxxXx83、中心极限定理(1)若总体为正态分布,样本均数 也服从正态分布。(2)总体为

5、任意分布(不太偏),样本均数 随着n的增大而趋近于正态分布。(n50)(3)样本平均数的平均数等于总体平均数 =(4)样本平均数的标准差为:重置抽样 不重置抽样xXXnxnNnnNnNnx11)1(N)(nNxx为抽样比Nn9第三节 总体平均数的抽样估计 一、总体均数估计的公式 中心极限定理表明,只要n足够大(n50),样本均数的分布就趋近于正态分布 ,作变量代换 则z服从于标准正态分布:)x,XN(xxXxz)1,0(Nz)(tzP)(tXxPx)(xtXxP)(xtxXP)(xxtxXtP)(xxtxXtxP10 二、区间估计的特点 第一、抽样估计计算的是总体指标所在的范围称为置信区间。不

6、等式表示:区间表示:定值表示:第二、置信区间表明的是一个可能范围,不是可靠范围,总体落在置信区间内的概率称为置信概率。用表示。第三、扩大置信区间可提高置信概率,缩小置信区间可降低置信概率,扩大或缩小的倍数称为概率度,用t表示。称为极限抽样误差,是抽样误差的最大限度。例如:若概率度t=2,则极限误差为 ,置信区间为 ,置信概率为95.45%。)(xxtxXtxPxxtxXtxxxtxtx,xtxxxtxx2xxxx2,211 三、抽样误差的计算 以上公式中,的计算是抽样估计的基础,称为抽样平均误差,简称抽样误差,用 表示。理论上:数理统计证明,样本标准差 s 是总体标准差 的偏误估 计量,而 是

7、总体标准差的无偏估计量。当n1时,n-1n,可用样本标准差 s 代替总体标准差计算。抽样误差的计算公式:重置抽样:不重置抽样:)(xxtxXtxPxxnxxsnn1snsnsnxx1nsNnnsNnNnx11112四、大样本平均数抽样估计综述)(xxxXxPxxt 重置抽样 不重置抽样 估计步骤:1、据样本资料计算 和s2、根据置信概率确定t(正态分布表)3、计算抽样误差(重置或不重置)4、计算极限抽样误差5、计算置信区间6、回答nsnsnxx1nsNnnsNnNnx111x13大样本平均数抽样估计举例对某灯泡厂随机抽取500个灯泡进行质量检验,结果如右表所示。求该厂全部灯泡平均耐用时间的取值

8、范围(置信概率为.9973)。解:灯泡平均耐用时间样本标准差99.73%t3抽样误差极限抽样误差置信区间耐用时间(小时)灯泡数8008503585090012790095018595010001031000105042105011008)(4.926500463200小时fxfx)(21.55)(2小时ffxxs)(47.2150021.551小时nsx)(41.747.23小时xxt)(91941.74.926小时xx)(93441.74.926小时xx14课堂练习某地居民1000人,其年收入抽样调查结果如右表所示。以95%的置信概率估计该地人口年均收入。解:人口年均收入样本标准差95%t1

9、.96抽样误差极限抽样误差置信区间年收入分组(元)人口数600以下50600-800200800-10004001000-12002001200以上150)(9401000940000元fxfx)(41.215)(2元ffxxs)(81.61100041.2151小时nsx)(35.1381.696.1小时xxt)(92735.13940小时xx)(95335.13940小时xx15课外作业 某地有小麦10000亩,抽样调查 结果如右表所示。以95%的置信概率估计小麦 亩产量所在范围。以68.27%的置信概率估计 亩产量在300kg以上的播种面积数。亩产量分组(kg)亩数(亩)200以下10200-25022250-30030300-35025350以上13

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!