《总体均数估计》PPT课件.ppt

上传人:san****019 文档编号:20739531 上传时间:2021-04-17 格式:PPT 页数:45 大小:491.60KB
收藏 版权申诉 举报 下载
《总体均数估计》PPT课件.ppt_第1页
第1页 / 共45页
《总体均数估计》PPT课件.ppt_第2页
第2页 / 共45页
《总体均数估计》PPT课件.ppt_第3页
第3页 / 共45页
资源描述:

《《总体均数估计》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《总体均数估计》PPT课件.ppt(45页珍藏版)》请在装配图网上搜索。

1、 1 第六章 参数估计基础 总体 样 本 统计推断:用样本信息推断总体特征,包括参数 估计和假设检验。 2 图示:总体与样本 1x 1x 3x Population sample2 sample1 sample3 sample4 sample5 1x 2x 5x 4x 3 抽样试验( n=5) 4 抽样试验( n=10) 5 抽样试验( n=30) 6 1000份样本抽样计算结果 总体的 均数 总体标 准差 s 均数的 均数 均数标准差 n=5 5.00 0.50 4.99 0.2212 0.2236 n=10 5.00 0.50 5.00 0.1580 0.1581 n=30 5.00 0.

2、50 5.00 0.0920 0.0913 nsnS 7 3个抽样实验结果图示 0 5 0 1 0 0 1 5 0 2 0 0 2 5 0 3 0 0 3 5 0 4 0 0 4 5 0 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19 均 数 频数 0 5 0 1 0 0 1 5 0 2 0 0 2 5 0 3 0 0 3 5 0 4 0 0 4 5 0 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19 均 数 频数 0 5 0 1

3、0 0 1 5 0 2 0 0 2 5 0 3 0 0 3 5 0 4 0 0 4 5 0 3 . 7 1 3.92 4 . 1 2 4.33 4 . 5 4 4.74 4 . 9 5 5 . 1 5 5.36 5 . 5 7 5.77 5 . 9 8 6.19 均 数 频数 2 2 1 2.0;5 XSn 0 9 2 0.0;30 XSn 1580.0;10 XSn 8 各样本均数未必等于总体均数; 各样本均数间存在差异; 样本均数的分布为中间多 , 两边少 , 左右基本 对称 。 样本均数的变异范围较之原变量的变异范围大 大缩小 。 样本均数的抽样分布具有如下特点 9 10 中心极限定理:

4、 ( 1)从正态总体中作随机抽样,则样本均数服从 正态分布;从偏态总体中作随机抽样,样本含量 n 足够大( n 30)则样本均数近似服从正态分布。 xs ( 2)从总体均数为 ,标准差为 的正态总体中抽 取例数为 n的样本,样本均数的总体均数为 ,标 准差为 。 11 若 i X 服从正态分布 则 j X 服从正态分布 n 大: 则 j X 近似服从正态分布 若 i X 不服从正态分布 n 小: 则 j X 为非正态分布 12 样本频率的抽样分与抽样误差 黑球的比例为 20%,重复摸球 50次, 计算摸到黑球的频率? 黑球比例 ( %) 样本频数 样本频率 ( %) 黑球比例 ( %) 样本频

5、数 样本频率 ( %) 8 2 2.00 22 11 11.00 10 4 4.00 24 11 11.00 12 8 8.00 26 6 6.00 14 7 7.00 28 3 3.00 16 11 11.00 30 4 4.00 18 13 13.00 32 1 1.00 20 19 19.00 合计 100 100.00 表 6-3 =20%的随机抽样结果( n=50) 13 一、抽样误差与标准误 1.抽样误差: 由于抽样造成的样本统计量与总体 参数以及样本统计量与样本统计量之间的差异。 抽样误差是不可避免的,但可以估计。 2.标准误 (Standard error, SE): 标准误为

6、样本均 数的标准差,用 表示, 是说明样本均数抽样 误差的大小的指标,描述样本均数的离散程度, 反映用样本均数估计或推断总体均数的可靠性。 14 3.标准误的计算 均数的标准误与标准差成正比,与样本例数的平 方根成反比。 若标准差固定不变时,可增加 n而缩小抽样误差。 15 对于二项分布, XB(n,), 则样本频率 其标准误: n n X p p )1( s n pp n ppS p )1( 1 )1( 实际中, 一般未知, 常用 样本频率 p近似代替 则其标准误: 16 4. 标准误的应用 ( 1)表示抽样误差大小,描述( n相同)样本 统计量的离散程度,反映用样本统计量估计或 推断总体参

7、数的可靠性; ( 2)用于估计总体参数的可信区间; ( 3)用于进行样本均数 /频率的假设检验。 17 标 准 差( S ) 标 准 误 ( X S ) 1. 表示个体变量值的变异度大小, 即原始变量值的离散程度。公式为: 1 )( 2 n XX S 2. 计算变量值的频数分布范围,如: ( SX 96.1 )。 3. 可对某一个变量值是否在正常值 范围内作出初步判断。 4 . 用于计算标准误。 1. 表示样本均数抽样误差的大小,即 样本均数的离散程度。公式为: n S S X 2. 计算总体均数的可信 区间,如: ( X SX 96.1 )。 3. 可对总体均数的大小作出初步的判 断。 4

8、. 用于进行假设检验。 18 1 若某一随机变量 X 服从总体均数为 、总体 标准差为 s 的正态分布 2 ( , )N s ,则可通过 z 变换 ( X s ) 将一般正态分布转化为标准正态分布 N (0, 1 2 ) , 即 z 分布 ; 二、 t 分布的概念 19 2 若样本均数 X 服从总体均数为 、 总体标准差为 X s 的正态分布 2 ( , ) X N s , 则通 过同样方式的 z 变换 ( X X s ) 也可将其转换为 标准正态分布 N (0, 1 2 ) ,即 z 分布 。 20 , 1 X XX tn S Sn 式中 为自由度 (degree of freedom, d

9、f) 3 实际工作中 , 由于 未知 , 用 代替 , 则 不再服从标准正态分布 , 而 服从 t 分布 。 Xs XS ( ) / XXS 21 )1,0(),( 2 NzNX xxzx s s nS x S x t x / )1,0(),( 2 NzNX x z s s 22 4. t 分布曲线的特征: ( 1) t 分布是一簇曲线。它受自由度的影响,自由度 不同曲线形状不同。 ( 2) 是 t 分布曲线的参数: n越小, 越小,曲线越平缓 n越大, 越大,曲线越陡峭 n ,曲线近似于标准正态分布曲线。 ( 3)以 0为中心,左右对称呈钟形。 ( 4)标准正态分布是 t 分布的特例。 23

10、 t -5.0 -4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0 5.0 ( 标准正态曲线 ) = 5 = 1 f(t ) 24 2参数 (only one): 3 t界 值表:详见附表 2,可反映 t分布曲下的面积。 单侧概率或单尾概率:用 ,t表示; 双侧概率或双尾概率:用 /2,t表示。 t界值表:详见附表 2, 可反映 t分布曲 线下的面积 。 单侧概率或单尾概率:用 表示; 双侧概率或双尾概率:用 表示。 2参数 (only one): 3 t 界 值表:详见附表 2,可反映 t 分布曲下的面积。 单侧概率或单尾概率:用 ,t表示; 双侧概率或双尾概率:

11、用 /2,t表示。 25 附表 2 t 界值表 概 率, P 单侧 0 . 2 5 0 . 2 0 0 . 1 0 0 . 0 5 0 . 0 2 5 0 . 0 1 0 . 0 0 5 0 . 0 0 2 5 0 . 0 0 1 0 . 0 0 0 5 自由度 双侧 0 . 5 0 0 . 4 0 0 . 2 0 0 . 1 0 0 . 0 5 0 . 0 2 0 . 0 1 0 . 0 0 5 0 . 0 0 2 0 . 0 0 1 1 1 . 0 0 0 1 . 3 7 6 3 . 0 7 8 6 . 3 1 4 1 2 . 7 0 6 3 1 . 8 2 1 6 3 . 6 5 7 1

12、 2 7 . 3 2 1 3 1 8 . 3 0 9 6 3 6 . 6 1 9 2 0 . 8 1 6 1 . 0 6 1 1 . 8 8 6 2 . 9 2 0 4 . 3 0 3 6 . 9 65 9 . 9 2 5 1 4 . 0 8 9 2 2 . 3 2 7 3 1 . 5 9 9 3 0 . 7 6 5 0 . 9 7 8 1 . 6 3 8 2 . 3 5 3 3 . 1 8 2 4 . 5 4 1 5 . 8 4 1 7 . 4 5 3 1 0 . 2 1 5 1 2 . 9 2 4 4 0 . 7 4 1 0 . 9 4 1 1 . 5 3 3 2 . 1 3 2 2 .

13、7 7 6 3 . 7 4 7 4 . 6 0 4 5 . 5 9 8 7 . 1 7 3 8 . 6 1 0 5 0 . 7 2 7 0 . 9 2 0 1 . 4 7 6 2 . 0 1 5 2 . 5 7 1 3 . 3 6 5 4 . 0 3 2 4 . 7 7 3 5 . 8 9 3 6 . 8 6 9 6 0 . 7 1 8 0 . 9 0 6 1 . 4 40 1 . 9 4 3 2 . 4 4 7 3 . 1 4 3 3 . 7 0 7 4 . 3 1 7 5 . 2 0 8 5 . 9 5 9 7 0 . 7 1 1 0 . 8 9 6 1 . 4 1 5 1 . 8 9 5

14、 2 . 3 6 5 2 . 9 9 8 3 . 4 9 9 4 . 0 2 9 4 . 7 8 5 5 . 4 0 8 8 0 . 7 0 6 0 . 8 8 9 1 . 3 9 7 1 . 8 6 0 2 . 3 0 6 2 . 8 9 6 3 . 3 5 5 3 . 8 3 3 4 . 5 0 1 5 . 0 4 1 9 0 . 7 0 3 0 . 8 8 3 1 . 3 8 3 1 . 8 3 3 2 . 2 6 2 2 . 8 2 1 3 . 2 5 0 3 . 6 9 0 4 . 2 9 7 4 . 7 8 1 10 0 . 7 0 0 0 . 8 7 9 1. 3 7 2 1 .

15、 8 1 2 2 . 2 2 8 2 . 7 6 4 3 . 1 6 9 3 . 5 8 1 4 . 1 4 4 4 . 5 8 7 21 0 . 6 8 6 0 . 8 5 9 1 . 3 2 3 1 . 7 2 1 2 . 0 8 0 2 . 5 1 8 2 . 8 3 1 3 . 1 3 5 3 . 5 2 7 3 . 8 1 9 22 0 . 6 8 6 0 . 8 5 8 1 . 3 2 1 1 . 7 1 7 2 . 0 7 4 2 . 5 0 8 2 . 8 1 9 3 . 1 1 9 3 . 5 0 5 3 . 7 9 2 23 0 . 6 8 5 0 . 8 5 8 1 .

16、3 1 9 1 . 7 1 4 2 . 0 6 9 2 . 5 0 0 2 . 8 0 7 3 . 1 0 4 3 . 4 8 5 3 . 7 6 8 2 4 0 . 6 8 5 0 . 8 5 7 1 . 3 1 8 1 . 7 1 1 2 . 0 6 4 2 . 4 9 2 2 . 7 9 7 3 . 0 9 1 3 . 4 6 7 3 . 7 4 5 25 0 . 6 8 4 0 . 8 5 6 1 . 3 1 6 1 . 7 0 8 2 . 0 6 0 2 . 4 8 5 2 . 7 8 7 3 . 0 7 8 3 . 4 5 0 3 . 7 2 5 -t t 0 26 三、总体参数的

17、估计 1.参数估计 :用样本统计量估计总体参数。包括点 估计和区间估计。 ( 1)点估计 (Point Estimation):直接用样本指标作 为总体参数的估计; ( 2)区间估计 (Interval Estimation) :用预先给定 的概率(可信度、把握度 1- )估计总体参数所在 的范围。此范围称为置信区间(可信区间): Confidence Interval, CI 27 1点估计 (point estimation) 用相应样本统计量直接作为其总体参数的估计值。 、 S估计 s 代替,用代替如用 sx 其方法虽简单,但未考虑抽样误差的大小。 28 按预先给定的概率 (1)所确定的

18、包含 未知总体参数的一个范围 。 总体均数的区间估计: 按预先给定的 概率 (1)所确定的包含未知总体均数的一 个范围 。 如给定 =0.05,该范围称为参数的 95%可信区 间或置信区间; 如给定 =0.01,该范围称为参数的 99%可信区 间或置信区间 。 2 区间估计 (interval estimation): 29 总体均数置信区间的计算需考虑: ( 1) 总体标准差 s是否已知 , ( 2) 样本含量 n的大小 通常有两类方法: ( 1) t分布法 ( 2) z分布法 总体均数置信区间的计算 30 总体均数置信区间的计算 1、 t分布法 当总体标准差 未知且 n50时 )即( xx

19、 x stxstx stx ,2/,2/ ,2/ , 总体均数的双侧( 1-)置信区间 总体均数的单侧( 1-)置信区间 xx stxstx ,2/,2/ 31 例 5 - 3 某地 27 名健康成年男子血红蛋白 的均数 125g L (c m ) ,标准差 15g L ,求其总体均数的 95% 和 99% 置信 区间。 32 Lgstx Lgstx t x x /)02.133,98.116( 27 15 779.2125 /)94.130,06.119( 27 15 056.2125 .779.201.0 ,056.2t0.0526,1-n 2 27,n 26,2/01.0 26,2/05

20、.0 262/01.0 0 . 0 5 / 2 , 2 6 , 时, 时,双侧 ,查附表本例 33 2、 正态分布近似法 当 已知 或 未知,但 n50 时 )即( xx x zxzx zx ss s 2/2/ 2/ , 总体均数的双侧( 1-)置信区间 )即( xx x szxszx szx 2/2/ 2/ , 34 总体均数的单侧( 1-)置信区间 xx zxzx ss 或 xx szxszx 或 35 例 3-3 某地抽取正常成年人 200名 ,测得其 血清胆固醇的均数为 3.64 mmol/L,标准差为 1.20mmol/L,估计该地正常成年人血清胆固醇 均数的 95%置信区间。 36

21、 故该地正常成年人血清胆固醇均数的双侧 95% 可信区间为 (3.47, 3.81)mmolL。 本例 n =2 0 0 5 0 ,故可采用正态近似的方法 计算 置信 区间。今 X =3 .64 、 S =1 .20 、 n =2 0 0 、 XS =0 .08 4 9 , 取双尾 0 .05 得 Z a / 2 = 1 .96 3 . 6 4 1 . 9 6 0 . 0 8 4 9 ( 3 . 4 7 , 3 . 8 1 ) ( m m o l / L ) 37 参数估计的方法: ( 1) 已知,根据正态分布原理, 95%、 99%CI: ( 2) 未知, n较小,据 t分布原理: 95%、

22、 99%CI: x x s96.1 xSx 58.2 xStx ,05.0 xStx ,01.0 ( 3) 未知, n较大,据近似正态分布原理, xSx 96.1 xx s58.2 38 正态分布法 样本含量 n足够大, np与 n(1-p)均 5时 , p Szp 2/ 总体概率的置信区间计算 39 For example 例 6-6 用某种仪器检查已确诊的乳腺癌患者 120名 , 检出乳腺癌患者 94例 , 检出率为 78.3%。 估计该仪 器乳腺癌总体检出率的 95%置信区间 。 95%的置信区间为: 该仪器乳腺癌总体检出率的 95%置信区间 ( 70.9%, 85.7% ) 857.0

23、709.0 120 )783.01(783.0 96.1783.0 )1( 2/05.02/ n pp ZpSzp p 40 查表法 当样本含量较小(如 n50 ), np或 n(1 p)6 0 : X Xu s 或 X X u S * 正 态 分 布 : X u S * 偏 态 分 布 : P X P 100 X 用 途 总 体 均 数 的 区 间 估 计 绝 大 多 数 ( 如 95 % ) 观 察 对 象 某 项 指 标 的 分 布 范 围 * , t 也 可 用 / 2 , t ( 对 应 于 双 尾 概 率 时 ) * , u 也 可 用 / 2 , u ( 对 应 于 双 尾 概 率 时 )

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!