参数区间估计

上传人:痛*** 文档编号:227787146 上传时间:2023-08-15 格式:PPT 页数:53 大小:694.50KB
收藏 版权申诉 举报 下载
参数区间估计_第1页
第1页 / 共53页
参数区间估计_第2页
第2页 / 共53页
参数区间估计_第3页
第3页 / 共53页
资源描述:

《参数区间估计》由会员分享,可在线阅读,更多相关《参数区间估计(53页珍藏版)》请在装配图网上搜索。

1、 参数区间估计参数区间估计 引言引言 前面,我们讨论了参数点估计前面,我们讨论了参数点估计.它它是用样本算得的一个值去估计未知参数是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误近似值,它没有反映出这个近似值的误差范围,使用起来把握不大差范围,使用起来把握不大.区间估计区间估计正好弥补了点估计的这个缺陷正好弥补了点估计的这个缺陷.譬如,在估计湖中鱼数的问题中,若譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数我们根据一个实际样本,得到鱼数N的极的极大似然估计为大似然估计为1000条条.若我们

2、能给出一个区间,在此区间若我们能给出一个区间,在此区间内我们合理地相信内我们合理地相信 N 的真值位于其中的真值位于其中.这样对鱼数的估计就有把握多了这样对鱼数的估计就有把握多了.实际上,实际上,N的真值可能大于的真值可能大于1000条,条,也可能小于也可能小于1000条条.也就是说,我们希望确定一个区间,使我也就是说,我们希望确定一个区间,使我们能以比较高的们能以比较高的可靠程度可靠程度相信它包含真参相信它包含真参数值数值.湖中鱼数的真值湖中鱼数的真值 这里所说的这里所说的“可靠程度可靠程度”是用概率来度量的,是用概率来度量的,称为置信概率,置信度或置信水平称为置信概率,置信度或置信水平.习

3、惯上把置信水平记作习惯上把置信水平记作,这里,这里 是一个是一个很小的正数很小的正数.置信水平的大小是根据实际需要选定的置信水平的大小是根据实际需要选定的.例如,通常可取置信水平例如,通常可取置信水平 =0.95或或0.9等等.根据一个实际样本,由给定的置信水平,我根据一个实际样本,由给定的置信水平,我小的区间小的区间 ,使,使们求出一个尽可能们求出一个尽可能置信区间置信区间.称区间称区间 为为 的的置信水平为置信水平为 的的教材已经给出了概率分布的上侧分位数(分教材已经给出了概率分布的上侧分位数(分位点)的定义,为便于应用,这里我们再简位点)的定义,为便于应用,这里我们再简要介绍一下要介绍一

4、下.在求置信区间时,要查表求分位数在求置信区间时,要查表求分位数.设设0 1,对随机变量对随机变量X,称满足,称满足的点的点 为为X的概率分布的上的概率分布的上 分位数分位数.例如例如:设设0 1,对随机变量对随机变量X,称满足,称满足的点的点 为为X的概率分布的上的概率分布的上 分位数分位数.标准正态分布的标准正态分布的上上 分位数分位数例如例如:设设0 1,对随机变量对随机变量X,称满足,称满足的点的点 为为X的概率分布的上的概率分布的上 分位数分位数.分布的上分布的上 分位数分位数自由度为自由度为n的的 设设0 1,对随机变量对随机变量X,称满足,称满足的点的点 为为X的概率分布的上的概

5、率分布的上 分位数分位数.F分布的上分布的上 分分位数位数自由度为自由度为n1,n2的的 一、一、置信区间定义:置信区间定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给定若由样本若由样本X1,X2,Xn确定的两个统计量确定的两个统计量则称区间则称区间 是是 的的置信水平置信水平(置信度、(置信度、置信概率)为置信概率)为 的置信区间的置信区间.分别称为置信下限和置信上限分别称为置信下限和置信上限.一旦有了样本,就把一旦有了样本,就把 估计在区间估计在区间内内.这里有两个要求这里有两个要求:可见,可见,对参数对参数 作区间估计,就是要设法找出作区间估计,就是要设法找出两个只依赖于样本

6、的界限两个只依赖于样本的界限(构造统计量构造统计量)(X1,Xn)(X1,Xn)2.估计的精度要尽可能的高估计的精度要尽可能的高.如要求区间如要求区间长度长度 尽可能短,或能体现该要求的其尽可能短,或能体现该要求的其它准则它准则.1.要求要求 以很大的可能被包含在区间以很大的可能被包含在区间内,就是说,概率内,就是说,概率 要尽可能大要尽可能大.即要求估计尽量可靠即要求估计尽量可靠.可靠度与精度是一对矛盾,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下一般是在保证可靠度的条件下尽可能提高精度尽可能提高精度.N(0,1)选选 的点估计为的点估计为求参数求参数 的置信度为的置信度为 的置信区间

7、的置信区间.例例1 设设X1,Xn是取自是取自 的样本,的样本,二、置信区间的求法二、置信区间的求法明确问题明确问题,是求什么参数的置信区间是求什么参数的置信区间?置信水平是多少?置信水平是多少?寻找未知参数的寻找未知参数的一个良好估计一个良好估计.解:解:寻找一个待估参数和寻找一个待估参数和估计量的函数估计量的函数,要求,要求其分布为已知其分布为已知.有了分布,就可以求出有了分布,就可以求出U取值于任意区间的概率取值于任意区间的概率.对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得对于给定的置信水平对于给定的置信水平(大概率大概率),根据根据U的分布,的分布,确定一个区间确定一个

8、区间,使得使得U取值于该区间的概率为取值于该区间的概率为置信水平置信水平.使使为什么为什么这样取这样取?对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得使使从中解得从中解得也可简记为也可简记为于是所求于是所求 的的 置信区间为置信区间为 从例从例1解题的过程,我们归纳出求置解题的过程,我们归纳出求置信区间的一般步骤如下信区间的一般步骤如下:1.明确问题明确问题,是求什么参数的置信区间是求什么参数的置信区间?置信水平置信水平 是多少是多少?2.寻找参数寻找参数 的一个良好的点估计的一个良好的点估计T(X1,X2,Xn)3.寻找一个待估参数寻找一个待估参数 和估计量和估计量T的函数的函

9、数 S(T,),且其分布为已知且其分布为已知.4.对于给定的置信水平对于给定的置信水平 ,根据,根据S(T,)的分布,确定常数的分布,确定常数a,b,使得,使得 P(a S(T,)b)=5.对对“aS(T,)b”作等价变形作等价变形,得到如得到如下下形式形式:则则 就是就是 的的100()的置信区间的置信区间.可见,确定区间估计很关键的是要寻找可见,确定区间估计很关键的是要寻找一个待估参数一个待估参数 和估计量和估计量T 的函数的函数S(T,),且且S(T,)的分布为已知的分布为已知,不依赖于任何未知不依赖于任何未知参数参数(这样我们才能确定一个大概率区间这样我们才能确定一个大概率区间).而这

10、与总体分布有关,所以,而这与总体分布有关,所以,总体分布的总体分布的形式是否已知,是怎样的类型,至关重要形式是否已知,是怎样的类型,至关重要.这里,我们主要讨论总体分布为这里,我们主要讨论总体分布为正态正态的情形的情形.若样本容量很大,即使总体分布若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近未知,应用中心极限定理,可得总体的近似分布,于是也可以近似求得参数的区间似分布,于是也可以近似求得参数的区间估计估计.教材上讨论了以下几种情形:教材上讨论了以下几种情形:单个正态总体均值单个正态总体均值 和方差和方差 的区间估计的区间估计.两个正态总体均值差两个正态总体均值差 和方差比和

11、方差比 的区间估计的区间估计.下面我们举几个例子说明其应用方法下面我们举几个例子说明其应用方法.统计三大分布回顾统计三大分布回顾记为记为分布分布1、定义定义:设设 相互独立相互独立,都服从正态都服从正态分布分布N(0,1),则称随机变量:则称随机变量:所服从的分布为自由度为所服从的分布为自由度为 n 的的 分布分布.分布是由正态分布派生出来的一种分布分布是由正态分布派生出来的一种分布.分布的密度函数为分布的密度函数为来定义来定义.其中伽玛函数其中伽玛函数 通过积分通过积分T的密度函数为:的密度函数为:记为记为Tt(n).定定义义:设设XN(0,1),Y ,且且X与与Y相相互独立,则称变量互独立

12、,则称变量所服从的分布为自由度为所服从的分布为自由度为 n的的 t 分布分布.2、t 分布分布3、F分布分布定义定义:设设 X与与Y相互相互独立,则称统计量独立,则称统计量服从自由度为服从自由度为n1及及 n2 的的F分布,分布,n1称为第称为第一自由度,一自由度,n2称为第二自由度,记作称为第二自由度,记作 FF(n1,n2).若若XF(n1,n2),X的概率密度为的概率密度为 定理定理 1 (样本均值的分布样本均值的分布)设设X1,X2,Xn是取自正态总体是取自正态总体的样本,则有的样本,则有 定理定理 2 (样本方差的分布样本方差的分布)设设X1,X2,Xn是取自正态总体是取自正态总体的

13、样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有 定理定理 3 设设X1,X2,Xn是取自正态总体是取自正态总体的样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有 定理定理 4(两总体两总体样本样本均值差的分布均值差的分布)分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值均值,则有则有Y1,Y2,是是样本样本 定理定理 5(两总体两总体样本样本方差比的分布方差比的分布)分别是这两个样本的分别是这两个样本的且且X与与Y独立

14、独立,X1,X2,是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值,均值,则有则有Y1,Y2,是是样本样本例例2 已知某地区新生婴儿的体重已知某地区新生婴儿的体重X随机抽查随机抽查100个婴儿个婴儿得得100个体重数据个体重数据X1,X2,X100 的区间估计的区间估计求求和和(置信水平为(置信水平为1-).解:这是单总体均值和方差的估计解:这是单总体均值和方差的估计已知已知先求均值先求均值 的区间估计的区间估计.因方差未知,取因方差未知,取 对给定的置信度对给定的置信度 ,确定分位数确定分位数使使即即均值均值 的置信水平为的置信水

15、平为 的区间估计的区间估计.即为即为从中解得从中解得取取从中解得从中解得再求方差再求方差 的置信水平为的置信水平为 的区间估计的区间估计.对给定的置信度对给定的置信度 ,确定分位数确定分位数 使使于是于是 即为所求即为所求.需要指出的是,给定样本,给定置信水需要指出的是,给定样本,给定置信水平,平,置信区间也置信区间也不是唯一不是唯一的的.对同一个参数,我们可以构造许多置信区间对同一个参数,我们可以构造许多置信区间.N(0,1)取取由标准正态分布表,对任意由标准正态分布表,对任意a、b,我们可我们可以求得以求得P(aUb).例如,设例如,设X1,Xn是取自是取自 的样本,的样本,求参数求参数

16、的置信水平为的置信水平为 的的 置信区间置信区间.N(0,1)例如,由例如,由P(-1.96U1.96)=0.95我们得到我们得到 均值均值 的置信水平为的置信水平为的的置信区间为置信区间为由由 P(-1.75U2.33)=0.95这个区间比前面一个要长一些这个区间比前面一个要长一些.置信区间为置信区间为我们得到我们得到 均值均值 的置信水平为的置信水平为的的我们总是希望置信区间尽可能短我们总是希望置信区间尽可能短.类似地,我们可得到若干个不同的置信类似地,我们可得到若干个不同的置信区间区间.任意两个数任意两个数a和和b,只要它们的纵标包含,只要它们的纵标包含f(u)下下95%的面积,就确定一

17、个的面积,就确定一个95%的置信的置信区间区间.在概率密度为单峰且对称的情形,当在概率密度为单峰且对称的情形,当a=-b时时求得的置信区间的长度为最短求得的置信区间的长度为最短.a=-b 即使在概率密度不对称的情形,如即使在概率密度不对称的情形,如 分布分布,F分布分布,习惯上仍取对称的百分位点,习惯上仍取对称的百分位点来计算未知参数的置信区间来计算未知参数的置信区间.我们可以得到未知参数的的任何我们可以得到未知参数的的任何置信水置信水平小于平小于1的的置信区间,并且置信区间,并且置信水平越高,置信水平越高,相应的相应的置信区间置信区间平均长度平均长度越长越长.也就是说,要想得到的区间估计可靠

18、也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差度高,区间长度就长,估计的精度就差.这是一对矛盾这是一对矛盾.实用中应在保证足够可靠的前提下,尽实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些量使得区间的长度短一些.例例3 某单位要估计平均每天职工的总医疗费,某单位要估计平均每天职工的总医疗费,观察了观察了30天天,其总金额的平均值是其总金额的平均值是170元,标准元,标准差为差为30元,试决定职工每天总医疗费用平均值元,试决定职工每天总医疗费用平均值的区间估计(置信水平为的区间估计(置信水平为0.95).解:解:设每天职工的总医疗费为设每天职工的总医疗费为X,近似服

19、从正态分布近似服从正态分布大样本,由中心极限定理,大样本,由中心极限定理,E(X)=,D(X)=未知,用样本标准差未知,用样本标准差S近似代替近似代替.取枢轴量取枢轴量近似近似N(0,1)分布分布 对给定的置信水平对给定的置信水平 ,确定分位数确定分位数 使使得均值得均值 的置信水平为的置信水平为 的区间估计为的区间估计为将将 =170,S=30,=1.96,n=30代入得代入得,的置信水平为的置信水平为0.95的置信区间是的置信区间是 159.27,180.74得均值得均值 的置信水平为的置信水平为 的区间估计为的区间估计为三、单侧置信区间三、单侧置信区间 上述置信区间中置信限都是双侧的,但

20、上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在对于有些实际问题,人们关心的只是参数在一个方向的界限一个方向的界限.例如对于设备、元件的使用寿命来说,平均例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了寿命过长没什么问题,过短就有问题了.这时,可将置信上限取这时,可将置信上限取为为+,而只着眼于置信下,而只着眼于置信下限,这样求得的置信区间叫限,这样求得的置信区间叫单侧置信区间单侧置信区间.于是引入单侧置信区间和置信限的定义:于是引入单侧置信区间和置信限的定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给定 若由样本若由样本X1,X2,

21、Xn确定的统计量确定的统计量则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称为单侧置信下限称为单侧置信下限.又若统计量又若统计量 满足满足则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称为单侧置信上限称为单侧置信上限.设灯泡寿命服从正态分布设灯泡寿命服从正态分布.求灯泡寿命均求灯泡寿命均值值 的置信水平为的置信水平为0.95的单侧置信下限的单侧置信下限.例例4 从一批灯泡中随机抽取从一批灯泡中随机抽取5只作寿命试只作寿命试验,测得寿命验,测得寿命X(单位:小时)如下:(单位:小时)如下:1050,1100,1120,1250,1280由于方差由于方差 未知,取枢轴量未知,取枢轴量解:解:的点估计取为样本均值的点估计取为样本均值 对给定的置信水平对给定的置信水平 ,确定分位数,确定分位数使使即即于是得到于是得到 的置信水平为的置信水平为 的单侧置的单侧置信区间为信区间为 将样本值代入得将样本值代入得的置信水平为的置信水平为0.95的单侧置信下限是的单侧置信下限是1065小时小时的置信水平为的置信水平为 的单侧置信下限为的单侧置信下限为即即

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!