6.概率分布及总体平均数的推断

上传人:仙*** 文档编号:55813371 上传时间:2022-02-18 格式:PPT 页数:61 大小:1.74MB
收藏 版权申诉 举报 下载
6.概率分布及总体平均数的推断_第1页
第1页 / 共61页
6.概率分布及总体平均数的推断_第2页
第2页 / 共61页
6.概率分布及总体平均数的推断_第3页
第3页 / 共61页
资源描述:

《6.概率分布及总体平均数的推断》由会员分享,可在线阅读,更多相关《6.概率分布及总体平均数的推断(61页珍藏版)》请在装配图网上搜索。

1、p 理解抽样分布的意义理解抽样分布的意义p 了解抽样分布的形成过程了解抽样分布的形成过程p 平均数抽样分布的定理平均数抽样分布的定理p 样本平均数与总体平均数离差统计量的形态样本平均数与总体平均数离差统计量的形态p 总体平均数的估计总体平均数的估计p 假设检验的基本原理假设检验的基本原理p 总体平均数的显著性检验总体平均数的显著性检验第六章第六章 抽样分布及总体平均数的推断抽样分布及总体平均数的推断一、分布的类型一、分布的类型o 总体分布:总体内个体数值的频数分布。o 样本分布:样本内个体数值的频数分布。o 抽样分布:某一样本统计量的概率分布。频率分布与概率分布的区别频率分布与概率分布的区别经

2、验分布:经验分布:频率分布是经频率分布是经资料整理而来资料整理而来;频率分布随样频率分布随样本不同而不同本不同而不同;频率分布有对频率分布有对应的频数分布。应的频数分布。理论分布:理论分布:概率分布是先概率分布是先验的;概率分验的;概率分布是唯一的;布是唯一的;概率分布无频概率分布无频率分布所对应率分布所对应的频数分布。的频数分布。p样本统计量的概率分布,是一种理论分布 在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布。 p结果来自容量相同容量相同的所有所有可能样本p提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据二、抽样分布二、抽样分

3、布(sampling distribution)抽样分布的形成过程抽样分布的形成过程1. 概念概念p在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布p一种理论概率分布p推断总体均值的理论基础三、样本均值的抽样分布三、样本均值的抽样分布例题分析例题分析3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n = 2 的样本(共的样本(共16个)个)3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.5

4、1.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)2. 中心极限定理中心极限定理x3. 抽样分布与总体分布的关系抽样分布与总体分布的关系p样本均值的数学期望p样本均值的方差n 重复抽样n 不重复抽样例题例题o 假设有一所大学声称它近期的毕业生所挣的平均年收入为30000元。我们有理由对这个声称的真实性提出质疑,从而决定通过一个最近两年毕业的校友的随机样本来检验它。在这个过程中,我们得到的样本均值只有28200元。我们现在要问:如果实际的总体均值真的为30000元,我们有多大的可能性获得一个均值小于或等于28200元的样本呢?这所大学的说法是真的吗?(假

5、设抽样分布的标准差为800元)5. 标准误标准误 (standard error) 1.样本统计量的抽样分布的标准差,称为统计量的标准误,也称为标准误差,也称抽样标准差。2.标准误衡量的是统计量的离散程度,它测度了用样本统计量估计总体参数的精确程度。3.以样本均值的抽样分布为例,在重复抽样条件下,样本均值的标准误为 4. 标准差的英文为:standard deviation6. 总体标准差总体标准差的无偏估计量的无偏估计量为样本标准差XXnnS1p 总体标准差在一般情况下是未知的,它需要用样本标准差 来估计。X7. 平均数标准误的估计值平均数标准误的估计值1. 当计算标准误时涉及的总体参数未知

6、时,用估计量S来代替,于是在重复抽样条件下,样本平均数标准误 的估计值为练习练习o 1、标准化的智商测验的总体均值为100,总体标准差为15.如果抽取一个规模为10的样本,求样本均值的标准误 。o 2、假设一个呈正态分布的标准化成就测验的总体标准差为7.2。如果我们抽取一个16个成绩的样本,样本均值的标准误 是多少?XX练习练习o 3、下面的样本是30名被调查者在一个七点式量表的得分,用来测量对一个极端组织是否应该被允许举行游行(1=强烈反对,7=强烈赞成)的态度,请估计其均值的标准误 ?o 3 5 1 4 3 3 6 6 2 3 3 1 1 2 2 1 5 2 1 3 4 3 1 4 5 2

7、 2 3 3 4X练习练习o 3、下面的样本是30名被调查者在一个七点式量表的得分,用来测量对一个极端组织是否应该被允许举行游行(1=强烈反对,7=强烈赞成)的态度,请估计其均值的标准误 ?o 3 5 1 4 3 3 6 6 2 3 3 1 1 2 2 1 5 2 1 3 4 3 1 4 5 2 2 3 3 4X8. 样本平均数与总体平均数离差统计量的形态样本平均数与总体平均数离差统计量的形态o 当总体标准差已知时,一切可能样本平均数与总体平均数的离差统计量呈标准正态分布。nXXZ8. 样本平均数与总体平均数离差统计量的形态样本平均数与总体平均数离差统计量的形态o 当总体标准差未知时,一切可能

8、样本平均数与总体平均数的离差统计量用t表示,呈t分布。11nXnnnXnSXSXtXZ1 定义:由小样本统计量形成的概率分布。 2 t分布的特点o t分布是对称分布。平均数位于曲线中央,在这一点上有一个单峰,从中央向两侧逐渐下降,尾部无限延长,但不与基线相交。o 分布曲线的形状易变,曲线不是一条而是一族,其曲线形状随着样本容量即随自由度的大小而有规律地变动。t分布分布t分布分布o 当n时,分布曲线以标准正态曲线为极限,即呈正态分布。通常把自由度较大的t分布当作正态分布来处理。当n逐渐减少时,分布的离散程度逐渐增大,曲线逐渐与标准正态分离;其峰顶逐渐下降,尾部抬高。o t分布的值及对应的概率值(

9、p)是根据自由度的大小由理论模型推导出来的,构成t分布临界值。 o t分布的自由度df=n1。标准正态分布与t分布图图图 标准正态分布与标准正态分布与t t分布分布t分布表中的概率图图 df=20df=20时时t t分布的双侧概率分布的双侧概率 四、参数估计四、参数估计参数估计在统计方法中的地位参数估计参数估计假设检验假设检验o 统计方法统计方法描述统计描述统计推断统计推断统计定义 当总体参数不清楚时,用一个特定值(一般常用样本统计量)进行估计,这类问题就是点估计。统计量为数轴上某一点值,所以称为点估计。n 例如:用样本均值直接作为总体均值的估计n 例如:用两个样本均值之差直接作为总体均值之差

10、的估计(一)点估计(一)点估计 (1)无偏性。指如果用多个样本的统计量作为总体参数的估计值时,有的偏大,有的偏小,而偏差的平均数为0,这时,这个统计量就是无偏估计量。如果用某个统计量估计总体的误差平均数大于0或小于0,这个统计量就是有偏统计量。总体参数的良好估计值,应具备无偏性。 (2)一致性。所谓一致性是指当样本容量无限增大时,估计值应能越来越接近它所估计的总体参数。 (3)有效性。是指当总体参数的无偏估计不止一个统计量时,无偏估计变异性小者有效性高,变异大者有效性低。 标准标准 缺点:没有给出估计值接近总体参数程度的信息。(二)区间估计(二)区间估计 区间估计是用数轴上的一段距离表示未知参

11、数可能落入的范围,它虽不具体指出总体参数等于什么,但能指出总体的未知参数落入某一区间的概率有多大。 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。n比如,某班级平均分数在7585之间,置信水平是.951. 由样本统计量所构造的总体参数的估计区间称为置信区间;2. 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间; 3. 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值;n我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个。相关

12、概念:置信区间相关概念:置信区间置信区间 (95%的置信区间) 统计分析中一般规定:正确估计的概率,也即置信水平置信水平 为.95或.99,那么显著性水平显著性水平 则为.05或.01,这是依据.05或.01属于小概率事件,而小概率事件在一次抽样中是不可能出现的原理规定的。 置信度:又称显著性水平,意义阶段,信任系数等,是指估计总体参数落在某一区间时,可能犯错误的概率,用符号表示。(0.05Z*、0.01 Z* 、0.001 Z* ) 置信区间:或称置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长度。相关概念:置信水平、置信度、置信区间相关概念:置信水平、置信度、置信区间区间估计的

13、具体步骤区间估计的具体步骤 确定样本平均数的分布形态Z或T; 计算样本分布的标准误; 查表确定置信度; 计算一定置信度前提下的置信区间o 假定条件n 总体服从正态分布n 如果不是正态分布,可由正态分布来近似 (n30)2. 使用正态分布统计量 z(三)总体均值的区间估计(三)总体均值的区间估计1. 总体方差已知条件下的总体平均数的区间估计练习:练习: 有一个49名学生的班级,某学科历年考试成绩的=5,又知今年某次考试成绩是85分,试推论该班某学科学习的真实成绩分数。 2. 总体方差未知条件下总体平均数的区间估计总体方差未知条件下总体平均数的区间估计o 假定条件n 总体服从正态分布,且方差()

14、未知n 小样本 (n 30)p 使用正态分布统计量nXnXXZxx1nzxnzxxx22136个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532总体分布总体分布样本容量样本容量已知已知未知未知正态分布正态分布大样本大样本小样本小样本非正态分布非正态分布大样本大样本nzx2nSzx2nStx2nzx2nzx2nSzx2总体分布为非正态时,若n30,不能用概率对其样本分布进行推论。1、某班49人期末考试成绩为85分,标准差为6,假设此项考试能反映学生的学习水平,试推论

15、该班学生学习的真实成绩分数。(=0.05) 2、一位研究吸烟的人员想知道吸烟者第一次吸烟的平均年龄。通过对25名吸烟者的随机样本的调查,其得出的样本均值为16.8岁,标准差为1.5岁。请计算开始吸烟的平均年龄的95%的置信区间。练习练习练习练习3、一位教育研究人员想要估计一所大学里的学生在入学第一年里所交朋友的平均数量。通过随机调查50名完成了第一年学业的学生,得到样本均值为3,标准差为1.在95%的置信水平下估计这所大学学生在第一年交朋友数的均值。作业作业1、一所大学的本科教育主管想要估计教师所需要的平均数本书。他随机抽取了26门课程的任课教师,发现样本均值为2.8本,标准差为0.4。通过9

16、5%的置信区间来估计大学教师所指定的平均数本书。2、下面的样本是30名被调查者在一个七点式量表的得分,用来测量对一个极端组织是否应该被允许举行游行(1=强烈反对,7=强烈赞成)的态度。请分别计算95%和99%的置信区间? 3 5 1 4 3 3 6 6 2 3 3 1 1 2 2 1 5 2 1 3 4 3 1 4 5 2 2 3 3 4总体比率的区间估计总体比率的区间估计o 比率的抽样分布比率的抽样分布 在实际调研中,我们经常会遇到一系列的计数变量,这些变量的比较往往是就其发生频率及其所占某一总体的比率的比较。而且实际调研中,为考察某一类事件的发生频率,还可以将其所在的总体划分为事件A和事件

17、非A两大类,这样就可以使用二分变量的比率来对之进行研究了。o 二项分布的标准差为:二项分布的标准差为: npqo 例:从男女各占例:从男女各占1/2的学校中随机抽的学校中随机抽10名学生,名学生,从理论上说,平均应抽到男生从理论上说,平均应抽到男生5人,标准差为人,标准差为1.58人。人。o 比率的抽样分布的标准差为:比率的抽样分布的标准差为: npqnnpqnp/o 假设在一个100名大学生的随机样本中有45%报告说他们赞同各种毒品的合法化。则标准误为 10055. 0*45. 0p比率的抽样分布形态比率的抽样分布形态o 同二项分布同二项分布n 当n趋近于无限大时,二项分布接近于正态分布;n

18、 当p=q,不管n多大,二项分布呈对称形;n 当pq,且n相当小时,图形呈偏态,pq与pq偏斜方向相反;n 当pq且np5,或者pq且nq5时,二项分布近似正态分布。总体比率的区间估计总体比率的区间估计o 例:假设本地的一家调查组织通过电话联系了400名本地的登记选民,询问他们倾向于投票给候选人A还是候选人B。他发现有60%倾向于候选人A。在95%的置信区间下,确定对候选人A的倾向。练习练习1、一名政治调查专家调查了一个500名登记选民的随机样本,询问他们是倾向于投票给候选人A还是候选人B。他发现有54%倾向于候选人A。在95%的置信区间下,确定这位专家预测候选人A将会获胜是否公正。2、为了估

19、计一所大学里支持在校园里全面禁酒的学生比例,因为研究人员调查了大学里的一个50名学生的随机样本。他发现样本的36%支持禁酒。在这种情况下,计算总体比例95%的置信区间。练习练习3、一家调查机构在纽约通过电话对400名随机选取的成年人进行了调查,询问他们关于对出租车司机进行随机毒品测试的态度。结果发现有38%的人赞同这个制度。计算总体比率的99%置信区间。4、一所学校想调查家长对于一项取消学生课外体育活动以削减成本的建议的态度。学校委员会采取电话调查的方式,在120名被询问的家长中,74名支持这项取消体育活动的计划。计算总体比例的95%和99%置信区间。作业作业o 一所学校想调查家长对于一项取消学生课外体育活动以削减成本的建议的态度。学校委员会采取电话调查的方式,在120名被询问的家长中,74名支持这项取消体育活动的计划。计算总体比例的95%和99%置信区间。附:希腊字母表附:希腊字母表 大写 小写 读音 A Alpha B Beta Gamma Delta Epsilon Zeta Nu Xi Omicron Pi Rho Sigma Theta Iota Kappa Lambada Mu Tau Upsilon Phi Chi Psi Omega Eta

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!