随机样本和抽样分布.ppt
《随机样本和抽样分布.ppt》由会员分享,可在线阅读,更多相关《随机样本和抽样分布.ppt(38页珍藏版)》请在装配图网上搜索。
第五章随机样本和抽样分布 数理统计的基本概念 一些常用的抽样分布 上侧 分位数 一 总体和样本 1 总体 研究对象的全体 通常指研究对象的某项数量指标 我们常用X Y Z等大写字母来表示总体 组成总体的每个基本单元叫做个体 例如 某学校全体女生的身高的全体是一个总体 而每一个女生的身高是一个个体 由于每个个体的出现是随机的 所以个体可以看作一个随机变量 因此 随机变量的分布就是个体在总体中的分布 则总体就可以用一个随机变量及其分布来描述 1数理统计的基本概念 2 样本 定义 设X是具有分布函数F的随机变量 若是具有同一分布函数F的相互独立的随机变量 则称为从总体X中得到的容量为n的简单随机样本 简称为样本 其观察值称为样本值 由定义知 若为X的一个样本 则的联合分布函数为 若设X的概率密度为f 则的联合概率密度为 对于样本需要强调两点 样本并非一堆杂乱无章无规律可循的数据 它是受随机性影响的一组数据 因此 用概率论的话说 就是每个样本既可以视为一组数据 又可视为一组随机变量 这就是所谓样本的二重性 当通过一次具体的试验 得到一组观测值 这时样本表现为一是组数据 但这组数据的出现并非必然的 它只能以一定的概率 或概率密度 出现 这就是说 当考察一个统计方法是否具有某种普遍意义下的效果时 又需要将其样本视为随机变量 而一次具体试验得到的数据 则可视为随机变量的一个实现值 样本也不是任意一组随机变量 我们要求它是一组独立同分布的随机变量 同分布就是要求样本具有代表性 独立是要求样本中各数据的出现互不影响 就是说 抽取样本时应该是在相同条件下独立重复地进行 例1 设一组抽奖券共10000张 其中有5张有奖 问连续抽取3张均有奖的概率为多少 为了讨论这个问题 不妨设要求该事件的概率 实际上即是求联合概率分布在处的值 但题中没有说明 连续抽取 是 有放回的 还是 无放回的 不妨都计算一下 无放回时 有放回时 显然 中的抽样方式不是独立的 每次抽样的结果都将影响下一次抽样的分布 这种抽样不是我们通常研究的抽样 而 中的抽样 则是多次独立的抽样 它们是同分布的 即我们通常称为的随机抽样 这样得到的数据 即是我们常研究的简单随机样本 或就直接称为样本 由此可以看出 对于样本 5 1 如果每个的共同分布为 则样本 5 1 的分布为相应地 若有共同概率密度 则 5 1 的概率密度为 二 理论分布与经验分布 1 总体是一个随机变量 总体的分布就称为理论分布对于总体的分布函数 未知 设有它的样本我们可以从样本出发 找到一个已知量来近似它 这就是经验分布函数 它的构造方法是这样的 设诸观察值按从小到大可排成定义 2 直方图 设是总体的一个样本 又设总体具有概率密度 如何用样本来推断 注意到现在的样本是一组实数 因此 一个直观的办法是将实轴划分为若干小区间 记下诸观察值落在每个小区间中的个数 根据大数定律中频率近似概率的原理 从这些个数来推断总体在每一小区间上的密度 具体做法如下 1 找出 取略小于 略大于 3 记 落在小区间中观察值的个数 频数 计算频率 列表分别记下各小区间的频数 频率 4 在直角坐标系的横轴上 标出各点 分别以为底边 作高为的矩形 即得直方图 2 将 分成 个小区间 小区间长度可以不等 都要有若干观察值 而且观察值不要落在分点上 设分点为 在分小区间时 注意每个小区间中 三 样本数字特征与统计量 定义1 4 设为来自总体X的一个样本 g是的函数 若g是连续函数 且g中不含任何未知参数 则称是一个统计量设是相应于样本的样本值 则称是的观察值 注 统计量是随机变量 1 常用统计量 样本均值 样本方差 样本标准差 样本k阶 原点 矩 样本k阶中心矩 其中 2 它们的观察值分别为 样本均值 样本方差 样本标准差 样本k阶矩 样本k阶中心矩 例2 设是出自总体的样本 其中为未知参数 则是统计量 但诸如等均不是统计量 因它含有未知参数或 同理 我们可以自己来做下面一个例题 例3 设为来自总体的一个样本 其中未知 已知 问下列随机变量中那些是统计量 例4 从某地区随机抽取50户农民 调查其年收入情况 得到下列数据 每户人均元 9248009167048701040824690574490972988126668476494040880461085260275478896270471285488876884888211928208786148467468287928726966449268081010728742850864738试对该地区农民收入的水平和贫富悬殊程度做个大致分析 记各农户的年收入数为 则考虑这样 我们可以从得出该地区农民平均人均收人水平属中等 从可以得出该地区农民贫富悬殊不大的结论 一 样本均值的分布 统计量是样本的函数 它是一个随机变量 统计量的分布称为抽样分布 定理2 1设是来自正态总体的一个样本 则样本的任一确定的线性函数也服从正态分布 2一些常用的抽样分布 证 样本相互独立且与总体有相同的分布 因为独立正态分布的线性组合仍为正态分布 则我们只求和即可 所以服从正态分布特别的 对样本均值有将标准化有 二 分布 定义2 1设为来自正态总体的样本则称统计量所服从的分布为自由度是的分布记为 定理2 2分布的密度函数为 其中 称为伽马函数 定义为 分布的性质 1 且独立 则 2 证 所以 1 2 分布图 图描绘了分布密度函数在时的图形 可以看出 随着的增大 的图形趋于 平缓 其图形下面积的重心亦逐步往右下移动 定理2 3 设是来自正态总体的样本 则样本方差与样本均值相互独立 且 证明略 三 定理2 4 分布的密度函数为 分布 定义2 2 独立 则称随机变量所服从的分布为自由度是的分布 记作 从图形我们可看出 随着的增大 的密度曲线与的密度曲线越来越接近 一般若 就可认为它基本与相差无几了 1 分布图 定理2 5 设是来自正态总体的一个样本 则 证明 且它们独立 则由t 分布的定义 即 定理2 6 设与分别是具有相同方差的两个正态总体 的样本 且它们独立 设分别是两个样本的均值 分别是两个样本的方差 则有 证 所以 且它们独立 则 由分布的定义 即 四 分布 定义2 3 若 独立则称随机变量所服从的分布为自由度是的分布 记作若则定理2 7 分布的密度函数为 证略 下图描绘了几种分布的密度函数曲线 分布曲线图 定理2 8 设和分别是来自正态总体和的样本 且它们互相独立 则 证明留做练习 3上侧分位数 定义 连续型随机变量的密度函数为设满足若数满足则称为此概率分布的上侧分位数 什么是上侧分位数 一 标准正态分布的上侧分位数 定义 标准正态分布的上侧分位数记作 是满足的 本书中把专门用来表示标准正态分布的上侧分位数 根据分布的对称性 显然有 的值可以查阅本书附表1 例如 二 分布的上侧分位数 定义 对分布的上侧分位数 应满足 对于较大的 本书中 近似的有 其中是标准正态分布的上侧分位数 例如 三 分布的上侧分位数 定义 分布的上侧分位数 应满足 由对称性可知 当 四 分布的上侧分位数 定义 分布的上侧分位数应满足 分布的上侧分位数有如下性质 上式常用来求分布表中未列出的一些上侧分位数 例如 五 分位数和双侧分位数 1 分位数定义 满足的叫做的分位数 显然因此的分位数为的上侧分位数 例如 满足 则 2 双侧分位数定义 满足 的称为的双侧分位数 显然 为的上侧分位数 为的上侧分位数 例如 求使 则- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 随机 样本 抽样 分布
装配图网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文