第46讲 抽样方法、用样本估计总体及正态分布

上传人:suij****uang 文档编号:163870101 上传时间:2022-10-23 格式:DOCX 页数:16 大小:201.75KB
收藏 版权申诉 举报 下载
第46讲 抽样方法、用样本估计总体及正态分布_第1页
第1页 / 共16页
第46讲 抽样方法、用样本估计总体及正态分布_第2页
第2页 / 共16页
第46讲 抽样方法、用样本估计总体及正态分布_第3页
第3页 / 共16页
资源描述:

《第46讲 抽样方法、用样本估计总体及正态分布》由会员分享,可在线阅读,更多相关《第46讲 抽样方法、用样本估计总体及正态分布(16页珍藏版)》请在装配图网上搜索。

1、第 46 讲 抽样方法、用样本估计总体及正 态分布【课程要求】1理解随机抽样的必要性和重要性2会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法;搞清三 种抽样的联系与区别3了解分布的意义与作用,会列频率分布表,会画频率分布直方图、频率折线图、茎 叶图,理解它们各自的特点4能从样本数据中提取基本的数字特征(如平均数、标准差)5会用样本的频率分布估计总体分布,会用样本的基本数字特征,理解用样本估计总 体的思想6会用随机抽样的基本方法和样本估计总体的思想解决一些简单实际问题7利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义回扣教材对应学生用书 p127 基础检测】概念辨

2、析1判断下列结论是否正确(请在括号中打“厂或“X”)(1) 简单随机抽样是一种不放回抽样()(2) 简单随机抽样每个个体被抽到的机会不一样,与先后有关()(3) 平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(4) 一组数据的众数可以是一个或几个,那么中位数也具有相同的结论()(5) 从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了()(6) 茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的 数据可以只记一次()(7) 在频率分布直方图中,最高的小长方形底边中点的横坐标是众数()(8) 在频率分布直方图中,众数左边和

3、右边的小长方形的面积和是相等的()(9) 正态分布中的参数卩和G完全确定了正态分布,参数卩是正态分布的均值,G是正态分布的标准差()(10) 一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布()答案丁 X (3X (5(6)X(7) V (8)X (9) V (10) V教材改编2.必修3p100A组T1在“世界读书日”前夕,为了了解某地5000名居民某天的阅读 时间,从中抽取了 200名居民的阅读时间进行统计分析在这个问题中, 5000名居民的阅 读时间的全体是()A. 总体B. 个体C. 样本的容量D. 从总体中抽取的一个样本解析 由题目条件

4、知, 5000 名居民的阅读时间的全体是总体;其中1 名居民的阅读时 间是个体;从5000 名居民某天的阅读时间中抽取的200 名居民的阅读时间是从总体中抽取 的一个样本,样本容量是 200.答案A3. 必修3p100A组T2(1)个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A. 4 B. 8 C. 12 D. 16解析设频数为n,则32 = 0.25 ,n 32X4 = 8.答案 B)4. 必修3p81A组T1若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这 组数据的中位数和平均数分别是(A. 91.5 和 91.5 B. 91.5 和 92C. 91 和

5、 91.5 D. 92 和 929192解析这组数据由小到大排列为87 ,89 ,90 ,91 ,92 ,93 ,94 ,96 ,.中位数是 2= 91.5 , 8789909192939496平均数x =91.5.答案 A5.必修3p71T1 如图是100位居民月均用水量的频率分布直方图,则月均用水量为2,答案 256.选修2-3p75B组T2已知随机变量X服从正态分布N(3, 1),且P(X2c1)=P(Xvc + 3),则 c=.解析XN(3 , 1),正态曲线关于x = 3对称,且 P(X2c1)= P(Xc3),4 2c 1+c + 3 = 3X2, .c = 3 4答案3易错提醒7

6、为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为x ,则m,n, x的大小关系为(用“”连接)颖数解析 由图可知,30 名学生得分的中位数为第15 个数和第16 个数(分别为5,6)的平 均数,即m = 5.5 ;又5出现次数最多,故n = 5 ;-2X3+3X4+10X5+6X6+3X7+2X8+2X9+2X10x=_305.97.故 nmx .答案 nmx8设随机变量g服从正态分布N, 02),函数f(x)=x2+4x+g没有零点的概率是扌, 则卩等于()A1 B2C. 4 D.不能确定解析当函数f(

7、x) = x2 + 4x + g没有零点时,A=16 - 4g4,根据正态曲线的对 称性,当函数f(x) = x2 + 4x + g没有零点的概率是1时,卩=4.答案 C【知识要点】1简单随机抽样(1) 定义:设一个总体含有N个个体,从中 逐个不放回地抽取n个个体作为样本 (nWN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫 做简单随机抽样.(2) 最常用的简单随机抽样的方法:抽签法和随机数法2. 系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1) 编号:先将总体的N个个体 编号(2) 分段:确定 分段间隔k ,对编号讲行 分段,当N(n是样本容量)是

8、整数时, 取k=N(3) 确定首个个体:在第1段用 简单随机抽样 确定第一个个体编号l(lWk).(4) 获取样本:按照一定规则抽取样本,通常是将1加上间隔k得到第2个个体编号_1 +k ,再加k得到第3个个体编号1+2k ,依次进行下去,抽取样本1+(n-1)k,直到 获取整个样本.3分层抽样(1) 定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例从各层 独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层 抽样(2) 分层抽样的应用范围:当总体是由 差异明显的几个部分组成 时,往往选用分层 抽样.4分层抽样的步骤(1)分层:将总体按某种特征分成若干部分

9、(2)确定比例:计算各层的个体数与总体的个体数的比(3) 确定各层应抽取的样本容量(4) 在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样 组成样本5用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数:将一组数据按照从大到小(或从小到大)排列,处在 中间位置 上的一个数据(或中间两 位数据的平均数)叫做这组数据的中位数.(2)平均数与方差如果这n个数据是X, x2,x ,那么x=nxi_,叫做这n个数据的平均数;1 2n如果这n个数据是X, x2,x,那么S2=1 芸 区x)2_,叫做这n个数据12nn 6频率分布

10、直方图(1) 通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的 分布:另一种是用 样本的数字特征(如平均数、标准差等)估计总体数字特征.(2) 作频率分布直方图的步骤 求极差(即一组数据中最大值与最小值的差). 决定组距与组数. 将数据分组. 列频率分布表. 画频率分布直方图.(3) 在频率分布直方图中,纵轴表示组率数据落在各个小组内的频率用 各小长 方形面积表示.各小长方形的面积总和等于1.7频率分布折线图和总体密度曲线(1) 频率分布折线图:连接频率分布直方图中各小长方形上端的 中点.,就得到频率 分布折线图.(2) 总体密度曲线:随着样本容量的增加组距减小,相应的频

11、率折线图会越来越接 近于一条光滑曲线,即总体密度曲线.8. 茎叶图的优点(1) 统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到.(2) 茎叶图中的数据可以随时记录,随时添加,方便记录与表示.9. 正态分布(1)函数和,(x)=_2e-(乂?)I, xR的图象称为正态分布密度曲线,简称正态曲线.对于任何实数aVb,随机变量X满足P(aVXWb)帆 (x)dx ,则称X的分布为 正态分布,正态分布完全由参数卩和G确定.因此正态分布常记作 N(卩,G2)_,如果 X服从正态分布,则记为 XN(u, G2).(2)正态分布的特点:曲线 位于X轴上方与X轴不相交;曲线关于直线 x=u1

12、;当G 定时,对称;曲线在x=u 曲线的位置由卩确定,曲线随着卩的变化而沿x轴平移;当卩一定时,曲线的形状由G 确定,G越大,曲线越“矮胖”,表示总体的分布越 分散;G越小,曲线越“高瘦”, 表示总体的分布越 集中. xW(卩一8, g+8), P(x) = 0.6826; xW(卩一28,卩+28), P(x) = 0.9544;xW(卩一38,卩+38), P(x) = 0.9974.萬考常考考点44对应学生用书p128_ 抽样方法及应用例1(1)在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取 20 个作为样本:采用简单随机抽样法,将零件编号为00, 01, 02,

13、,99,抽出20个;采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个; 采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个若用这三种抽样方式抽样,每个零件被抽到的概率分别是P, p2,p3,则p1,p2,p3的 值分别是解析 由抽样方法的性质知,抽样过程中每个个体被抽到的概率都相等,这个比例只 与样本容量和总体有关,即不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是15.答案p1 = p2 = p3 = |(2)某学校高二年级为了表彰第一次月考成绩优异者,需要5件不同的奖品,这些奖品 要从由1200编号的200件不同奖品中随机抽取确定,

14、用系统抽样的方法确定其中一件奖 品编号为6,则其他四件奖品编号为解析根据系统抽样可知,样本容量为5,所以分5组,分组间隔为k = 20 = 40,再 根据系统抽样编号为1 , 1 + k , l + 2k ,l + (n - 1)k可知,若一件编号为6,则其余四件编 号依次为:46, 86, 126, 166.点在基础知识的了解与简单应用.0训练巩固答案46 , 86 , 126 , 166 小结分层抽样、系统抽样的基础知识的课程要求是“了解”和“会”,因此复习时重1. 利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余 下的每个个体被抽到的概率为3则在整个抽样过程中,

15、每个个体被抽到的概率为()11510a.4 B.3 c.j4 D.27解析由题意知说二,得n = 28,所以整个抽样过程中每个个体被抽到的概率为骂二 14,故选c.答案 C 2某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按12,,840随机编号,则抽取的42人中,编号落入区间481, 720的人数为() A11 B12 C13 D14解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间481 , 720的人数为720 - 4802024020答案B3. 某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3:5:7,现用分层抽样 的方法抽出容量为n的样本

16、,其中甲种产品有18件,则样本容量n等于()A54 B90 C45 D1263解析依题意得Xn= 18,解得n = 90,即样本容量为90.357答案B2频率分布直方图及应用:一例 2某网络营销部门随机抽查了某市200名网友在2019年11月11日的网购金额,所得数据如下表:网购金额(单位:千兀)人数频率(0,1160.08(1, 2240.12(2, 3xP(3, 4yq(4, 5160.08(5, 6140.07合计2001.00已知网购金额不超过3千元与超过3千元的人数比恰为3 : 2.(1)试确定 x, y, p, q 的值,并补全频率分布直方图(如图);(2)该营销部门为了了解该市网

17、友的购物体验,从这 200 名网友中,用分层抽样的方法 从网购金额在(1, 2和(4, 5的两个群体中确定5人进行问卷调查,若需从这5人中随机选取2人继续访谈,则此2人来自不同群体的概率是多少?O-IS i).4ii 035I3H0,230.200.10 tl.C?频率/俎距12 34 5 6谧凱千兀16 + 24 + x + y+ 16+ 14 = 200 ,解析(1)根据题意有16 + 24 + x 3ly+16+14 2x = 80 , 解得2 .c 5 6 H41 2 63 0 252 0 7 S(1)求 x,y 的值;(2)若估计该团队中一天行走步数少于40千步的人数比处于40,50

18、)千步的人数少12人 求n的值.解析 (1)因为甲、乙两班行走步数的平均值都为44,所以 X 甲=110 X (26 + 32 + 42 + 40 + x + 45 + 46 + 48 + 50 + 52 + 53) = 44 ,解得 x = 6.所以 X 乙=110 X (26 + 34 + 30 + y + 41 + 42 + 46 + 50 + 52 + 57 + 58) = 44 ,解得 y = 4.23 18(2)该团队中一天行走步数少于40千步的频率为苛弓,处于40 ,50)千步的频率为2025,则估计该团队中一天行走步数少于 40 千步的人数比处于40, 50)千步的人数的频率之

19、320-又因为该团队中一天行走步数少于40千步的人数比处于40, 50)千步的人数少12人,3所以 n X 20 =12,解得 n 二 80.训练巩固5.某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打 出的分数的茎叶图如图所示(其中m为数字09中的一个),去掉一个最高分和一个最低分 后,甲,乙两名选手得分的平均数分别为a,则一定有()A. a1a2 B. a2a1C. a1 = a2 D. a1,a2的大小与m的值有关 解析 由茎叶图知,1 5545 a】二 80 +5二 84 ,54+ 4+ 6+ 4+ 7a2= 80+= 85,故选 B.4样本的数字特征二例4甲、

20、乙两名同学8次数学测验成绩如茎叶图所示,!1,12分别表示甲、 乙两名同学8次数学测验成绩的平均数,S, s2分别表示甲、乙两名同学8次数学测验成绩 的标准差,则有()甲乙7/-5 (j呂”、1 2921A Xx 2, SVS2B. x i= x 2,S1VS2C. X= x2,S = s2D. x 1V x 2,S1S2解析 由茎叶图可知,甲的成绩分别为:78,79,84,85,85,86,91,92.乙的成绩分别为:77,78,83,85,85,87,92,93. x = 1(78 + 79+ 84+ 85+ 85+ 86+ 91 + 92)二 85 ,s二 |(78 - 85)2 + (

21、79 - 85)2 + (84 - 85)2 + 0 + 0 + (86-85)2 + (91-85)2 + (92 - 85)2二 *;x 2 二(77 + 78 + 83 + 85 + 85 + 87 + 92 + 93)二 85 ,S2 二 |(77 - 85)2 + (78 - 85)2 + (83 - 85)2 + 0 + 0 + (87-85)2 + (92-85)2 + (93 - 85)2二詈, xi= x2, S1VS2.答案 B小结利用频率分布直方图估计样本的数字特征的方法(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以 估计中位数值(2)平均

22、数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和(3)众数:最高的矩形的中点的横坐标.:训练巩固笫四次 J:三17; 苗-,曬 第6.甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图: 得(1) 分别求出两人得分的平均数与方差;(2) 根据图和上面算得的结果,对两人的训练成绩作出评价解析 (1)由图象可得甲、乙两人五次测试的成绩分别为甲: 10 分, 13 分, 12 分, 14 分, 16 分;乙: 13 分, 14 分, 12 分, 12 分, 14 分-10+13 + 12+14+16x 甲=5=13 ;13+ 14+ 12+ 12+ 14x 乙=5=13,S

23、甲 = 1(10 -13)2 + (13-13)2 + (12-13)2 + (14 -13)2 + (16-13)2= 4;s乙 = |(13 -13)2 + (14-13)2 + (12-13)2 + (12 -13)2 + (14-13)2= 0.8.(2)由s甲s乙,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提 高,而乙的成绩则无明显提高.正态分布及应用I例5 (1)设随机变量g服从标准正态分布N(0, 1),已知P(gW 1.96) = 0.025, 则 P(|g|1.96)等于()A0.025 B0.950C0.050 D0.97

24、5解析本题考查变 量服从标准正态分布的概率计算由题意P(|g|1.96) = P(-1.96g1.96) = 1 -2P(gW - 1.96) = 1 - 2X0.025 = 0.950.答案 B(2)已知服从正态分布N(g, G2)的随机变量在区间(卩一g,卩+g),(卩一2g,卩+2g)和(卩一36 |li+3g)内取值的概率分别为68.3%, 95.4%和99.7%.某校为高一年级1000名新生每人定 制一套校服,经统计,学生的身高(单位:cm)服从正态分布(165, 52),则适合身高在155 175 cm范围内的校服大约要定制()A683 套 B954 套C972 套 D997 套解

25、析.p(155vxv175) = P(y - 2gxp + 2g) = 95.4% ,要定制1000X95.4% = 954套.答案 B(3) 在如图所示的正方形中随机投掷 10000 个点,则落入阴影部分(曲线 C 为正态分布 N(0, 1)的密度曲线)的点的个数的估计值为()附:若 XN(卩,G2),则 P(yg走进高老(1) 求直方图中a的值;(2) 根据频率分布直方图估计样本数据的众数、中位数各是多少(结果保留整数);(3) 由频率分布直方图可以认为,这种产品的质量指标值Z服从正态分布N(200,12.22), 试计算数据落在(187.8,212.2)上的概率(参考数据:若 ZN(y,

26、 G2),则 P(g-GZg+o) = 0.6827, P(卩一2gZy+2G)=0.9545)解析由已知得(0.002 + 0.009 + 0.022 + a + 0.024 + 0.008 + 0.002) X10= 1 , 解得 a = 0.033.195205(2) 众数二 一2一 = 200 ;由前三组频率之和 0.020.090.22= 0.330.50,故中位数位于第四组195, 205)内,0.500.33中位数估计为195+0033 心200.(3) 因为 ZN(200 ,12.22),从而 P(187.8Z212.2) = P(200 - 12.2Z200 + 12.2)

27、= 0.6827.对应学生用书 p1311. (2017全国卷III理)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的 折线图.月接徘游客宅1万人)I - M 6 7 H 7l:l I: ? I ;】h 7 K T 丨寫 | I :、4 V & ? $ |匸 I.?Hl 冷M V|J;11丨廿;根据该折线图,下列结论错误的是() A.月接待游客量逐月增加B年接待游客量逐年增加C. 各年的月接待游客量高峰期大致在7, 8月D. 各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平衡

28、解析 根据折线图可知, 2014年8月到9月、2014年10月到1 1月等月接待游客量都是减少,所以A错误.答案 A2. (2017全国卷I理)为了监控某种零件的一条生产线的生产过程,检验员每天从该生 产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条 生产线正常状态下生产的零件的尺寸服从正态分布Ng, G2).(1) 假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在3g, y+3o)之 外的零件数,求P(X21)及X的数学期望;(2) 一天内抽检零件中,如果出现了尺寸在(卩一3o,卩+3g)之外的零件,就认为这条生产 线在这一天的生产过程可能出现了

29、异常情况,需对当天的生产过程进行检查.(1) 试说明上述监控生产过程方法的合理性;(ii)下面是检验员在一天内抽取的16个零件的尺寸;995 10.12 9.96 9.96 10.01 9.92 9.98 10.0410. 26 9.9110.1310.02 9.22 10.04 10.05 9.95 经计算得 x =16史令=9.97, s=古史(X. x ) 2=16 (史x? 16 x 2)心0.212,其中x.为抽取的第i个零件的尺寸,i =1,16.AA用样本平均数x作为卩的估计值卩,用样本标准差s作为G的估计值6利用估计值判断A A A A是否需对当天的生产过程进行检查?剔除(卩一

30、36 g+3o)之外的数据,用剩下的数据估计卩 和o(精确到0.01).附:若随机变量Z服从正态分布N,02),贝9 P(g 3gZy + 3g)= 0.9974.0.9974160.9592,、J0580.09.解析抽取的一个零件的尺寸在(卩-30 ,g + 3o)之内的概率为0.9974,从而零件的尺 寸在,卩+ 3o)之外的概率为0.0026,分析可知XB(16 , 0.0026).因此P(X21)=1 -P(X = 0) = 1 - 0.9974160.0408.X 的数学期望为 EX 二 16X0.0026 二 0.0416.(2) (i)如果生产状态正确,一个零件尺寸在(p- 3o

31、,卩+ 3o)之外的概率只有0.0026,一天 内抽取的16个零件中,出现尺寸在(卩-3o ,卩+ 3o)之外的零件的概率只有0.0408,发生的 概率很小因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现 了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的-AA(ii)由x =9.97 , s0.212,得卩的估计值为g = 9.97 , o的估计值为0 = 0.212,由样本数A A A A据可以看出有一个零件的尺寸在-30 , g + 3o)之外,因此需对当天的生产过程进行检查.A A A A易I除-30 , |li + 3o)之外的数据9.22,剩下数据的平均数为5(16X9.97 - 9.22) = 10.02 ,因此卩的估计值为10.02.Sx2= 16X0.2122+ 16X9.9721591.134.=1 .A A A A易I除-30 , g + 3o)之外的数据9.22,剩下数据的样本方差为右(1591.134 - 9.222 - 15X10.022)5.008 ,因此0的估计值为;0.008心0.09.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!