2017届高考数学一轮总复习第七章概率与统计第42讲抽样方法与统计分析课件文新人教A版.ppt

上传人:san****019 文档编号:17093667 上传时间:2020-11-08 格式:PPT 页数:51 大小:12.30MB
收藏 版权申诉 举报 下载
2017届高考数学一轮总复习第七章概率与统计第42讲抽样方法与统计分析课件文新人教A版.ppt_第1页
第1页 / 共51页
2017届高考数学一轮总复习第七章概率与统计第42讲抽样方法与统计分析课件文新人教A版.ppt_第2页
第2页 / 共51页
2017届高考数学一轮总复习第七章概率与统计第42讲抽样方法与统计分析课件文新人教A版.ppt_第3页
第3页 / 共51页
资源描述:

《2017届高考数学一轮总复习第七章概率与统计第42讲抽样方法与统计分析课件文新人教A版.ppt》由会员分享,可在线阅读,更多相关《2017届高考数学一轮总复习第七章概率与统计第42讲抽样方法与统计分析课件文新人教A版.ppt(51页珍藏版)》请在装配图网上搜索。

1、第 42讲 抽样方法与统计分析 【学习目标】 1 . 了解三种抽样方法:简单随机抽样、分层抽样、 系统抽样 . 2 . 掌握 “ 一表三图 ” :频率分布表、频率分布直方 图、折线图、茎叶图 . 3 . 会求 “ 六种数 ” :众数、中位数、平均数、极差、 方差、标准差 . 【基础检测】 1 . (2015 福建 ) 某校高一年级有 900 名学生 , 其中 女生 400 名 , 按男女比例用分层抽样的方法 , 从该年 级学生中抽取一个容量为 45 的样本 , 则应抽取的男生 人数为 _ . 【解析】 根据总体中每个个体被抽到的可能性相 等列方程求解 . 设男生抽取 x 人 , 则有 45 9

2、00 x 900 400 , 解得 x 25. 25 2 . 对一个容量为 N 的总体抽取容量为 n 的样本 , 当 选取简单随机抽样、系统抽样和分层抽样三种不同方法 抽取样本时 , 总体中每个个体被抽中的概率分别为 p 1 , p 2 , p 3 , 则 ( ) A . p 1 p 2 p 3 B.p 2 p 3 p 1 C . p 1 p 3 p 2 D.p 1 p 2 p 3 D 【解析】 根据三种抽样方法的特征求解 . 由于三种抽样过程中 , 每个个体被抽到的概率都 是相等的 , 因此 p 1 p 2 p 3 . 3 . 为了解 1 000 名学生的学习情况 , 采用系统抽样 的方法

3、, 从中抽取容量为 40 的样本 , 则分段的间隔为 ( ) A . 50 B.4 0 C.2 5 D.20 C 【解析】 根据系统抽样的特点求解 . 根据系统抽样的特点可知分段间隔为 1 000 40 25 , 故选 C . 4 . (2015 重庆 ) 重庆市 2013 年各月的平均气温 ( ) 数据的茎叶图如下: 则这组数据的中位数是 ( ) A . 19 B.20 C.21.5 D.23 B 【解析】 由茎叶图知 , 这组数据的中位数是 20 20 2 20. 5 . 为了研究某药品的疗效 , 选取若干名志愿者进行临床试 验 . 所有志愿者的舒张压数据 ( 单位: kPa ) 的分组区

4、间为 12 , 13 ) , 13 , 14 ) , 14 , 15 ) , 15 , 16 ) , 16 , 17 , 将其按从左到右的顺序分别编号为第 一组 , 第二组 , , 第五组 . 如图是根据试验数据制成 的频率分布直方图 . 已知第一组与第二组共有 20 人 , 第三组中没有疗效的有 6 人 , 则第三组中有疗效的人 数为 ( ) A.6 B.8 C . 12 D.18 【解析】 依据频率分布直方图及频率公式求解 .志 愿者的总人数为 20 ( 0.16 0.24 ) 1 50 , 所以第三组 人数为 50 0.36 18 , 有疗效的人数为 18 6 12. C 【知识要点】

5、1 抽样方法 (1) 抽样要具有随机性、等可能性,这样才能通过对 样本的分析和研究更准确的反映总体的情况,常用的抽 样方法有 、 、 (2) 简单随机抽样是指一个总体的个数为 N ( 较小的 有限数 ) ,通过逐个抽取一个样本,且每次抽取时每个个 体被抽取的概率相等简单随机抽样的两种 常用方法 为 简单随机抽样 分层抽样 系统抽样 抽签法和随机数表法 (3) 分层抽样是总体由差异明显的几部分组成,常将 总体按差异分成几个部分,然 后 ,其中所 分成的各部分叫做 (4) 系统抽样是当总体中的个数较多时,将总体均分 成几部分,按事先 在各部分抽取 按各部分所占的比值进行抽样 层 确定的规则 2 总

6、体分布的估计 (1) 作频率分布直方图的步骤: 求极差 ( 即一组数据中最大值与最小值的差 ) 决定组距与组 数 将数据分组 分组 频数 频率 累计频率 t 0 , t 1 ) r 1 f 1 f 1 t 1 , t 2 ) r 2 f 2 f 1 f 2 t k 1 , t k r k f k f 1 f 2 f k 1 画频率分布直方图,将区间 a , b ) 标在横轴上, 纵轴表示频率与组距的比值,以每个组距为底,以各频 率除以组距 的商为高,分别画矩形,共得 k 个矩形,这 样得到的图形叫做 频率分布直方图 列频率分布表 (下图 ) 频率分布直方图的性质: 第 i 个矩形的面积等于 样

7、本值落入区间 t i 1 , t i ) 的频率; 由于 f 1 f 2 f k 1 ,所以所有小矩形的面积的和为 1. (2) 连接频率分布直方图中各小长方形上边的中点, 就得到频率分布折线图,随着样本容量的增加,折线图 会越来越近似于一条光滑曲线,称之 为 (3) 统计中还有一种被用来表示数据的图叫茎叶图, 茎是 ,叶是从 总体密度曲线 中格中间的一列数 茎旁边上长出来的数 用茎叶图表示数据有两个突出的优点:一是从统计 图上没有原始信息的损失,所有的数据信息都可以从茎 叶图中得到;二是茎叶图可以在比赛时随时记录,方便 记录与表示 3 平均数和方差的计算 (1) 如果有 n 个数据 x 1

8、, x 2 , , x n ,则 x 叫做这组数据的平均数, s 2 叫做这组数据 的方差,而 s 叫做标准差 (2) 公式 s 2 1 n ( x 1 x 2 x n ) 1 n ( x 1 x ) 2 ( x 2 x ) 2 ( x n x ) 2 1 n ( x 1 2 x 2 2 x n 2 ) n x 2 (3) 当一组数据 x 1 , x 2 , , x n 中各数较大时, 可以 将各数据减去一个适当的常数 a ,得到 x 1 x 1 a , x 2 x 2 a , , x n x n a ,则 s 2 4 利用频率分布直方图估计样本的数字特征 (1) 中位数:在频率分布直方图中

9、, 中位数左边和右 边的直方图的面积应该相等 , 由此可以估计中位数值 . (2) 平均数:平均数的估计值等于每个小矩形的面积 乘以矩形底边中点横坐标之和 . (3) 众数:最高的矩形的中点的横坐标 . (4) 极差最大数最小的数 . 1 n ( x 1 2 x 2 2 x n 2 ) n x 2 一、频率分布直方图 例 1 (2015 全国新课标 ) 某公司为了解用户对其产 品的满意度 , 从 A , B 两地区分别随机调查了 40 个用 户 , 根据用户对产品的满意度评分 , 得到 A 地区用户 满意度评分的频率分布直方图和 B 地区用户满意度评 分的频数分布表 . B 地区用户满意度评分

10、的频数分布表 满意度评 分分组 50 , 60 ) 60 , 70 ) 70 , 80 ) 80 , 90 ) 90 , 100 频数 2 8 14 10 6 (1) 在下图中作出 B 地区用户满意度评分的频率分布直 方图 , 并通过直方图比较两地区满意度评分的平均值及分散 程度 ( 不要求计算出具体值 , 给出结论即可 ) . (2) 根据用户满意度评分 , 将用户的满意度分为三个 等级: 满意度评 分 低于 70 分 70 分到 89 分 不低于 90 分 满意度等 级 不满意 满意 非常满意 估计哪个地区用户的满意度等级为不满意的 概率 大?说明理由 . 【解析】 (1 ) 如图所示 .

11、 通过两地区用户满意度评分的频率分布直方图 可以 看出 , B 地区用户满意度评分的平均值高于 A 地区用户 满意度评分的平均值; B 地区用户满意度评分比较集中 , 而 A 地区用户满意度评分比较分散 . (2) A 地区用户的满意度等级为不满意的概率大 . 记 C A 表示事件: “ A 地区用户的满意度等级为不 满意 ” ; C B 表示事件: “ B 地区用户的满意度等级为不 满意 ” . 由直方图得 P (C A ) 的估计值为 (0.01 0.02 0.03) 10 0.6 , P (C B ) 的估计值为 (0.005 0.02) 10 0.25. 所以 A 地区用户的满意度等级

12、为不满意的概率大 . 【点评】 从直方图中估计 (1) 平均数:各组的平均数 ( 矩形底边的中点 ) 本组的 频率 ( 本矩形的面积 ) (2) 众数:最高矩形的底边的中点 (3) 中位数:以中位数为界把直方图分成左右两部份 , 每部分的面积各为 0.5. 二、用茎叶图统计分析数据 例 2 某市为了考核甲、乙两部门的工作情况 , 随机 访问了 50 位市民 . 根据 这 50 位市民对这两部门的评分 ( 评分越高表明市民的评价越高 ) , 绘制茎叶图如下: 甲部门 乙部门 3 59 4 4 0448 97 5 122456677789 976653321 10 6 01 1234688 988

13、77766555554443 332100 7 001 13449 6655200 8 123345 632220 9 01 1456 10 000 (1) 分别估计该市的市民对甲、乙两部门评分的中 位数; (2) 分别估计该市的市民对甲、乙两部门的评分高 于 90 的概率; (3) 根据茎叶图分析该市的市民对甲、乙两部门的 评价 . 【解析】 (1) 由所给茎叶图知 , 50 位市民对甲部门 的评分由小到大排序 , 排在第 25 , 26 位的是 75 , 75 , 故样本中位数为 75 , 所以该市的市民对甲部门评分的 中位数的估计值是 75. 50 位市民对乙部门的评分由小到大排序 ,

14、排在第 25 , 26 位的是 66 , 68 , 故样本中位数为 66 68 2 67 , 所以该市的市民对乙部门评分的中位数的估计值是 67. (2) 由所给茎叶图知 , 50 位市民对甲、乙部门的评 分高于 90 的比率分别为 5 50 0.1 , 8 50 0.16 , 故该市的 市民对甲、乙部门的评分高于 90 的概率的估计值分别 为 0.1 , 0.1 6. (3) 由所给茎叶图知 , 市民对甲部门的评分的中位 数高于对乙部门的评分的中位数 , 而且由茎叶图可以 大致看出对甲部门的评分的标准差要小于对乙部门的 评分的标准差 , 说明该市市民对甲部门的评价较高、 评价较为一致 , 对

15、乙部门的评价较低、评价差 异较大 . 【点评】 1. 茎叶图中数据排序后 , 可求中位数 , 近似估计平均数 . 2 . 数据集中与离散程度可估计数据一致性与差异 性 . 三、统计图表与概率综合 例 3 (2015 安徽 ) 某企业为了 解下属某部门对本企业职工的 服务情况 , 随机访问 50 名职工 . 根据这 50 名职工对该部门的评 分 , 绘制频率分布直方图 ( 如图 所示 ) , 其中样本数据分组区间 为: 40 , 5 0) , 50 , 60 ) , , 80 , 90 ) , 90 , 100 . (1) 求频率分布直方图中 a 的值; (2) 估计该企业的职工对该部门评分不低

16、于 80 的 概率; (3) 从评分在 40 , 60 ) 的受访职工中 , 随机抽取 2 人 , 求此 2 人的评分都在 40 , 50 ) 的概率 . 【解析】 (1) 因为 (0.00 4 a 0.01 8 0.022 2 0.028) 10 1 , 所以 a 0.006. (2) 由所给频率分布直方图知 , 50 名受访职工评分 不低于 80 的频率为 (0.02 2 0.018) 10 0.4 , 所以该 企业职工对该部门评分不低于 80 的概率的估计值为 0.4. (3) 受访职工中评分在 50 , 60 ) 的有: 50 0.006 10 3 ( 人 ) , 记为 A 1 , A

17、 2 , A 3 ; 受访职工中评分在 40 , 50 ) 的有: 50 0.004 10 2( 人 ) , 记为 B 1 , B 2 . 从这 5 名受访职工中随机抽取 2 人 , 所有可 能的 结果共有 10 种 , 它们是 A 1 , A 2 , A 1 , A 3 , A 1 , B 1 , A 1 , B 2 , A 2 , A 3 , A 2 , B 1 , A 2 , B 2 , A 3 , B 1 , A 3 , B 2 , B 1 , B 2 .又因为所抽取 2 人的评分都 在 40 , 50 ) 的结果有 1 种 , 即 B 1 , B 2 , 故所求的概率 为 1 10

18、. 备选题例 4 汽车是碳排放量比较大的行业之 一 . 欧盟规 定 , 从 201 2 年开始 , 将对 CO 2 排放量超过 130 g/k m 的 M 1 型新车进行惩罚 ( 视为排放量超标 ) . 某 检测单位对甲、乙两类 M 1 型品牌车各抽取 5 辆进行 CO 2 排放量检测 , 记录如下 ( 单位: g/km ) 甲 80 1 10 120 140 150 乙 100 120 x y 160 经测算发现 , 乙品牌 CO 2 排放量的平均值为 x 乙 120 g/km. (1) 从被检测的 5 辆甲类品牌车中任取 2 辆 , CO 2 排放量都不超标的概率是多少? (2) 若 80

19、x 130 , 试比较甲、乙两类品牌车 CO 2 排放量的稳定性 . 【解析】 (1) 从被检测的 5 辆甲类品牌车中任取 2 辆 , 共有 10 种不同的 CO 2 排放量结果: (80 , 1 10 ) ; (80 , 120 ) ; (80 , 140 ) ; (80 , 150 ) ; (1 10 , 120 ) ; (1 10 , 140 ) ; (1 1 0 , 150 ) ; (120 , 140 ) ; (120 , 150 ) ; (140 , 150 ) , 设 “ CO 2 排放量都不超标 ” 为事件 A , 则事件 A 包含以下 3 种不同的结果: (80 , 1 1

20、0 ) ; (80 , 120 ) ; (1 10 , 120 ) ; P( A) 3 10 . (2) 由题可知 x 甲 x 乙 120 , x y 220. 5s 2 甲 (80 120) 2 (1 1 0 120) 2 (120 120) 2 (140 120) 2 (150 12 0) 2 3 000 , 5s 2 乙 (100 120) 2 (120 120) 2 (x 120) 2 (y 120) 2 (160 120) 2 2 000 (x 120) 2 (y 120) 2 , x y 22 0 , 5s 2 乙 2 00 0 (x 120 ) 2 (x 100 ) 2 2x 2

21、 44 0 x 26 400. 5s 2 乙 5s 2 甲 2x 2 440 x 23 400 2(x 2 220 x 1 1 700) 2( x 90)( x 130) . 80x130 , 当 80xs 2 甲 ; 当 x 90 时 , s 2 乙 s 2 甲 ; 当 90x130 时 , s 2 乙 s 2 甲 .又 x 甲 x 乙 120 , 当 80x90 时 , 甲类品牌车碳排放量的稳定性 好; 当 x 90 时 , 两类品牌车碳排放量的稳定性一样 好; 当 90x130 时 , 乙类品牌车碳排放量的稳定性 好 . 【点评】 本题是一道概率与统计的综合题 , 解题 关键是要读懂题意

22、 , 分清类型 , 这是高考的一种常见 考 查方式 . 1 . 三种抽样方法易混淆 , 请分清 . 系统抽样即均分 分组 , 分层抽样例如分男、女层 , 简单随机抽样例如 抽签 . 2 . 频率分布直方图中 , 各组频率是求各矩形的面 积 . 3 . 理解记忆中位数、众数、平均数的估计方法 . (2015 广东 ) 某城市 100 户 居民的月平均用电量 ( 单 位:度 ) , 以 160 , 180 ) , 180 , 200 ) , 200 , 220 ) , 220 , 240 ) , 240 , 260 ) , 260 , 280 ) , 280 , 300 分组的频 率分布直方图如图

23、 . (1) 求直方图中 x 的值; (2) 求月平均用电量的众数和中位 数; ( 3) 在月平均用电量为 220 , 240 ) , 240 , 260 ) , 260 , 280 ) , 280 , 300 的四组用户中 , 用分层抽样的方法抽 取 11 户居民 , 则月平均用电量在 220 , 240 ) 的用户中应 抽取多少户? 【解析】 (1) 由 (0.002 0.009 5 0.01 1 0.012 5 x 0.005 0.002 5) 20 1 得 x 0.007 5 , 直方图中 x 的值为 0.007 5. (2) 月平均用电量的众数是 220 240 2 230. (0.

24、002 0 .009 5 0.01 1) 20 0. 4510 的事件的概率; (3) 设学校配备的校车每辆可搭载 40 名学生 , 请根据 抽样的结果估计全校应有多少辆这样的校车? 【解析】 (1)600 50 12 , 第一段的号码为 0 06 , 第五段抽取的数是 6 (5 1) 12 54 , 即第五段抽 取的号码是 054. (2) 第 4 组人数 0.00 8 10 50 4 , 这 4 人分别设为 A 、 B 、 C 、 D , 第 6 组人数 0.004 10 50 2 , 这 2 人分别设为 x , y , 随机抽取 2 人的可能情况是: AB , AC , AD , BC

25、, BD , CD , xy , Ax , Ay , Bx , By , Cx , Cy , Dx , Dy 一 共 15 种情况 , 其中他们上学时间满足 | a b | 10 的情况有 8 种; 所以满足 | a b | 10 的事件的概率 P 8 15 . (3) 全校上学时间不少于 30 分钟的学生约有 600 (0.008 0.008 0.004) 10 120 人; 所以估计全校需要 3 辆校车 . 8. 随机抽取某中学甲乙两班各 10 名同学 , 测量他们的身高 ( 单位: cm ) , 获得身高数据的茎叶图 , 如图 . (1) 求甲乙两班身高的中位数并根 据茎叶图判断哪个班的

26、平均身高较 高; (2) 现从甲、乙两班 176 cm 以上 ( 不含 176 cm ) 的同学 中随机各抽取一名同学 , 求身高为 181 cm 的同学被抽中 的概率 . 【解析】 (1) 甲班中位数: 169 ; 乙班中位数: 171.5 ; 由茎叶图可知:甲班身高集中于 1 60 179 之间 , 而 乙班身高集中于 170 180 之间 .因此乙班平均身高高于甲 班 . (2) 设身高为 181 cm 的同学被抽中的事件为 A ; 从甲、乙两班 176 cm 以上 ( 不含 1 76 cm ) 的同学中随 机各抽取一名同学 , 有: (182 , 18 1 ) , (182 , 1 7

27、9 ) , (182 , 17 8) , (179 , 181 ) , (179 , 179 ) , (179 , 178 ) , (179 , 181 ) , (179 , 179 ) , (179 , 17 8 ) 共 9 个基本事件 , 而事件 A 含有 3 个基本事件 , P ( A ) 1 3 . 答:身高为 181 cm 的同学被抽中的概率为 1 3 . 9 . 从某校随机抽取 100 名学生 , 获得了他们一周课外 阅读时间 ( 单位:小时 ) 的数据 , 整理得到数据分组及频数 分布表和频率分布直方图: 组号 分组 频数 1 0 , 2 ) 6 2 2 , 4 ) 8 3 4

28、, 6 ) 17 4 6 , 8 ) 22 5 8 , 10 ) 25 6 10 , 12 ) 12 7 12 , 14 ) 6 8 14 , 16 ) 2 9 16 , 18 ) 2 合计 100 (1) 从该校随机选取一名学生 , 试估计这名学生该周 课外阅读时间少于 12 小时的概率; (2) 求频率分布直方图中的 a , b 的值; (3 ) 假设同一组中的每个数据可用该组区间的中点值 代替 , 试估计样本中的 100 名学生该周课外阅读时间的 平均数在第几组 . ( 只需写出结论 ) 【解析】 (1) 根据频数分布表 , 100 名学生中课外阅 读时间不少于 12 小时的学生共有 6 2 2 10( 名 ) , 所 以样本中的学生课外阅读时间少于 12 小时的频率是 1 10 100 0.9. 从该校随机选取一名学生 , 估计其课外阅读时间少 于 12 小时的概率为 0. 9. (2) 课外阅读时间落在组 4 , 6 ) 的有 17 人 , 频率为 0.17 , 所以 a 频率 组距 0.17 2 0.0 85. 课外阅读时间落在组 8 , 10 ) 的有 25 人 , 频率为 0.25 , 所以 b 频率 组距 0.25 2 0.125. (3) 样本中的 100 名学生课外阅读时间的平均数在第 4 组 .

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!