用样本估计总体58

上传人:积*** 文档编号:121325107 上传时间:2022-07-18 格式:DOC 页数:12 大小:533.50KB
收藏 版权申诉 举报 下载
用样本估计总体58_第1页
第1页 / 共12页
用样本估计总体58_第2页
第2页 / 共12页
用样本估计总体58_第3页
第3页 / 共12页
资源描述:

《用样本估计总体58》由会员分享,可在线阅读,更多相关《用样本估计总体58(12页珍藏版)》请在装配图网上搜索。

1、东北师大附中-高三数学(理)第一轮复习导学案058用样本估计总体 编写教师:杨艳昌 审稿教师:刘彦永一、知识梳理 (一)用样本的频率分布估计总体分布1频率分布、频率分布表、频率分布直方图:频率分布表和频率分布直方图是从各个小组数据在样本容量中所占比例的大小的角度来表达数据分布的规律它可以使我们看到整个样本数据的频率分布状况2. 画频率分布直方图的环节:(1) 求极差(即一组数据中最大值与最小值的差);(2) 决定组距与组数;(3) 将数据分组;(4) 列频率分布表;(5) 画频率分布直方图3. 频率分布折线图和总体密度曲线:(1) 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得

2、到频率分布折线图;(2) 总体密度曲线:随着样本容量的增长,作图时所分的组数增长, 组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即为总体密度曲线4. 茎叶图:茎是指中间的一列数,叶是从茎的旁边生长出来的数(二)用样本的数字特性估计总体的数字特性5平均数:对于一组数据,平均数 6. 众数:一组数据中浮现次数最多的数7. 中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数8原则差:对于一组数据,原则差,原则差是样本数据到平均数的一种平均距离9方差:对于一组数据,方差10运用频率分布直方图估计众数、中位数、平均数:在频率分布直方图中

3、,众数是其最高矩形底边中点的横坐标;中位数左边和右边的直方图的面积相等;平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和二、题型探究探究一:如何求频率分布的有关数据;画频率分布直方图;用样本频率分布估计总体分布分组频数频率145.5149.510.02149.5153.540.08153.5157.5200.40157.5161.5150.30161.5165.580.16165.5169.5mn合计MN例1 某市4月1日 4月30日对空气污染指数的监测数据如下(重要污染物为可吸入颗粒物): 61,76,70,56,81,91,92,91,75,81,88,67

4、,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45() 完毕频率分布表;()作出频率分布直方图;()根据国标,污染指数在0 50之间时,空气质量为优;在51 100之间时,为良;在101 150之间时,为轻微污染;在151 200之间时,为轻度污染请你根据所给数据和上述原则,对该市的空气质量给出一种简短评价.解:()一方面根据题目中的数据完毕频率分布表: ()作出频率分布直方图:分组频数频率21461052-411511611711911811101111空气污染指数() 答对下述两条中的一条即可:根据污染指数,拟定空气质量为优、良

5、、轻微污染、轻度污染的天数: 该市一种月中空气污染指数有2天处在优的水平,占当月天数的,有26天处在良的水平,占当月天数的,处在优或良的天数共有28天,占当月天数的. 阐明该市空气质量基本良好. 轻微污染有2天,占当月天数的. 污染指数在80以上的接近轻微污染的天数有15天,加上处在轻微污染的天数,共有17天,占当月天数的,超过50%.阐明该市空气质量有待进一步改善.例2 为了理解高三年级学生中女生的身高(单位:)状况,某中学对高三年级女生身高进行了一次测量,所得数据整顿后,列出了频率分布表(如下表):() 求出表中所示的数分别是多少?() 画出频率分布直方图,并运用它估计全体高三年级女生身高

6、的众数、中位数和平均数; () 试问:全体女生中身高在哪组范畴内的人数最多?并估计高三年级学生中女生的身高在161.5cm以上的概率分组频数频率145.5149.510.02149.5153.540.08153.5157.5200.40157.5161.5150.30161.5165.580.16165.5169.5mn合计MN分组频数频率145.5149.510.02149.5153.540.08153.5157.5200.40157.5161.5150.30161.5165.580.16165.5169.5mn合计MN分组频数频率145.5149.510.02149.5153.540.08

7、153.5157.5200.40157.5161.5150.30161.5165.580.16165.5169.5合计解: (),;, 145.5149.5153.5157.5161.5165.5169.50.0100.1000.0200.0750.0400.005身高 ()频率分布直方图如图,众数是其最高矩形底边中点的横坐标,即; 中位数左边和右边的直方图的面积相等,而,频率分布直方图左边第一种小矩形的面积为0.02,第二个小矩形的面积为0.08,第三个小矩形的面积为0.40,这三个小矩形面积的和正好等于0.5, 中位数为157.5;平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩

8、形底边中点的横坐标之和()在153.5157.5cm的范畴最多,估计在161.5cm以上的概率为0.160.040.2探究二:茎叶图的绘制与运用例3 随机抽取某中学甲乙两班各10名同窗,测量她们的身高(单位:),获得身高数据的茎叶图(如图)() 根据茎叶图判断哪个班的平均身高较高;() 计算甲班的样本方差;() 现从乙班这10名同窗中随机抽取两名身高不低于173的同窗, 求身高为176的同窗被抽中的概率.解:()乙班平均身高高于甲班;() 甲班的样本的平均数为 甲班的样本方差为 ()设身高为176的同窗被抽中的事件为A; 从乙班10名同窗中抽中两名身高不低于173的同窗有:(181,173)、

9、(181,176)、 (181,178)、(181,179)、(179,173)、(179,176)、(179,178)、(178,173)、(178, 176) 、(176,173)共10个基本领件,而事件A具有4个基本领件; 例4 某良种哺育基地正在哺育一种小麦新品种A,将其与原有的一种优良品种B进行对照实验,两种小麦多种植了25亩,所得亩产数据(单位:公斤)如下: 品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,443,445,451,454.品种B:363,3

10、71,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.()绘制茎叶图;()用茎叶图解决既有的数据,有什么长处? ()通过观测茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出记录结论.A B9 7 358 7 36 3 5 37 1 4 8 38 3 5 69 2 39 1 2 4 4 5 7 75 0 40 0 1 1 3 6 7 5 4 2 41 0 2 5 6 7 3 3 1 42 2 4 0 0 43 0 5 3 3 44 4 1 45 解:()茎叶

11、图如图所示()用茎叶图解决既有的数据不仅可以看出数据的分布状况,并且可以看出每组中的具体数据.()通过观测茎叶图,可以计算出品种A的平均每亩产量为411.1公斤,品种B的平均亩产量为397.8公斤,由此可知,品种A的平均亩产量比品种B的平均亩产量高,但品种A的亩产量不够稳定,而品种B的亩产量比较集中在平均产量附近.三、措施提高(1)用频率分布直方图解决有关问题时,应对的理解图表中各个量的意义,识图掌握信息是解决该类问题的核心. 频率分布直方图有如下几种要点: 纵轴表达频率/组距; 频率分布直方图中各长方形高的比也就是其频率之比; 直方图中每一种矩形的面积是样本数据落在这个区间上的频率,所有的小

12、矩形的面积之和等于1,即频率之和为1. (在绘制小矩形时,宽窄要一致)(2)原则差、方差描述了一组数据环绕平均数波动的大小. 原则差、方差越大,数据的离散限度越大;原则差、方差越小,数据的离散限度越小. 由于方差与原始数据的单位不同,且平方后也许夸张了偏差的限度,因此虽然方差与原则差在刻画样本数据的分散限度上是同样的,但在解决实际问题时,一般多采用原则差.(3)几种表达频率分布的措施的长处与局限性: 频率分布表在数量表达上比较确切,但不够直观、形象,分析数据分布的总体态势不太以便; 频率分布直方图可以很容易地表达大量数据,非常直观地表白分布的形状,使我们可以看到在分布表中看不清晰的数据,但从直

13、方图自身得不出原始的数据内容,也就是说,把数据表达到直方图后,原有的具体数据信息就被抹掉了; 频率分布折线图的长处是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线; 用茎叶图长处是原有信息不会抹掉,可以展示数据的分布状况,但当样本数据较多或数据位数较多时,茎叶图显得不太以便了.五、学时作业一、选择题(1)若某校高一年级8个班参与合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是 A8 9 7 9 3 1 6 4 0 2(A)91.5和91.5 (B)91.5和92 (C )91和91.5 (D)92和92(2)将参与夏令营的60

14、0名学生编号为:001,002,600,采用系统抽样措施抽取一种容量为50的样本,且随机抽得的号码为003这600名学生分住在三个营区,从001到300在第营区,从301到495住在第营区,从496到600在第营区,三个营区被抽中的人数依次为 B(A)26, 16, 8, (B)25,17,8 (C)25,16,9 (D)24,17,9(3)样本中共有五个个体,其值分别为,若该样本的平均值为1,则样本方差为 D(A) (B) (C) (D) 2(4)在样本的频率分布直方图中,共有11个小长方形,若中间一种小长方形的面积等于其他10个小长方形的面积和的,且样本容量为160,则中间一组的频数为 A

15、(A)32 (B)0.2(C)40 (D)0.25 010515246010515246(5)如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为和,样本原则差分别为和,则 B(A) (B) (C) (D) (6)根据中华人民共和国道路交通安全法规定:车辆驾驶员血液酒精浓度在2080 mg/100ml(不含80)之间,属于酒后驾车,处暂扣一种月以上三个月如下驾驶证,并处200元以上500元如下罚款;血液酒精浓度在80mg/100ml(含80)以上时,属醉酒驾车,处十五日如下拘留和暂扣三个月以上半年如下驾驶证,并处500元以上元如下罚款据法制晚报报道,8月15日至8 月28日,全国查处

16、酒后驾车和醉酒驾车共28800人,如图是对这28800人酒后驾车血液中酒精含量进行检测所得成果的频率分布直方图,则属于醉酒驾车的人数约为 C (A)2160 (B)2880(C)4320 (D)8640(7)记录某校1000名学生的数学水平测试成绩,得到样本频率分布直方图(如图所示),若满分为100分,规定不低于60分为及格,则及格率是 D(A)20% (B)25%(C)6% (D)80%(8)有一种容量为66的样本,数据的分组及各组的频数如下:115,155) 2 155,195) 4 195,235) 9 235,275) 18 275,315) 1l 315,355) 12 355395

17、) 7 395,435) 3 根据样本的频率分布估计,数据落在315,435)的概率约是( ) A B C D二、填空题100110120130140150身高0.0050.0100.0200.035(9)从某小学随机抽取100名同窗,将她们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知;若要从身高在,三组内的学生中,用分层抽样的措施选用18人参与一项活动,则从身高在内的学生中选用的人数应为_. 0.030; 3 (10)将容量为的样本中的数据提成6组,绘制频率分步直方图,若第一组至第六组数据的频率之比为,且前三组数据的频数之和等于27,则等于_. 60(11)一种总体共

18、有100个个体,随机编号0,1,2,99,依从小到大的编号顺序平均提成10个小组,组号依次为1,2,3,10,现用系统抽样措施抽取一种容量为10的样本,规定如果在第1组随机抽取的号码为,那么在第组中抽取的号码个位数字与的个位数字相似,若,则在第8组中抽取的号码是_76(12)下图甲是某市有关部门根据对本地干部的月收入状况调查后画出的样本频率分布直方图,已知图甲中从左向右第一组的频数为4000在样本中记月收入在,的人数依次为图乙是记录图甲中月工资收入在一定范畴内的人数的算法流程图,则样本的容量 ;图乙输出的 10000, 600010001500250030003500月收入(元)0.00010

19、.00030.00040.00084000图甲开始输入否输出结束图乙是三、解答题(13)从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),成果如下:甲品种:271273280285285 287292294295301303303307 308310314319323325325 328331334337352乙品种:284292295304306307312313315315316318318 320322322324327329331333336337343356由以上数据设计了如下茎叶图,3 1 277 5 5 0 28 45 4 2 29 2 58 7 3 3 1 30

20、 4 6 79 4 0 31 2 3 5 5 6 8 88 5 5 3 32 0 2 2 4 7 97 4 1 33 1 3 6 734 32 35 6甲乙根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个记录结论:;解: 1乙品种棉花的纤维平均长度不小于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍不小于甲品种棉花的纤维长度)2甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定)甲品种棉花的纤维长度的分散限度比乙品种棉花的纤维长度的分散限度更大)分组频率3甲品种棉花的纤维长度的中位数为307mm,乙品种棉花的纤维长度

21、的中位数为318mm4乙品种棉花的纤维长度基本上是对称的,并且大多集中在中间(均值附近)甲品种棉花的纤维长度除一种特殊值(352)外,也大体对称,其分布较均匀(14)为了理解一种小水库中养殖的鱼的有关状况,从这个水库中多种不同位置捕捞出100条鱼,称得每条鱼的重量(单位:公斤),并将所得数据分组,画出频率分布直方图(如图所示)频率/ 组距0.4135.64526质量()1.001.051.101.151.201.251.30()在上面给出的表格中填写相应的频率;()估计数据落在中的概率为多少;()将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中

22、带有记号的鱼有6条,请根据这一状况来估计该水库中鱼的总条数解:()根据频率分布直方图可得右表中数据(如图);()由于数据落在中的频率为,因此估计数据落在中的概率为()设该水库中鱼的总条数为,则有,因此,估计该水库中鱼的总条数为(15)某校从参与高一年级期末考试的学生中抽出60名学生,并记录了她们的物理成绩(成绩均为整数且满分为100分),把其中不低于50分的提成五段,画出如下部分频率分布直方图观测图形的信息,回答问题:频率/ 组距0.005分数50607080901000.0150.0250.03()求出物理成绩低于50分的学生人数;()估计这次考试物理学科及格率(60分及以上为及格)()从物理成绩不及格的学生中任选两人,求她们成绩至少有一种不低于50分的概率解:()由于各组的频率和等于1,故低于50分的频率为: 因此,低于50分的人数为 (人)()依题意,成绩60及以上的分数所在的第三、四、五、六组(低于50分的为第一组),频率和为因此,抽样学生成绩的合格率是%.于是,可以估计这次考试物理学科及格率约为%.()“成绩低于50分”及“”的人数分别是6,9因此从成绩不及格的学生中选两人,她们成绩至少有一种不低于50分的概率为:

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!