学案4用样本估计总体与变量的相关性 (2)

上传人:痛*** 文档编号:230576890 上传时间:2023-08-25 格式:PPT 页数:55 大小:2.04MB
收藏 版权申诉 举报 下载
学案4用样本估计总体与变量的相关性 (2)_第1页
第1页 / 共55页
学案4用样本估计总体与变量的相关性 (2)_第2页
第2页 / 共55页
学案4用样本估计总体与变量的相关性 (2)_第3页
第3页 / 共55页
资源描述:

《学案4用样本估计总体与变量的相关性 (2)》由会员分享,可在线阅读,更多相关《学案4用样本估计总体与变量的相关性 (2)(55页珍藏版)》请在装配图网上搜索。

1、学案学案4 4 用样本估计总体与用样本估计总体与 变量的相关性变量的相关性填填知学情填填知学情填填知学情填填知学情课内考点突破课内考点突破课内考点突破课内考点突破规规规规 律律律律 探探探探 究究究究考考考考 纲纲纲纲 解解解解 读读读读考考考考 向向向向 预预预预 测测测测考考考考 纲纲纲纲 解解解解 读读读读1.1.用用样本样本估计估计总体总体(1)(1)了解分布的意义和作用了解分布的意义和作用,能根据频率分布表画频率分布直能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点方图、频率折线图、茎叶图,体会它们各自的特点.(2).(2)理解理解样本数据标准差的意义和作用样

2、本数据标准差的意义和作用,会计算数据标准差(不要求记会计算数据标准差(不要求记忆公式)忆公式).(3).(3)能从样本数据中提取基本的数字特征能从样本数据中提取基本的数字特征(如平均数、如平均数、标准差),并给出合理的解释标准差),并给出合理的解释.(4).(4)会用样本的频率分布估计会用样本的频率分布估计总体分布总体分布,会用样本的基本数字特征估计总体的基本数字特征会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想理解用样本估计总体的思想.(5).(5)会用随机抽样的基本方法和会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题样本估计总体的思想解决一些简单的

3、实际问题.2.2.变变量的量的相关相关性性(1)(1)会作两个有关联变量的数据的散点图会作两个有关联变量的数据的散点图,并利用散点图认识并利用散点图认识变量间的相关关系变量间的相关关系.(2).(2)了解最小二乘法的思想了解最小二乘法的思想,能根据给出的能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆)数公式不要求记忆).返回目录返回目录 名师伴你行考考考考 向向向向 预预预预 测测测测 返回目录返回目录 2012年高考年高考,试题难度仍以中低档题为主试题难度仍以中低档题为主.对总体分布的对总体分布的估计、线性

4、回归很可能在选择、填空题中考查估计、线性回归很可能在选择、填空题中考查.对于频对于频率分布直方图率分布直方图,求线性回归方程以及回归分析、独立性求线性回归方程以及回归分析、独立性检验与假设检验等,由于计算量大,因此考解答题的可检验与假设检验等,由于计算量大,因此考解答题的可能性不大,但也不排除给出数据、公式,以选择题形式能性不大,但也不排除给出数据、公式,以选择题形式考查考查.名师伴你行返回目录返回目录 1.1.用样本的频率分布估计总体分布用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图)频率分布表与频率分布直方图 频率分布表和频率分布直方图,是从各个小组数据频率分布表和频率分布

5、直方图,是从各个小组数据在样本容量中所占在样本容量中所占 的角度,来的角度,来表示数据分布规律,它可以使我们看到整个样本数据的表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况频率分布情况.比例大小比例大小 名师伴你行返回目录返回目录 (2)频率分布折线图)频率分布折线图 连接频率分布直方图中各小长方形连接频率分布直方图中各小长方形 ,就得到频率分布折线图,就得到频率分布折线图.(3)总体密度曲线)总体密度曲线 总体密度曲线反映了总体在各个范围内取值的百分比,总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息它能给我们提供更加精细的信息.(4)茎叶图)茎叶图

6、 2.2.用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数)众数、中位数、平均数上端的中点上端的中点 名师伴你行 众数:在样本数据中,频率分布最大值所对应的样本众数:在样本数据中,频率分布最大值所对应的样本 数数 据;据;中位数:样本数据中,累积频率为中位数:样本数据中,累积频率为0.5时所对应的样本时所对应的样本数据值(累积频率:样本数据小于某一数值的频率叫做该数数据值(累积频率:样本数据小于某一数值的频率叫做该数值点的累积频率);值点的累积频率);平均数:样本数据的算术平均数,即平均数:样本数据的算术平均数,即x=.(2)标准差的计算公式:标

7、准差的计算公式:s=.3.从散点图上看,点散布在从散点图上看,点散布在 就称这种相关关系为正相关,如果点散布在就称这种相关关系为正相关,如果点散布在返回目录返回目录 从左下角到右上角的区域内从左下角到右上角的区域内 从左上角到右下从左上角到右下 角的区域内角的区域内 就称这种相关关系为负相关就称这种相关关系为负相关.名师伴你行 4.如果散点图中点的分布从整体上看大致在一条直如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线附近,我们就称这两个变量之间具有 ,这条直线叫做回归直线,回归直线方程常记作,这条直线叫做回归直线,回归直线方程常记作 .5.对于一组具有线性相关

8、关系的数据对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),用最小二乘法,求回归直线用最小二乘法,求回归直线系数系数a,b的公式为的公式为 b=,a=.其中其中,x=,y=.返回目录返回目录 y-bx线性相关关系线性相关关系 名师伴你行 通过求通过求Q=的最小值而得出回归直线的方法,即求回归直线,使得样的最小值而得出回归直线的方法,即求回归直线,使得样本本 数数 据的点到它的距离的平方和最小,这一方法叫做最据的点到它的距离的平方和最小,这一方法叫做最小二乘法小二乘法.返回目录返回目录(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2 名师伴你行返

9、回目录返回目录 考点考点考点考点1 1 绘制频率分布直方图绘制频率分布直方图绘制频率分布直方图绘制频率分布直方图 2010年高考安徽卷年高考安徽卷某市某市2010年年4月月1日日4月月30日对空气污染指数的监测数据如下日对空气污染指数的监测数据如下(主要污染物为可主要污染物为可吸入颗粒物吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.名师伴你行返回目录返回目录(1)完成频率分布表完成频率分布表;(2)作出频率分布直方图作出频率分布直方图;(3)根

10、据国家标准根据国家标准,污染指数在污染指数在050之间时之间时,空气质量为优空气质量为优;在在51100之间时之间时,为良为良;在在101150之间时之间时,为轻微污染为轻微污染;在在151200之间时之间时,为轻度污染为轻度污染.请你依据所给数据和上述标准请你依据所给数据和上述标准,对该市的空气质量给出一对该市的空气质量给出一个简短评价个简短评价.名师伴你行返回目录返回目录 分组分组频数频数频率频率41,51)41,51)2 251,61)51,61)1 161,71)61,71)4 471,81)71,81)6 681,91)81,91)101091,101)91,101)5 5101,1

11、11)101,111)(1)频率分布表频率分布表:名师伴你行返回目录返回目录(2)频率分布直方图如图所示频率分布直方图如图所示.名师伴你行返回目录返回目录(3)答对下述两条中的一条即可答对下述两条中的一条即可:该市一个月中空气污染指数有该市一个月中空气污染指数有2天处于优的水平天处于优的水平,占当占当月天数的月天数的;有有26天处于良的水平天处于良的水平,占当月天数的占当月天数的;处于优或良的天数为处于优或良的天数为28,占当月天数的占当月天数的.说明该市空说明该市空气质量基本良好气质量基本良好.轻微污染有轻微污染有2天天,占当月天数的占当月天数的;污染指数在污染指数在80以以上的接近轻微污染

12、的天数上的接近轻微污染的天数15,加上处于轻微污染的天数加上处于轻微污染的天数17,占当月天数的,超过占当月天数的,超过50%;说明该市空气质量有说明该市空气质量有待进一步改善待进一步改善.名师伴你行 (1)列频率分布表时要注意区分频数、频率的意义列频率分布表时要注意区分频数、频率的意义.(2)画频率分布直方图时要注意纵、横坐标代表的意画频率分布直方图时要注意纵、横坐标代表的意义及单位义及单位.(3)通过本题可以掌握总体分布估计的各种常见步骤通过本题可以掌握总体分布估计的各种常见步骤和方法和方法.(4)解决总体分布估计问题的一般步骤如下解决总体分布估计问题的一般步骤如下:先确定分组的组数先确定

13、分组的组数;分别计算各组的频数及频率分别计算各组的频数及频率(频率频率=);画出频率分布直方图画出频率分布直方图,并作出相应的估计并作出相应的估计.返回目录返回目录 频数频数总数总数名师伴你行返回目录返回目录 对某电子元件进行寿命追踪调查对某电子元件进行寿命追踪调查,情况如下情况如下:寿命寿命(h)100,200)200,300)300,400)400,500)500,600)个数个数(个个)2030804030(1)列出频率分布表列出频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)估计电子元件寿命在估计电子元件寿命在100,400)以内的概率以内的概率;(4)估计电子元件寿命在

14、估计电子元件寿命在400 h以上的概率以上的概率.名师伴你行返回目录返回目录【解析解析】(1)样本频率分布表如下样本频率分布表如下:(2)频率分布直方图如图频率分布直方图如图分分 组组频频 数数频频 率率1 10.0.)0.00.0.)0.0.,)0.0.,5,5)0.0.5 5,6,6)0.0.合合 计计名师伴你行返回目录返回目录(3)由频率分布表可以看出由频率分布表可以看出,寿命在寿命在100,400)内的电子内的电子元件出现的频率为元件出现的频率为0.65,所以我们估计电子元件寿命在所以我们估计电子元件寿命在100,400)内的概率为内的概率为0.65.(4)由频率分布表可知由频率分布表

15、可知,寿命在寿命在400 h以上的电子元件出以上的电子元件出现的频率为现的频率为0.20+0.15=0.35,故我们估计电子元件寿命故我们估计电子元件寿命在在400 h以上的概率为以上的概率为0.35.名师伴你行返回目录返回目录 考点考点考点考点2 2 频率分布直方图的应用频率分布直方图的应用频率分布直方图的应用频率分布直方图的应用2010年高考陕西卷年高考陕西卷为了解学生身高情况,某校以为了解学生身高情况,某校以10%的比例对全校的比例对全校700名学生按性别进行分层抽样调查,名学生按性别进行分层抽样调查,测得身高情况的统计图如图:测得身高情况的统计图如图:名师伴你行返回目录返回目录(1)估

16、计该校男生的人数;估计该校男生的人数;(2)估计该校学生身高在估计该校学生身高在170185 cm之间的概率;之间的概率;(3)从样本中身高在从样本中身高在180190 cm之间的男生中任选之间的男生中任选2人,人,求至少有求至少有1人身高在人身高在185190 cm之间的概率之间的概率.【分析分析】在频率直方图中在频率直方图中,频率等于矩形的面积频率等于矩形的面积,每一每一小组的频率等于这小组的频数与样本容量的商小组的频率等于这小组的频数与样本容量的商.名师伴你行返回目录返回目录【解析解析】(1)样本中男生人数为)样本中男生人数为40,由分层抽样比例为,由分层抽样比例为10%估计全校男生人数

17、为估计全校男生人数为400.(2)由统计图知)由统计图知,样本中身高在样本中身高在170185 cm之间的学生之间的学生有有14+13+4+3+1=35(人人),样本容量为样本容量为70,所以样本中学生所以样本中学生身身高在高在170185 cm之间的频率之间的频率f=0.5.故由故由f估计该校学估计该校学生身高在生身高在170185 cm之间的概率之间的概率p=0.5.(3)样本中身高在)样本中身高在180185 cm之间的男生有之间的男生有4人,设其人,设其编号为编号为,样本中身高在,样本中身高在185190 cm之间的男生之间的男生有有2人,设其编号为人,设其编号为.从上述从上述6人中任

18、选人中任选2人的树状图为:人的树状图为:名师伴你行返回目录返回目录 故从样本中身高在故从样本中身高在180190 cm之间的男生中任选之间的男生中任选2人的所有可能结果数为人的所有可能结果数为15,至少有,至少有1人身高在人身高在185190 cm之间的可能结果数为之间的可能结果数为9.因此,所求概率因此,所求概率p2=.名师伴你行 解决该类问题时应正确理解图表中各个量的意义解决该类问题时应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键识图掌握信息是解决该类问题的关键.频率分布指的频率分布指的是一个样本数据在各个小范围内所占比例的大小是一个样本数据在各个小范围内所占比例的大小,一

19、一般用频率分布直方图反映样本的频率分布般用频率分布直方图反映样本的频率分布.其中其中,频频率分布直方图中纵轴表示率分布直方图中纵轴表示 ,频率频率=;频率分布直方图中频率分布直方图中,各小长方形的面积之和为各小长方形的面积之和为1,因因此在频率分布直方图中此在频率分布直方图中,组距是一个固定值组距是一个固定值,所以长方形所以长方形高的比也就是频率之比高的比也就是频率之比;频率分布表和频率分布直方频率分布表和频率分布直方 图是一组数据频率分布的两种形式图是一组数据频率分布的两种形式,前者准确前者准确,后者直观后者直观;众数为最高矩形的中点众数为最高矩形的中点;中位数为平分频率分布中位数为平分频率

20、分布直方图面积且垂直于横轴的直线与横轴交点的横坐标直方图面积且垂直于横轴的直线与横轴交点的横坐标.返回目录返回目录 频率频率组距组距频数频数样本容量样本容量名师伴你行返回目录返回目录 2010年高考湖北卷年高考湖北卷为了了解一个小水库中养殖的鱼的有为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出关情况,从这个水库中多个不同位置捕捞出100条鱼,称得条鱼,称得每条鱼的质量(单位:每条鱼的质量(单位:km),并将所得数据分组,画出频),并将所得数据分组,画出频率分布直方图(如图所示)率分布直方图(如图所示).名师伴你行返回目录返回目录(1)在下面表格中填写相应的频率;在下面表

21、格中填写相应的频率;分组分组频率频率1.00,1.05)1.00,1.05)1.05,1.10)1.05,1.10)1.10,1.15)1.10,1.15)1.15,1.20)1.15,1.20)1.20,1.25)1.20,1.25)1.25,1.30)1.25,1.30)名师伴你行(2)估计数据落在估计数据落在1.15,1.30)中的概率为多少;中的概率为多少;(3)将上面捕捞的将上面捕捞的100条鱼分别作一记号后再放回水库条鱼分别作一记号后再放回水库.几天后再从水库的多处不同位置捕捞出几天后再从水库的多处不同位置捕捞出120条鱼,其中条鱼,其中带有记号的鱼有带有记号的鱼有6条条.请根据这

22、一情况来估计该水库中鱼请根据这一情况来估计该水库中鱼的总条数的总条数.返回目录返回目录【解析解析】(1)根据频率分布直方图可知,频率)根据频率分布直方图可知,频率=组距组距(频频率率/组距),故可得下表:组距),故可得下表:名师伴你行返回目录返回目录(2)0.30+0.15+0.02=0.47,所以数据落在所以数据落在1.15,1.30)中的中的概率约为概率约为0.47.(3)=2 000,所以水库中鱼的总条数约为,所以水库中鱼的总条数约为2 000条条.分组分组频率频率1.00,1.05)1.00,1.05)0.050.051.05,1.10)1.05,1.10)0.200.201.10,1

23、.15)1.10,1.15)0.280.281.15,1.20)1.15,1.20)0.300.301.20,1.25)1.20,1.25)0.150.151.25,1.30)1.25,1.30)0.020.02名师伴你行返回目录返回目录 甲、乙两台机床同时加工直径为甲、乙两台机床同时加工直径为10mm的零件,为了检的零件,为了检验产品的质量验产品的质量,从产品中各随机抽取从产品中各随机抽取6件进行测量件进行测量,测得测得数据如下数据如下(单位单位:mm)甲甲:99,100,98,100,100,103乙乙:99,100,102,99,100,100(1)分别计算上述两组数据的平均数和方差分别

24、计算上述两组数据的平均数和方差;(2)根据根据(1)的计算结果的计算结果,说明哪一台机床加工的这种零说明哪一台机床加工的这种零件件 更符合要求更符合要求.考点考点考点考点 用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征名师伴你行返回目录返回目录 【解析解析解析解析】(1)x甲甲=100,x乙乙=100,=(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2=.=(99-100)2+(100-100)2+(102-100)2+(99-

25、100)2+(100-100)2+(100-100)2=1.(2)因为因为 ,说明甲机床加工零件波动比较说明甲机床加工零件波动比较大大,因此乙机床加工零件更符合要求因此乙机床加工零件更符合要求.【分析分析分析分析】已知一组数据已知一组数据x1,x2,xn,其平均数为其平均数为x,方差方差为为s2=,标准差为标准差为 .【分析分析分析分析】已知一组数据已知一组数据x1,x2,xn,其平均数为其平均数为x,方差方差为为s2=,标准差为标准差为 .名师伴你行 两个机床加工零件的平均数相等两个机床加工零件的平均数相等,平均数描述了数平均数描述了数据的平均水平据的平均水平,要说明哪一台机床加工的零件更符

26、合要要说明哪一台机床加工的零件更符合要求求,可再用方差来判断可再用方差来判断.平均数和标准差超过了规定界平均数和标准差超过了规定界限时限时,说明这批产品质量与生产要求有较大偏差说明这批产品质量与生产要求有较大偏差.返回目录返回目录 名师伴你行返回目录返回目录 甲、乙两种冬小麦试验品种连续甲、乙两种冬小麦试验品种连续x年的平均单位面积产年的平均单位面积产量如下:量如下:试根据这组数据试根据这组数据,估计哪一种小麦品种产量较稳定估计哪一种小麦品种产量较稳定.品种品种第第1 1年年第第2 2年年第第3 3年年第第4 4年年第第5 5年年甲甲9.89.89.99.910.110.1101010.210

27、.2乙乙9.49.410.310.310.810.89.79.79.89.8名师伴你行返回目录返回目录 甲品种的样本平均数为甲品种的样本平均数为10,样本方差为,样本方差为 (9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)25=0.02;乙品种的样本平均数也是乙品种的样本平均数也是10,样本方差为,样本方差为 (9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)25=0.240.02.所以,由这组数据可以认为甲种小麦的产量比乙种小麦所以,由这组数据可以认为甲种小麦的产量比乙种小麦的产量较稳定的产量

28、较稳定.名师伴你行返回目录返回目录 某化肥厂甲、乙两个车间包装肥料,在自动包装传送某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔带上每隔30min抽取一包产品,称其重量,分别记录抽抽取一包产品,称其重量,分别记录抽查数据如下:查数据如下:甲:甲:102,101,99,98,103,98,99;乙:乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示将这两组数据用茎叶图表示:(3)将两组数据比较将两组数据比较,说明哪个车间产品较稳定说明哪个车间产品较稳定.考点考点考点考点 茎叶图茎叶图茎叶图茎叶图名师伴你行返

29、回目录返回目录 【解析解析解析解析】(1)因为间隔时间相同因为间隔时间相同,故是系统抽样故是系统抽样.(2)茎叶图如图所示茎叶图如图所示:【分析分析分析分析】(1)根据各种抽样的特点判断根据各种抽样的特点判断.(2)求出两组数据的平均值与方差进行比较求出两组数据的平均值与方差进行比较.名师伴你行(3)甲车间甲车间:平均值平均值:x1=(102+101+99+98+103+98+99)=100.方差方差:=(102-100)2+(101-100)2+(99-100)23.4286.乙车间乙车间:平均值平均值:x2=(110+115+90+85+75+115+110)=100,方差方差:=(110

30、-100)2+(115-100)2+(110-100)2228.5714.x1=x2,甲车间产品稳定甲车间产品稳定.返回目录返回目录 名师伴你行 (1)茎叶图的优点是保留了原始数据茎叶图的优点是保留了原始数据,便于记便于记录及表示录及表示,能反映数据在各段上的分布情况能反映数据在各段上的分布情况.(2)茎叶图不能直接反映总体的分布情况茎叶图不能直接反映总体的分布情况,这就需要这就需要通过茎叶图给出的数据求出数据的数字特征通过茎叶图给出的数据求出数据的数字特征,进一步进一步估计总体情况估计总体情况.返回目录返回目录 名师伴你行某中学高一某中学高一(2)班甲、乙两名同学自高中以来每场数学考试班甲、

31、乙两名同学自高中以来每场数学考试成绩情况如下:成绩情况如下:甲的得分:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩茎叶图画出两人数学成绩茎叶图.请根据茎叶图对两人的成绩进行请根据茎叶图对两人的成绩进行比较比较.返回目录返回目录 名师伴你行甲、乙两人数学成绩的茎叶图如图甲、乙两人数学成绩的茎叶图如图 从这个茎叶图上可以看出从这个茎叶图上可以看出,乙同学的得分情况是大致乙同学的得分情况是大致对称的对称的,中位数是中位数是98;甲同学的得分情况除一

32、个特殊得分外甲同学的得分情况除一个特殊得分外,也大致对称也大致对称,中位数是中位数是88.因此乙同学发挥比较稳定因此乙同学发挥比较稳定,总体总体得分情况比甲同学好得分情况比甲同学好.返回目录返回目录 名师伴你行关于人体的脂肪含量(百分比)和年龄关系的研究中,关于人体的脂肪含量(百分比)和年龄关系的研究中,得到如下一组数据得到如下一组数据.判断它们是否有相关关系判断它们是否有相关关系.考点考点考点考点 利用散点图判定相关关系利用散点图判定相关关系利用散点图判定相关关系利用散点图判定相关关系 【分析分析分析分析】本题涉及两个变量:年龄与脂肪含量,可本题涉及两个变量:年龄与脂肪含量,可以以年龄为自变

33、量,考查脂肪含量的变化趋势,而分以以年龄为自变量,考查脂肪含量的变化趋势,而分析相关关系通常借助散点图析相关关系通常借助散点图.返回目录返回目录 年龄年龄23232727393941414545494950505151脂肪脂肪9.59.517.817.8 21.221.2 25.925.9 27.527.5 26.326.3 28.228.2 29.629.6名师伴你行 【解析解析解析解析】以年龄作为以年龄作为x轴,脂肪含量作为轴,脂肪含量作为y轴,可得轴,可得相应散点图如图所示相应散点图如图所示:由散点图可知,两者之间具有相关关系由散点图可知,两者之间具有相关关系.返回目录返回目录 名师伴你

34、行 判断有无相关关系,一种常用的简便方法判断有无相关关系,一种常用的简便方法就是绘制散点图就是绘制散点图.返回目录返回目录 名师伴你行已知已知10只狗的血球体积及红血球数的测量值如下表:只狗的血球体积及红血球数的测量值如下表:26.99355.90589.49406.20返回目录返回目录 x:x:血球体积(mm(mm3 3)y:y:红血球数(百万)45456.536.5342426.306.3046469.529.5248487.507.5042426.996.9935355.905.9058589.499.4940406.206.20名师伴你行(1)将表中的数据画成散点图)将表中的数据画成散

35、点图;(2)你能从散点图中发现狗的血球体积与红血球数近似)你能从散点图中发现狗的血球体积与红血球数近似 成什么关系吗?成什么关系吗?(3)如果近似成线性相关关系的话,请画出一条直线来)如果近似成线性相关关系的话,请画出一条直线来 近似地表示这种线性相关关系近似地表示这种线性相关关系.返回目录返回目录 名师伴你行(1)画出的散点图如图所示)画出的散点图如图所示.(2)由散点图可以看出:狗的血球体积与红血球数近)由散点图可以看出:狗的血球体积与红血球数近 似成线性相关关系似成线性相关关系.(3)如图中的直线)如图中的直线.返回目录返回目录 名师伴你行假设关于某设备的使用年限假设关于某设备的使用年限

36、x和所支出的维修费用和所支出的维修费用y(万万元元)有如下的统计资料有如下的统计资料:(1)线性回归方程线性回归方程y=bx+a的回归系数的回归系数a,b;(2)估计使用年限为估计使用年限为10年时,维修费用是多少?年时,维修费用是多少?考点考点考点考点 求线性回归直线求线性回归直线求线性回归直线求线性回归直线 返回目录返回目录 若由资料知若由资料知,y与与x呈线性相关关系呈线性相关关系.试求:试求:使用年限使用年限x23456维修费用维修费用y2.23.85.56.57.0名师伴你行 【解析解析解析解析】(1)制表如下)制表如下:【分析分析分析分析】本题已知本题已知x与与y之间有线性相关关系

37、,就无需之间有线性相关关系,就无需进行相关检验进行相关检验.i i1 12 23 34 45 5合计合计xi2 23 34 45 56 62020yi2.22.23.83.85.55.56.56.57.07.02525xiyi4.44.411.411.422.022.032.532.542.042.0112.3112.34 49 91616252536369090 x=4;y=5;返回目录返回目录 名师伴你行于是有于是有b=;a=y-bx=5-1.234=0.08.(2)回归直线方程是回归直线方程是:y=1.23x+0.08,当当x=10年时年时,y=1.2310+0.08=12.3+0.08

38、=12.38(万万元元),即估计使用即估计使用10年时,维修费用是年时,维修费用是12.38(万元万元).返回目录返回目录 名师伴你行 由本题中由本题中y对对x的关系呈线性关系,故可用一元线的关系呈线性关系,故可用一元线 性性 相关的方法解决问题相关的方法解决问题.(1)利用公式利用公式:来计算回归系来计算回归系数,有时为了方便常制表对应出数,有时为了方便常制表对应出xiyi,,以利于求和,以利于求和.(2)获得直线方程后,取获得直线方程后,取x=10,即得所求即得所求.(3)求线性回归方程的计算量大,解题时可借助计算器,求线性回归方程的计算量大,解题时可借助计算器,列出表格,再按分析时的步骤

39、进行列出表格,再按分析时的步骤进行.(4)本题是一个应用问题,其实就是求出回归直线方程,本题是一个应用问题,其实就是求出回归直线方程,通过回归方程来分析使用年限与维修费用之间的关系通过回归方程来分析使用年限与维修费用之间的关系.返回目录返回目录 名师伴你行一般说来一般说来,一个人的身高越高一个人的身高越高,他的手就越大他的手就越大.为调查这为调查这一问题一问题,对对10名高三男生的身高与右手一扎长测量得到名高三男生的身高与右手一扎长测量得到如下一组数据如下一组数据(单位单位:cm)(1)画出散点图,你能发现两者有相关关系吗?画出散点图,你能发现两者有相关关系吗?(2)如果有相关关系如果有相关关

40、系,求回归直线方程求回归直线方程;(3)如果一个学生身高如果一个学生身高185cm,估计他的右手一扎长估计他的右手一扎长.身高168168170170171171172172174174176176178178178178180180181181一扎长19.019.020.020.021.021.021.521.521.021.022.022.024.024.023.023.022.522.523.023.0返回目录返回目录 名师伴你行(1)散点图如下散点图如下:由散点图可以发现由散点图可以发现,身高与右手一扎长之间的总体趋势成一身高与右手一扎长之间的总体趋势成一条直线条直线,所以它们线性相关

41、所以它们线性相关.返回目录返回目录 名师伴你行 (2)设回归直线方程为设回归直线方程为y=bx+a,将上述数据利用计算将上述数据利用计算器计算得器计算得 x=174.8,y=21.7,利用公式求得利用公式求得b0.303,a=y-bx-31.264.因此所求回归直线方程为因此所求回归直线方程为y=0.303x-31.264.(3)当当x=185时,时,y=24.791.返回目录返回目录 名师伴你行返回目录返回目录 1.1.牢记画频率分布直方图的步骤牢记画频率分布直方图的步骤牢记画频率分布直方图的步骤牢记画频率分布直方图的步骤:(1)(1)先确定分组的组数,其方法是:最大数据与最小先确定分组的组

42、数,其方法是:最大数据与最小先确定分组的组数,其方法是:最大数据与最小先确定分组的组数,其方法是:最大数据与最小 数据之差除以组距得组数数据之差除以组距得组数数据之差除以组距得组数数据之差除以组距得组数.(2)(2)计算每组的频数及频率,其中频率计算每组的频数及频率,其中频率计算每组的频数及频率,其中频率计算每组的频数及频率,其中频率=.=.(3)(3)画出直方图,同时要注意频率分布直方图的含义画出直方图,同时要注意频率分布直方图的含义画出直方图,同时要注意频率分布直方图的含义画出直方图,同时要注意频率分布直方图的含义.2.2.利用频率分布直方图估计样本的数字特征:利用频率分布直方图估计样本的

43、数字特征:利用频率分布直方图估计样本的数字特征:利用频率分布直方图估计样本的数字特征:(1)(1)众数在样本数据的频率分布直方图中众数在样本数据的频率分布直方图中众数在样本数据的频率分布直方图中众数在样本数据的频率分布直方图中,就是最高矩就是最高矩就是最高矩就是最高矩 形的中点的横坐标形的中点的横坐标形的中点的横坐标形的中点的横坐标.频数频数频数频数总数总数总数总数名师伴你行 (2)(2)在频率分布直方图中在频率分布直方图中在频率分布直方图中在频率分布直方图中 ,中位数左边和右边的直中位数左边和右边的直中位数左边和右边的直中位数左边和右边的直方方方方 图的面积应该相等图的面积应该相等图的面积应

44、该相等图的面积应该相等,由此可以估计中位数的值由此可以估计中位数的值由此可以估计中位数的值由此可以估计中位数的值.(3)(3)平均数是频率分布直方图的平均数是频率分布直方图的平均数是频率分布直方图的平均数是频率分布直方图的“重心重心重心重心”,等于频率,等于频率,等于频率,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的分布直方图中每个小矩形的面积乘以小矩形底边中点的分布直方图中每个小矩形的面积乘以小矩形底边中点的分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和横坐标之和横坐标之和横坐标之和.(4)(4)一组数据中的众数可能不止一个一组数据中的众数可能不止一个一组数据中的众数

45、可能不止一个一组数据中的众数可能不止一个,而中位数是唯而中位数是唯而中位数是唯而中位数是唯一的一的一的一的,如果数据的个数为偶数如果数据的个数为偶数如果数据的个数为偶数如果数据的个数为偶数,那么那么那么那么,最中间两个数据的最中间两个数据的最中间两个数据的最中间两个数据的平均数是这组数据的中位数平均数是这组数据的中位数平均数是这组数据的中位数平均数是这组数据的中位数.返回目录返回目录 名师伴你行 3.3.分清平均数和标准差的数学定义和现实含义分清平均数和标准差的数学定义和现实含义分清平均数和标准差的数学定义和现实含义分清平均数和标准差的数学定义和现实含义.平均平均平均平均数反映的是数据的平均水

46、平,标准差反映的是数据的离数反映的是数据的平均水平,标准差反映的是数据的离数反映的是数据的平均水平,标准差反映的是数据的离数反映的是数据的平均水平,标准差反映的是数据的离散程度,反映了各个样本数据聚集于样本平均数周围的散程度,反映了各个样本数据聚集于样本平均数周围的散程度,反映了各个样本数据聚集于样本平均数周围的散程度,反映了各个样本数据聚集于样本平均数周围的程度,标准差越小程度,标准差越小程度,标准差越小程度,标准差越小,表明数据在样本平均数的周围越集中;表明数据在样本平均数的周围越集中;表明数据在样本平均数的周围越集中;表明数据在样本平均数的周围越集中;反之,标准差越大,表明各个样本数据在

47、样本平均数的反之,标准差越大,表明各个样本数据在样本平均数的反之,标准差越大,表明各个样本数据在样本平均数的反之,标准差越大,表明各个样本数据在样本平均数的两边越分散两边越分散两边越分散两边越分散.4.4.要熟记相关的定义,注意散点图对判断是否相关要熟记相关的定义,注意散点图对判断是否相关要熟记相关的定义,注意散点图对判断是否相关要熟记相关的定义,注意散点图对判断是否相关的作用的作用的作用的作用.由于计算较为繁琐,因此要细心,还要会用回归由于计算较为繁琐,因此要细心,还要会用回归由于计算较为繁琐,因此要细心,还要会用回归由于计算较为繁琐,因此要细心,还要会用回归方程进行估计,并结合实际作出回答方程进行估计,并结合实际作出回答方程进行估计,并结合实际作出回答方程进行估计,并结合实际作出回答.返回目录返回目录 名师伴你行

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!