人教版 高中数学 选修23 学案3.1 回归分析的基本思想及其初步应用

上传人:痛*** 文档编号:61972258 上传时间:2022-03-13 格式:DOC 页数:24 大小:1MB
收藏 版权申诉 举报 下载
人教版 高中数学 选修23 学案3.1 回归分析的基本思想及其初步应用_第1页
第1页 / 共24页
人教版 高中数学 选修23 学案3.1 回归分析的基本思想及其初步应用_第2页
第2页 / 共24页
人教版 高中数学 选修23 学案3.1 回归分析的基本思想及其初步应用_第3页
第3页 / 共24页
资源描述:

《人教版 高中数学 选修23 学案3.1 回归分析的基本思想及其初步应用》由会员分享,可在线阅读,更多相关《人教版 高中数学 选修23 学案3.1 回归分析的基本思想及其初步应用(24页珍藏版)》请在装配图网上搜索。

1、2019年编人教版高中数学31回归分析的基本思想及其初步应用1通过对典型案例的探究,了解回归分析的基本思想、方法及其初步应用2会求回归直线方程,并用回归直线方程进行预报(重点)3了解最小二乘法的思想方法,理解回归方程与一般函数的区别与联系(难点)基础初探教材整理1回归直线方程阅读教材P80P82探究上面倒数第一行,完成下列问题1回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法2回归直线方程方程x是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中,是待定参数,其最小二乘估计分别为:其中i,i,(,)称为样本点的中心1如图311

2、四个散点图中,适合用线性回归模型拟合其中两个变量的是_(填序号)图311【解析】由图易知,两个图中的样本点在一条直线附近,因此适合用线性回归模型拟合【答案】2若y与x之间的一组数据为x01234y13556则y对x的回归直线一定经过的点是_【解析】由表中数据得2,4.因回归直线必过样本中心点(,),所以y与x的回归直线一定经过的点是(2,4)【答案】(2,4)教材整理2线性回归分析阅读教材P82探究P89,完成下列问题1线性回归模型(1)表达式(2)基本概念:a和b为模型的未知参数e是y与bxa之间的误差通常e为随机变量,称为随机误差x称为解释变量,y称为预报变量2衡量回归方程的预报精度的方法

3、(1)残差平方和法称为相应于点(xi,yi)的残差残差平方和越小,模型的拟合效果越好(2)残差图法残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适这样的带状区域的宽度越窄,说明模型的拟合精度越高(3)利用相关指数R2刻画回归效果其计算公式为:R21;其几何意义:R2越接近于1,表示回归的效果越好3建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等) 选修23|第三章统计案例(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程)(4)按一定规则(如

4、最小二乘法)估计回归方程中的参数(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等)若存在异常,则检查数据是否有误,或模型是否合适等判断(正确的打“”,错误的打“”)(1)求线性回归方程前可以不进行相关性检验()(2)在残差图中,纵坐标为残差,横坐标可以选为样本编号()(3)利用线性回归方程求出的值是准确值()(4)变量x与y之间的回归直线方程表示x与y之间的真实关系形式()(5)随机误差也就是残差()【解析】(1)因为如果两个变量之间不具有线性相关关系,就不用求线性回归方程了,求出的回归直线方程当然也不能很好的反映两变量间的关系(2)因为由残差图的方法步骤

5、可知,该说法正确(3)因为利用线性回归方程求出的值为估计值,而不是真实值(4)因为变量x与y之间的线性回归直线方程仅表示x与y之间近似的线性关系,x与y之间满足ybxae,其中e为随机误差(5)因为随机误差e是真实值y与bx之间的误差,而残差y是随机误差e的估计量【答案】(1)(2)(3)(4)(5)质疑手记预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问1: 解惑: 疑问2: 解惑: 疑问3: 解惑: 小组合作型求线性回归方程(2016临沂高二检测)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x3456y2.53

6、44.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程x;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)【精彩点拨】(1)按表中的数据在平面直角坐标系中描点即得散点图;(2)由公式求出,写出回归直线方程;(3)利用回归方程分析【自主解答】(1)由题设所给数据,可得散点图如图(2)由数据,计算得:86,4.5,3.5,又已知iyi66.5.所以,由最小二乘法确定的回归方程的系数为:0.7,3.50.7

7、4.50.35,因此,所求的回归直线方程为0.7x0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90(0.71000.35)19.65吨标准煤求回归直线方程的三个步骤1画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系2求回归系数:若存在线性相关关系,则求回归系数3写方程:写出回归直线方程,并利用回归直线方程进行预测说明再练一题1(2016南昌高二检测)已知x,y的取值如表所示:x0134y2.24.34.86.7若从散点图分析,y与x线性相关,且0.95x,则的值等于() 【导学号:97270058】A2.6B6.3C2D4.5【解析

8、】(0134)2,4.5,而回归直线方程过样本点的中心(2,4.5),所以0.954.50.9522.6.【答案】A线性回归分析已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x(元)1416182022y(件)1210753求y对x的回归直线方程,并说明回归模型拟合效果的好坏【精彩点拨】先利用求线性回归直线方程的方法步骤求出回归直线方程,再利用相关指数R2说明拟合效果【自主解答】(1416182022)18,(1210753)7.4,x1421621822022221 660,y122102725232327,xiyi14121610187205223620,1.15.7

9、.41.151828.1,所求回归直线方程为1.15x28.1.列出残差表:yii00.30.40.10.2yi4.62.60.42.44.4 (yii)20.3, (yi)253.2,R210.994,故回归模型的拟合效果很好1该类题属于线性回归问题,解答本题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析2刻画回归效果的三个方式(1)残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适(2)残差平方和法:残差平方和 (yii)2越小,模型的拟

10、合效果越好(3)相关指数法:R21越接近1,表明回归的效果越好再练一题2某运动员训练次数与成绩之间的数据关系如下:次数(x)3033353739444650成绩(y)3034373942464851(1)作出散点图;(2)求出回归方程;(3)作出残差图【解】(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系(2)39.25,40.875,x12 656,y13 731,xiyi13 810,1.041 5,0.003 875,回归方程为1.041 5x0.003 875.(3)残差分析某运动员训练次数与成绩之间的数据及相应的残差数据如下:

11、x3033353739444650y3034373942464851y1.241 10.365 60.551 40.468 41.385 40.177 90.094 91.071 1作残差图如图所示:由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适探究共研型非线性回归分析探究1如果两个相关变量x,y满足回归方程yc1x2c2,那么x,y具有线性相关关系吗?如何把它化归为线性回归方程问题?【提示】x,y不具有线性相关关系,但是若令zx2,则yc1x2c2可变换为yc1zc2,即化归为线性回归方程问题探究2如果两个相关变量x,y满足非线性回归方程yc1ec2x,如何转化为线性

12、回归方程问题?如果两个变量呈非线性相关关系,怎样求回归方程?【提示】令zln y,则原回归方程可变换为zbxa(aln c1,bc2)若两个变量呈非线性相关关系可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程探究3若对同一个问题建立的两种不同回归模型,怎样比较它们的拟合效果?【提示】有两种比较方法:(1)计算残差平方和,残差平方和小的模型拟合效果好;(2)计算相关指数R2,R2越接近于1的模型拟合效果越好下表为收集到的一组数据:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的

13、关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x40时y的值【精彩点拨】【自主解答】(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线yc1ec2x的周围,其中c1,c2为待定的参数(2)对两边取对数把指数关系变为线性关系,令zln y,则变换后的样本点应分布在直线zbxa,aln c1,bc2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为

14、0.272x3.849,e0.272x3.849.残差列表如下:yi711212466115325i6.44311.10119.12532.95056.770128.381290.325i0.5570.1011.8758.9509.2313.38134.675(3)当x40时,ye0.272403.8491 131.非线性回归问题的处理方法1指数函数型yebxa(1)函数yebxa的图象:(2)处理方法:两边取对数得ln yln ebxa,即ln ybxa.令zln y,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出a,b.2对数函数型ybln xa(1)函数ybln xa

15、的图象:(2)处理方法:设xln x,原方程可化为ybxa,再根据线性回归模型的方法求出a,b.3ybx2a型处理方法:设xx2,原方程可化为ybxa,再根据线性回归模型的方法求出a,b.再练一题3在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124y1612521试建立y与x之间的回归方程【解】画出散点图如图所示根据散点图可知y与x近似地呈反比例函数关系,设y,令t,则ykt,原数据变为:t4210.50.25y1612521由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系列表如下:序号tiyitiyity141664162562212244144

16、315512540.5210.25450.2510.250.062517.753694.2521.312 5430所以1.55,7.2.所以4.134 4,0.8.所以4.134 4t0.8.所以y与x的回归方程是0.8.构建体系1关于回归分析,下列说法错误的是()A回归分析是研究两个具有相关关系的变量的方法B散点图中,解释变量在x轴,预报变量在y轴C回归模型中一定存在随机误差D散点图能明确反映变量间的关系【解析】用散点图反映两个变量间的关系时,存在误差【答案】D2在两个变量y与x的回归模型中,分别选择了4个不同的模型它们的相关指数R2如下,其中拟合效果最好的模型是()A模型1的相关指数R2为

17、0.98B模型2的相关指数R2为0.80C模型3的相关指数R2为0.50D模型4的相关指数R2为0.25【解析】相关指数R2越接近于1,则该模型的拟合效果就越好,精度越高【答案】A3在研究气温和热茶销售杯数的关系时,若求得相关指数R20.85,则表明气温解释了_的热茶销售杯数变化,而随机误差贡献了剩余的_,所以气温对热茶销售杯数的效应比随机误差的效应大得多【解析】由相关指数R2的意义可知,R20.85表明气温解释了85%,而随机误差贡献了剩余的15%.【答案】85%15%4下列关于统计的说法:将一组数据中的每个数据都加上或减去同一个常数,方差恒不变;回归方程x必经过点(,);线性回归模型中,随

18、机误差eyii;设回归方程为5x3,若变量x增加1个单位,则y平均增加5个单位其中正确的为_(写出全部正确说法的序号)【解析】正确;正确;线性回归模型中,随机误差的估计值应为iyii,故错误;若变量x增加1个单位,则y平均减少5个单位,故错误【答案】5在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为:12345价格x1.41.61.822.2需求量y1210753已知iyi62,16.6,且y与x呈线性相关(1)求出y对x的回归方程;(2)如价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t). 【导学号:97270059】【解】(1)因为91.8,

19、377.4,iyi62,16.6,所以11.5,7.411.51.828.1,故y对x的回归方程为28.111.5x.(2)28.111.51.96.25(t)学业分层测评(建议用时:45分钟)学业达标一、选择题1为了研究变量x和y的线性相关性,甲、乙两人分别利用线性回归方法得到回归直线l1和l2,已知两人计算过程中,分别相同,则下列说法正确的是()Al1与l2一定平行Bl1与l2重合Cl1与l2相交于点(,)D无法判断l1和l2是否相交【解析】回归直线一定过样本点的中心(,),故C正确【答案】C2甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指

20、数R2分别如下表:甲乙丙丁R20.980.780.500.85哪位同学建立的回归模型拟合效果最好?()A甲B乙C丙D丁【解析】相关指数R2越大,表示回归模型的拟合效果越好【答案】A3对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是()【解析】用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适带状区域的宽度越窄,说明模型的拟合精度越高【答案】A4对于指数曲线yaebx,令Uln y,cln a,经过非线性化回归分析后,可转化的形式为()AUcbx BUbcxCycbx Dybcx【解析】由yaebx得ln yln

21、(aebx),ln yln aln ebx,ln yln abx,Ucbx.故选A.【答案】A5为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如表所示:父亲身高x(cm)174176176176178儿子身高y(cm)175175176177177则y对x的线性回归方程为()A.x1 B.x1C.88x D.176【解析】设y对x的线性回归方程为x,因为,17617688,所以y对x的线性回归方程为x88.【答案】C二、填空题6甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性进行分析,并用回归分析的方法分别求得相关指数R2与残差平方和Q(,)如下表:甲乙丙丁R20.670.6

22、10.480.72Q(,)106115124103则能体现A,B两个变量有更强的线性相关性的为_【解析】丁同学所求得的相关指数R2最大,残差平方和Q(,)最小此时A,B两变量线性相关性更强【答案】丁7在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验对这两个回归方程进行检验时,与实际数据(个数)对比结果如下:与实际相符数据个数与实际不符合数据个数总计甲回归方程32840乙回归方程402060总计7228100则从表中数据分析,_回归方程更好(即与实际数据更贴近)【解析】可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,甲回归方程的数据准确率为,而乙回

23、归方程的数据准确率为.显然甲的准确率高些,因此甲回归方程好些【答案】甲8如果某地的财政收入x与支出y满足线性回归方程ybxae(单位:亿元),其中b0.8,a2,|e|0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过_亿元. 【导学号:97270060】【解析】x10时,y0.8102e10e,|e|0.5,y10.5.【答案】10.5三、解答题9某服装店经营某种服装,在某周内纯获利y(元)与该周每天销售这种服装件数x之间的一组数据如下表:x3456789y66697381899091(1)求样本点的中心;(2)画出散点图;(3)求纯获利y与每天销售件数x之间的回归方程【解】(1

24、)6,79.86,样本点的中心为(6,79.86)(2)散点图如下:(3)因为4.75,51.36,所以4.75x51.36.10为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下:时间x/天123456繁殖个数y612254995190(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;(2)求y与x之间的回归方程【解】(1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数yc1ec2x的周围,于是令zln y,则x123456z1.792.483.223.894.555.25由计算器算得,0.69x1.112,则有e0.69x1.112.能力提升1(2016青

25、岛一中调研)某学生四次模拟考试中,其英语作文的减分情况如表:考试次数x1234所减分数y4.5432.5显然所减分数y与模拟考试次数x之间有较好的线性相关关系,则其线性回归方程为()Ay0.7x5.25 By0.6x5.25Cy0.7x6.25 Dy0.7x5.25【解析】由题意可知,所减分数y与模拟考试次数x之间为负相关,所以排除A.考试次数的平均数为(1234)2.5,所减分数的平均数为(4.5432.5)3.5,即直线应该过点(2.5,3.5),代入验证可知直线y0.7x5.25成立,故选D.【答案】D2某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2

26、356若x与y具有线性相关关系,则线性回归方程为_【解析】iyi6283105126158,9,4,6282102122344,0.7,40.792.3,故线性回归方程为0.7x2.3.【答案】0.7x2.33某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x()之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:时间二月上旬二月中旬二月下旬三月上旬旬平均气温x()381217旬销售量y(件)55m3324由表中数据算出线性回归方程x中的2,样本中心点为(10,38)(1)表中数据m_.(2)气象部门预测三月中旬的平均气温约为22 ,据此估计,该品牌的保暖衬衣在三月中旬的

27、销售量约为_件【解析】(1)由38,得m40.(2)由 ,得58,故2x58,当x22时,14,故三月中旬的销售量约为14件【答案】(1)40(2)144(2015全国卷)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值图312 (xi)2 (wi)2 (xi)(yi) (wi)(yi)46.65636.8289.81.61 469108.8表中wi,wwi.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售

28、量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为, .【解】(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型(2)令w,先建立y关于w的线性回归方程由于68, 563686.8100.6,所以y关于w的线性回归方程为100.668w,因此y关于x的回归方程为100.668.(3)由(2)知,当x49时,年销售量y的预报值100.668576.6,年利润z的预报值576.60.24966.32.根据(2)的结果知,年利润z的预报值0.2(100.668)xx13.620.12.所以当6.8,即x46.24时,取得最大值故年宣传费为46.24千元时,年利润的预报值最大.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!