回归分析的基本思想及其初步应用

上传人:nu****n 文档编号:138013516 上传时间:2022-08-19 格式:DOC 页数:25 大小:3.70MB
收藏 版权申诉 举报 下载
回归分析的基本思想及其初步应用_第1页
第1页 / 共25页
回归分析的基本思想及其初步应用_第2页
第2页 / 共25页
回归分析的基本思想及其初步应用_第3页
第3页 / 共25页
资源描述:

《回归分析的基本思想及其初步应用》由会员分享,可在线阅读,更多相关《回归分析的基本思想及其初步应用(25页珍藏版)》请在装配图网上搜索。

1、新课标 数 学选修1211回归分析的基本思想及其初步应用(教师用书独具)三维目标1知识与技能通过典型案例的探究,了解回归分析的基本思想,会对两个变量进行回归分析,明确解决回归模型的基本步骤,并对具体问题进行回归分析以解决实际应用问题了解最小二乘法的推导,解释残差变量的含义,了解偏差平方和分解的思想,了解判断刻画模型拟合效果的方法相关指数和残差分析掌握利用计算器求线性回归直线方程参数及相关系数的方法2过程与方法通过收集数据作散点图,分析散点图,求回归直线方程,分析回归效果,利用方程进行预报3情感、态度与价值观培养学生利用整体的观点和互相联系的观点来分析问题, 进一步加强数学的应用意识,培养学生学

2、好数学、用好数学的信心,加强与现实生活的联系,以科学的态度评价两个变量的相互关系重点难点重点:回归分析的基本方法、随机误差e的认识、残差图的概念、用残差及R2来刻画线性回归模型的拟合效果难点:回归分析的基本方法、残差概念的理解及拟合效果的判定、非线性回归向线性回归的转化教学时要以残差分析为重点,突出残差表和R2的计算,通过举例说明相关关系与确定性关系的区别,说明回归分析的必要性及其方法借助例题使学生掌握作散点图、求回归直线方程的方法,通过作残差图、计算R2让学生掌握拟合效果的判断方法对于非线性回归问题重点在如何转换,引导学生分析总结转化方法和技巧,从而化解难点(教师用书独具)教学建议 本节课建

3、议教师采取探究式教学,把“关注知识”转向“关注学生”,在教学过程中,把“给出知识”的过程转变为“引起活动,让学生探究知识的过程”,把“完成教学任务”转向“促进学生发展”,让学生成为课堂上的真正主人在教学中,知识点可由学生通过探索“发现”,让学生充分经历探索与发现的过程,并引导学生积极解决探索过程中发现的问题教学中不要以练习为主,而是定位在知识形成过程的探索,例题的解答也要由学生探讨、教师点拨,共同完成要注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等,引导学生体验数学中的理性精神,加强数学形式下的思考和推理能力教学流程创设问题情境,引出问题,引导学生探讨,从而引出回归分析

4、、线性回归模型、刻画回归效果的有关概念及解决方法利用填一填的形式,使学生自主学习本节基础知识,并反馈了解,对理解有困难的概念加以讲解引导学生在学习基础知识的基础上分析回答例题1的问题,并总结规律方法,完成变式训练引导学生分析例题2,根据图中的数据计算系数,求出回归方程,列出残差表,求出R2并判断拟合效果,完成变式训练完成当堂双基达标,巩固所学知识及应用方法,并进行反馈矫正归纳整理,进行课堂小结,整体认识本节所学知识,强调重点内容和规律方法通过老师启发引导,完成例题3,并要求学生借鉴例题3的解法完成变式训练引导学生分析例题3,让学生作出散点图,观察相关性,引出问题,即如何使问题转化为相关关系并用

5、线性回归分析二者关系课标解读1.会用散点图分析两个变量是否存在相关关系(重点)2会求回归方程,掌握建立回归模型的步骤,会选择回归模型(重点、难点)线性回归模型【问题导思】一台机器由于使用时间较长,生产的零件有一些会有缺陷按不同转速生产出有缺陷的零件的统计数据如下:转速x(转/秒)1614128每小时生产有缺陷的零件数y(件)119851.在平面直角坐标系中作出散点图【提示】2从散点图中判断x和y之间是否具有相关关系?【提示】有3若转速为10转/秒,能否预测机器每小时生产缺陷的零件件数?【提示】可以根据散点图作出一条直线,求出直线方程后可预测(1)回归直线方程: x,其中:,i,i.(2)变量样

6、本点中心:(,),回归直线过样本点的中心(3)线性回归模型:ybxae,其中e称为随机误差,a和b是模型的未知参数,自变量x称为解释变量,因变量y称为预报变量刻画回归效果的方式残差对于样本点(xi,yi)(i1,2,n)的随机误差的估计值iyii,称为相应于点(xi,yi)的残差残差图利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图残差图法残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高残差平方和残差平方和为(yii)2,残差平方和越小,模型拟合效果越好相关指数R

7、2R21,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归的效果越好回归分析的有关概念有下列说法:线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;通过回归方程x,可以估计和观测变量的取值和变化趋势;因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验其中正确命题的个数是()A1B2C3D4【思路探究】可借助于线性相关概念及性质逐一作出判断【自主解答】反映的正是最小二乘法思想,故正确反映的是画散点图的作用,也正确解释的是回归方程x的作用,故也正确是不正确的,在求回归方程

8、之前必须进行相关性检验,以体现两变量的关系【答案】C1解答例1中时,必须明确具有线性相关关系的两个变量间才能求得一个线性回归方程,否则求得的方程无实际意义因此必须先进行线性相关性判断,后求线性回归方程2回归分析的过程:(1)随机抽取样本,确定数据,形成样本点;(2)由样本点形成散点图,判断是否具有线性相关关系;(3)由最小二乘法确定线性回归方程;(4)由回归方程观察变量的取值及变化趋势关于变量y与x之间的回归直线方程叙述正确的是()A表示y与x之间的一种确定性关系B表示y与x之间的相关关系C表示y与x之间的最真实的关系D表示y与x之间真实关系的一种效果最好的拟合【解析】回归直线方程能最大可能地

9、反映y与x之间的真实关系,故选项D正确【答案】D线性回归分析已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x1416182022y1210753求y关于x的回归直线方程,并说明回归模型拟合效果的好坏【思路探究】回归模型拟合效果的好坏可以通过计算R2来判断,其值越大,说明模型的拟合效果越好【自主解答】(1416182022)18,(1210753)7.4,1421621822022221 660,iyi14121610187205223620,所以1.15,7.41.151828.1,所以所求回归直线方程是1.15x28.1.列出残差表:yii00.30.40.10.2yi

10、4.62.60.42.44.4所以(yii)20.3,(yi)253.2,R210.994,所以回归模型的拟合效果很好1回归直线方程能定量地描述两个变量的关系,系数,刻画了两个变量之间的变化趋势,其中表示x变化一个单位时,y的平均变化量利用回归直线可以对问题进行预测,由一个变量的变化去推测另一个变量的变化2线性回归分析中:(1)残差平方和越小,预报精确度越高(2)相关指数R2取值越大,说明模型的拟合效果越好某运动员训练次数与运动成绩之间的数据关系如下:次数(x)3033353739444650成绩(y)3034373942464851(1)作出散点图;(2)求出线性回归方程;(3)作出残差图,

11、并说明模型的拟合效果;(4)计算R2,并说明其含义【解】(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示(2)可求得39.25,40.875,12 656,13 731,iyi13 180,1.041 5,0.003 875,线性回归方程为1.041 5x0.003 875.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适(4)相关指数R20.985 5.说明了该运动员的成绩的差异有98.55%的可能性是由训练次数引起的.非线性回归分析下表为收集到的一组数据:x21232527293235y711212466115325(1)作出

12、x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x40时y的值【思路探究】(1)画出散点图或进行相关性检验,确定两变量x、y是否线性相关由散点图得x、y之间的回归模型(2)进行拟合,预报回归模型,求回归方程【自主解答】(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线yc1ec2x的周围,其中c1、c2为待定的参数(2)对两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应分布在直线zbxa,aln c1,bc2的周围,这样就可以利用线性回归模型来建立

13、y与x之间的非线性回归方程了,数据可以转化为:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为0.272x3.849,e0.272x3.849.残差如下表:yi711212466115325i6.44311.10119.12532.95056.770128.381290.325i0.5570.1011.8758.9509.2313.38134.675(3)当x40时,ye0.272x3.8491 131.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如yc1ec2

14、x,我们可以通过对数变换把指数关系变为线性关系,令zln y,则变换后样本点应该分布在直线zbxa(aln c1,bc2)的周围有一个测量水流量的实验装置,测得试验数据如下表:i1234567水高h(厘米)0.71.12.54.98.110.213.5流量Q(升/分钟)0.0820.251.811.237.566.5134根据表中数据,建立Q与h之间的回归方程【解】由表中测得的数据可以作出散点图,如图观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Qmhn(m,n是正的常数)两边取常用对数,则lg Qlg mnlg h.令ylg Q,xlg h,那么yn

15、xlg m,即为线性函数模型ybxa的形式(其中bn,alg m)由下面的数据表,用最小二乘法可求得2.509 7,0.707 7,所以n2.51,m0.196.ihiQixilg hiyilg Qixxiyi10.70.0820.154 91.086 20.0240.168 321.10.250.041 40.602 10.001 70.024 932.51.80.397 90.255 30.158 30.101 644.911.20.690 21.049 20.476 40.724 258.137.50.908 51.574 00.825 41.430 0610.266.51.008 61

16、.822 81.017 31.838 5713.51341.130 32.127 11.277 62.404 34.0225.140 13.780 76.642于是所求得的回归方程为Q0.196h2.51.没有理解相关指数R2的意义而致误关于x与y有如下数据:x24568y3040605070为了对x、y两个变量进行统计分析,现有以下两种线性模型:甲模型6.5x17.5,乙模型7x17,试比较哪一个模型拟合的效果更好【错解】R110.845.R110.82.又84.5%82%,乙选用的模型拟合的效果更好【错因分析】没有理解R2的意义是致错的根源,用相关指数R2来比较模型的拟合效果,R2越大,模

17、型的拟合效果越好,并不是R2越小拟合效果更好【防范措施】R21,R2越大,残差平方和越小,从而回归模型的拟合效果越好在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近1,表示回归的效果越好(因为R2越接近1,表示解释变量和预报变量的线性相关性越强)从根本上理解R2的意义和作用,就可防止此类错误的出现【正解】R110.845,R110.82,845%82%,所以甲模型拟合效果更好1在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据然后,可以通过残差1,2,n来判断模型拟合的效果,判断原始数据中是否存在可疑数据这方面的分析工作

18、称为残差分析2我们还可以用相关指数R2来反映回归的效果,其计算公式是:R21.显然,R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率.1已知x和y之间的一组数据x0123y1357则y与x的线性回归方程x必过点()A(2,2)B(,0)C(1,2) D(,4)【解析】(0123),(1357)4,回归方程x必过点(,4)【答案】D2(2013青岛高二检测)在下列各组量中:正方体的体积与棱长;一块农田的水稻产量与施肥量;人的身高与年龄;家庭的支出与收入;某户家庭的用电量与电价其中量与量之间的关系是相关关系的是()AB CD【

19、解析】是函数关系Va3;电价是统一规定的,与用电量有一定的关系,但这种关系是确定的关系中的两个量之间的关系都是相关关系,因为水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不确定;人的身高一开始随着年龄的增加而增大,之后则不变化或降低,在身高增大时,也不是均匀增大的;家庭的支出与收入有一定的关系,在一开始,会随着收入的增加而支出也增加,而当收入增大到一定的值后,家庭支出趋向于一个常数值,也不是确定关系【答案】D3下列命题正确的有_在线性回归模型中,e是bxa预报真实值y的随机误差,它是一个可观测的量;残差平方和越小的模型,拟合的效果越好;用R2来刻画回归方程,R2越小,拟合的效果越好;

20、在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,若带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高【解析】对于随机误差e是一个不可观测的量,R2越趋于1,拟合效果越好,故错误对于残差平方和越小,拟合效果越好,同理当残差点比较均匀地落在水平的带状区域时,拟合效果越好,故正确【答案】4下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗

21、为90吨标准煤试根据(2)求出的线性回归方程,预测技改后生产100吨甲产品比技改前少消耗多少吨标准煤(参考数值:32.5435464.566.5)【解】(1)如下图(2)iyi32.5435464.566.5,4.5,3.5,3242526286.0.7,3.50.74.50.35,因此,所求的线性回归方程为0.7x0.35.(3)根据回归方程预测,现在生产100吨产品消耗的标准煤的数量为0.71000.3570.35(吨),故耗能减少了9070.3519.65(吨标准煤).一、选择题1在画两个变量的散点图时,下面叙述正确的是()A预报变量在x轴上,解释变量在y轴上B解释变量在x轴上,预报变量

22、在y轴上C可以选择两个变量中任意一个变量在x轴上D可以选择两个变量中任意一个变量在y轴上【解析】结合线性回归模型ybxae可知,解释变量在x轴上,预报变量在y轴上,故选B.【答案】B2(2013泰安高二检测)在回归分析中,相关指数R2的值越大,说明残差平方和()A越大B越小C可能大也可能小 D以上均错【解析】R21,当R2越大时,(yii)2越小,即残差平方和越小【答案】B3设变量y对x的线性回归方程为22.5x,则变量x每增加一个单位时,y平均()A增加2.5个单位 B增加2个单位C减少2.5个单位 D减少2个单位【解析】回归直线的斜率2.5,表示x每增加一个单位,y平均减少2.5个单位【答

23、案】C4(2012湖南高考)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg【解析】由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确又线性回归方程必过样本中心点(,),因此B正确由线性回归方程中系数的意义知,x每增加1 cm,其体

24、重约增加0.85 kg,故C正确当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确【答案】D5在判断两个变量y与x是否相关时,选择了4个不同的模型,它们的相关指数R2分别为:模型1的相关指数R2为0.98,模型2的相关指数R2为0.80,模型3的相关指数R2为0.50,模型4的相关指数R2为0.25.其中拟合效果最好的模型是()A模型1 B模型2C模型3 D模型4【解析】相关指数R2能够刻画用回归模型拟合数据的效果,相关指数R2的值越接近于1,说明回归模型拟合数据的效果越好【答案】A二、填空题6在研究身高和体重的关系时,求得相关指数R2_,可以叙述为“身

25、高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多【解析】结合相关指数的计算公式R21可知,当R20.64时,身高解释了64%的体重变化【答案】0.647调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:0.254x0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元【解析】以x1代x,得0.254(x1)0.321,与0.254x0.321相减可得,年饮食支出平均增加0.254万元【答案】0.2548已知回

26、归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是_【解析】由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得51.23(x4),即1.23x0.08.【答案】1.23x0.08三、解答题9某省2013年的阅卷现场有一位质检老师随机抽取5名学生的总成绩和数学成绩(单位:分)如下表所示:学生ABCDE总成绩(x)482383421364362数学成绩(y)7865716461(1)作出散点图;(2)对x与y作回归分析;(3)求数学成绩y对总成绩x的回归直线方程;(4)如果一个学生的总成绩为500分,试预测这个学生的数学成绩【解】(1)散点图如图所示:

27、(2),x819 794,y23 167,xiyi137 760.r )0.989.因此可以认为y与x有很强的线性相关关系(3)回归系数0.132 452,14.501 315.回归方程为0.132 452x14.501 315.(4)当x500时,81.即当一个学生的总成绩为500分时,他的数学成绩约为81分10(2012福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程bxa,其中b20,ab;(2)预计在今后的销售中,销量与单价仍然服从(1)中

28、的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)【解】(1)由于(88.28.48.68.89)8.5,(908483807568)80,又b20,所以ab80208.5250,从而回归直线方程为20x250.(2)设工厂获得的利润为L元,依题意得Lx(20x250)4(20x250)20x2330x1 00020(x8.25)2361.25.当且仅当x8.25时,L取得最大值故当单价定为8.25元时,工厂可获得最大利润11在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:年龄x2327394145495053

29、545657586061脂肪含量y9.517.821.225.927.526.328.229.630.231.430.833.535.234.6(1)作出散点图,并判断y与x是否线性相关若线性相关,求线性回归方程;(2)求相关指数R2,并说明其含义;(3)给出37岁时人的脂肪含量的预测值【解】(1)散点图如图所示由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系设线性回归方程为x,则由计算器算得0.576,0.448,所以线性回归方程为0.576x0.448.(2)残差平方和: (yii)237.78.总偏差平方和:(yi)2644.

30、99.R210.941.R20.941,表明年龄解释了94.1%的脂肪含量变化(3)当x37时,0.576370.44820.9,故37岁时人的脂肪含量约为20.9%.(教师用书独具)为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散点图并求回归方程;(2)求出R2;(3)进行残差分析【思路探究】(1)由表作出散点图,求出系数值,即可写出回归方程(2)列出残差表,计算R2,由R2的值判断拟合效果(3)由(2)中残差表中数值,进行回归分析【自主解答】(1)散

31、点图如图(51015202530)17.5,(7.258.128.959.9010.911.8)9.487,2 275,iyi1 076.2.计算得,0.183,6.285,所求线性回归方程为6.2850.183x.(2)列表如下:yii0.050.0050.080.0450.040.025yi2.241.370.540.411.412.31所以(yii)20.013 18,(yi)214.678 4.所以,R210.999 1,回归模型的拟合效果较好(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型

32、;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系建立回归模型的基本步骤:(1)确定解释变量和预报变量;(2)画散点图,观察是否存在线性相关关系;(3)确定回归方程的类型,如ybxa;(4)按最小二乘法估计回归方程中的参数;(5)得结果后分析残差图是否异常,若存在异常,则检查数据是否有误,或模型是否合适假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有关的统计资料如下表所示使用年限x23456维修费用y2.23.85.56.57.0若由资料知y对x呈线性相关关系试求:(1)线性回归方程x的回归系数、;(2)求相关指数R2;(3)估计使用年限为10年时,维修费用是多少?【解】(1)由已知数据制成下表i12345合计xi2345620yi2.23.85.56.57.025由此可得4,5,1.23,51.2340.08,1.23x0.08.(2)R2110.958 7.(3)回归直线方程为1.23x0.08,当x10(年)时,1.23100.0812.38(万元),即估计使用10年时维修费用是12.38万元.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!