高中数学3.1回归分析的基本思想及其初步应用第2课时教案新人教版选修23

上传人:仙*** 文档编号:125947961 上传时间:2022-07-27 格式:DOC 页数:9 大小:2.82MB
收藏 版权申诉 举报 下载
高中数学3.1回归分析的基本思想及其初步应用第2课时教案新人教版选修23_第1页
第1页 / 共9页
高中数学3.1回归分析的基本思想及其初步应用第2课时教案新人教版选修23_第2页
第2页 / 共9页
高中数学3.1回归分析的基本思想及其初步应用第2课时教案新人教版选修23_第3页
第3页 / 共9页
资源描述:

《高中数学3.1回归分析的基本思想及其初步应用第2课时教案新人教版选修23》由会员分享,可在线阅读,更多相关《高中数学3.1回归分析的基本思想及其初步应用第2课时教案新人教版选修23(9页珍藏版)》请在装配图网上搜索。

1、3.1 回归分析的基本思想及其初步应用(2)【学情分析】: 教学对象是高二理科学生,学生已掌握建立线性回归模型的知识,并能用所学知识解决某些简朴的实际问题。在教学中,要结合实例,让学生理解随机误差产生的因素。初步理解可以通过求回归模型的有关指数或运用残差分析不同的回归模型的拟合精确度。在起点高的班级中通过让学生观测、思考与讨论,进一步体会回归分析中的数理计算,及运用有关指数与残差分析来刻画模型拟合效果,初步形成运用记录措施解决实际问题的基本思想,结识记录措施在决策中的作用。【教学目的】:(1)知识与技能:理解求线形回归方程的两个计算公式的推导过程,、回归平方和;理解随机误差产生的因素;理解判断

2、刻画模型拟合效果的措施有关指数和残差分析;理解非线性模型通过变换转化为线性回归模型。(2)过程与措施:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程,从中也找出存在的局限性,从而有进行回归分析的必要性,进而学习有关指数,用有关指数来刻画回归的效果。(3)情感态度与价值观:从实际问题中发现自己已有知识的局限性之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,敢于求知的良好个性品质,引导学生积极进取。【教学重点】: 1. 理解判断刻画模型拟合效果的措施有关指数和残差分析; 2. 通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。【教学难点】:1.

3、 理解随机误差产生的因素,用残差平方和衡量回归方程的预报精度;2. 理解判断刻画模型拟合效果的措施有关指数和残差分析。【教学过程设计】:教学环节教学活动设计意图一、创设情境1由例1知,体重的值受身高或随机误差的影响。 2问题一:身高172cm的女大学生的体重一定是60.316kg吗?如果不是,其因素是什么?引入回归分析的效果评价的三个记录量二、探究新知解答问题一:显然,身高172cm的女大学生的体重不一定是60.316kg,但一般可以觉得她的体重接近于60.316kg.上图3.1-2中的样本点和回归直线的互相位置阐明了这一点.由于所有的样本点不共线,而只是散布在某一条直线的附近,因此身高和体重

4、的关系可用下面的线性回归模型来表达: y=bx+a+e (3)这里a和b为模型的未知参数,e是y与之间的误差。一般e为随机变量,称为随机误差,它的均值E(e)=0,方差D(e)=.这样线性回归模型的完整体现式为: (4) 在线性回归模型(4)中,随机误差e的方差越小,通过回归直线 (5)预报真实值y的精度越高。随机误差是引起预报值与真实值y之间的误差的因素之一,大小取决于随机误差的方差。另一方面,由于公式(1)和(2)中为截距和斜率的估计值,它们与真实值a和b之间也存在误差,这种误差是引起预报值与真实值y之间误差的另一种因素。思考1、产生随机误差项e的因素是什么?答:事实上,从上例中,一种人的

5、体重值除了受身高的影响外,还受到许多其他因素的影响。例如饮食习惯、与否喜欢运动、度量误差等。此外,我们选用的线性模型往往只是一种近似的模型。所有这些因素都会导致随机误差项e的产生。问题二、在线性回归模型中,e是用预报真实值y的误差,它是一种不可观测的量,那么应当如何研究随机误差?如何衡量预报的精度?解答问题二:由于随机误差是随机变量,因此可以通过这个随机变量的数字特性来刻画它的某些总体特性。均值是反映随机变量取值平均水平的数字特性,方差是反映随机变量集中于均值限度的数字特性,而随机误差的均值为0,因此可以用方差来衡量随机误差的大小。为了衡量预报的精度,需要估计的值。一种自然的想法是通过样本方差

6、来估计总体方差。如何得到随机变量e的样本呢?由于模型(3)或(4)中的e隐含在预报变量y中,我们无法精确地把它从y中分离出来,因此也就无法得到随机变量e的样本。解决问题的途径是通过样本的估计值来估计。根据截距和斜率的估计公式(1)和(2),可以建立回归方程 因此是(5)中的估计量。由于随机误差,因此是e的估计量,对于样本点 而言,相称于它们的随机误差为 ,i=1,2, ,n,其估计值为 ,i=1,2, ,n,称为相应于点的残差(residual)。类比样本方差估计总体方差的思想,可以用 (n2)作为的估计量,其中由公式(1)(2)给出,称为残差平方和(residual sum of squar

7、es),可以用衡量回归方程的预报精度。一般,越小,预报精度越高。学生动手计算出例1中的残差(如下表)与残差平方和。编号12345678身高/cm165165157170175165155170体重/kg4857505464614359yi54.37354.37347.58158.61862.86354.37345.88358.618ei-6.3732.6272.419-4.6181.1376.627-2.8830.382学习要领:注意、的区别;当残差平方和越小,此时模型的拟合效果越好;对于多种不同的模型,我们还可以引入有关指数来刻画回归的效果,它表达解释变量对预报变量变化的奉献率. 的值越接近

8、于1,阐明残差平方和越小,也就是说模型拟合的效果越好,即解释变量和预报变量的线性有关性越强.代入例1中的数据知例1中的,表白“女大学生的身高解释了64的体重变化”,或者说“女大学生的体重差别有64是由身高引起的”。即解释变量对总效应约奉献了64%,而随机误差奉献了剩余的36%,因此身高对体重的效应比随机误差的效应大得多。用身高预报体重时,需要注意下列问题:1 回归方程只合用于我们研究的样本的总体。2 我们所建立的回归方程一般均有时间性。3 样本取值的范畴会影响回归方程的合用范畴。4 不能盼望回归方程得到的预报值就是预报变量的精确值。一般地,建立回归模型的基本环节为:(1) 拟定研究对象,明确哪

9、个变量是解释变量,哪个变量是预报变量;(2) 画出拟定好的解释变量和预报变量的散点图,观测它们之间的关系(如与否存在线性关系等);(3) 由经验拟定回归方程的类型(如我们观测到数据呈线性关系,则选用线性回归方程y=bx+a);(4) 按一定规则估计回归方程中的参数(如最小二乘法);(5) 得出成果后分析残差图与否有异常(个别数据相应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据与否有误,或模型与否合适等。问题三:观测图31-3中的残差图,样本点是如何分布?有无异常状况(个别数据相应残差过大,或残差呈现不随机的规律性等等)?师:提出问题,指引学生画出残差图(以残差为纵坐标,样本

10、编号或身高或体重为横坐标作出图形),引导学生进行残差分析,从而做到检查数据与否有误,或模型与否合适等。生:分析、讨论。从残差图中可以看到第1个样本点和第6个样本点的残差较大,需要确认与否浮现采集的错误,指引学生去掉这两个数据后重新再计算回归方程与有关指数,理解到拟合的效果会更好。引导学生归纳残差所能阐明的状况: 样本点的残差比较大,确认采集数据时与否浮现人为的错误或其她因素; 残差点比较均匀地落在水平的带状区域中,阐明选用的模型比较合适,带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高。结合实例由成果分析残差图与否异常,养成从实际问题出发,抽象为数学问题中的线性回归问题,从而指引实

11、际问题的解决。学生思考,回答 引导学生运用残差也可以分析所求出的模型的拟合效果通过学生动手计算感受有关指数与残差分析阐明回归方程的预报状况。三、例题选讲例2:一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列于下表中,试建立y与x之间的回归方程。编号1234567温度x/C21232527293235产卵数y/个711212466115325问题四:例2中如何选择解释变量与预报变量?师:读例2的规定,引导学生理解例题含义。生:思考、讨论、论述自己的理解。形成把温度x作自变量,红铃虫的产卵数y作因变量的共识问题四:观测图31-4中的散点图,红铃虫的产卵数y与温度x具有线性关系吗?除线性关系

12、外,还学过哪些常用的函数关系?师:绘制散点图31-4,引导学生观测散点图的特点:随着自变量的增长,因变量也随之增长。引导学生探究红铃虫的产卵数y与温度x更也许是什么关系,选择几种模型,例如线性回归模型、二次函数模型、指数函数模型。而二次与指数函数模型是属于非线性回归模型。生:讨论、回忆某些常用函数图象的特点,判断红铃虫的产卵数y与温度x的也许关系从散点图中可以看到样本点分布在指数函数曲线的周边。问题五:请学生思考能否把模型通过变换后转化为此外两个变量的线性关系?师:提出问题,引导学生寻找变换的措施,在学生讨论后给出具体的措施。生:思考、讨论、解释。解答过程如下:对两边取自然对数令,建立与之间的

13、线性回归方程问题六:通过变换后指数函数模型转化为线性回归模型,你如何得到这个线性回归模型的参数估计?师:提出问题,引导学生分组讨论,启发学生把原变量的观测数据转化为新变量的数据,然后让学生给出每种线性回归模型的参数估计。生:以组为单位进行数据变换,求参数的最小二乘估计(可以用计算器)解答过程如下:令,即分析与之间的关系,通过画散点图(如下图),可知与之间是存在着线性回归关系,可以用最小二乘法求出线性回归方程列表计算出各个量编号1234567合计温度x/C21232527293235192产卵数y/个711212466115325569z=ln y1.946 2.398 3.045 3.178

14、4.190 4.745 5.784 25.285 xi2441529625729841102412255414xizi40.9 55.2 76.1 85.8 121.5 151.8 202.4 733.7 27.429 3.612 5414 733.71问题七:我们的目的是建立红铃虫的产卵数y与温度x的模型,如何使得到的线性回归模型再变回红铃虫的产卵数y与温度x的模型?师:提出问题。生:进行变换,每组得到红铃虫的产卵数y与温度x的模型。 由于,因此,即。引导学生分析哪个变量作自变量,哪个变量作因变量引导学生根据散点图判断两个变量的关系,使学生理解不是任何两个变量都一定是线性关系。使学生进一步体

15、会把因变量与自变量的非线性关系通过变换后转化为此外两个变量的线性关系的措施。使学生熟悉线性回归模型的参数估计的措施得出红铃虫的产卵数y与温度x的模型四、练习1 试对下列非线性模型进行合适的变形,使之线性化; 解:对两边取自然对数,即 令,则有令,则有巩固知识五、小结1 初步理解用残差平方和如何评价模型拟合效果的好坏;2 注意回归方程合用的范畴、时间。3 归纳非线性回归模型的求解环节:画出两个变量的散点图;判断与否线性有关;非线性有关模型要进行变换,转为线性回归模型;求出回归模型的方程(运用最小二乘法)。反思归纳练习与测试1 下面4 个散点图中,不适合用线性回归模型拟合其中两个变量的是( A )

16、A B C D2 将非线性模型进行合适变形使之线性化。答案:3 已知回归方程,则样本点P(4,271)的残差为_。答案:4 已知线性有关的两变量,的三个样本点A(0,0),B(1,3),C(4,11),若用直线AB作为其预测模型,则点C 的残差是_。答案:,。5 若一组观测值(x1,y1)、(x2,y2)、(xn,yn)之间满足yi=bxi+a+ei (i=1、2. n)若ei恒为0,则R2为 答案:16 已知线性有关的两变量,的三个样本点A(0,0),B(1,3),C(4,11),若用直线AB作为其预测模型,则其有关指数_。答案:,7 既有一种由身高预测体重的回归方程:体重预测值4(磅/英寸)身高130(磅)。其中体重和身高分别以磅和英寸为单位,已知1英寸25 cm,1磅045 kg,则该回归方程应当是_。答案:体重预测值072(kg/ cm)身高585(kg)

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!