11回归分析的基本思想及其初步应用

上传人:痛*** 文档编号:211279267 上传时间:2023-05-19 格式:PPT 页数:59 大小:2.99MB
收藏 版权申诉 举报 下载
11回归分析的基本思想及其初步应用_第1页
第1页 / 共59页
11回归分析的基本思想及其初步应用_第2页
第2页 / 共59页
11回归分析的基本思想及其初步应用_第3页
第3页 / 共59页
资源描述:

《11回归分析的基本思想及其初步应用》由会员分享,可在线阅读,更多相关《11回归分析的基本思想及其初步应用(59页珍藏版)》请在装配图网上搜索。

1、 第一课时第一课时基础知识梳理基础知识梳理温故夯基温故夯基温故夯基温故夯基1.我们在我们在必修必修3中已经学习了统计的知识中已经学习了统计的知识,还记还记得抽样方法吗得抽样方法吗?三种随机抽样方法是三种随机抽样方法是_、_和和_.2.我们还学习了用样本的频率分布估计我们还学习了用样本的频率分布估计_,用样本的数字特征估计用样本的数字特征估计_.3.必修必修3主要研究两个变量的主要研究两个变量的_相关性相关性,并并建立了建立了_.简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样总体分布总体分布总体的数字特征总体的数字特征线性线性回归直线方程回归直线方程两个变量的关系两个变量的关系不相关不

2、相关相关关系相关关系函数关系函数关系线性相关线性相关非线性相关非线性相关现实生活中两个变量间的关系现实生活中两个变量间的关系:相关关系相关关系:对于两个变量,当自变量取值一定时,因:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系变量的取值带有一定随机性的两个变量之间的关系.函数关系函数关系中的两个变量间是一种确定性关系中的两个变量间是一种确定性关系相关关系相关关系是一种非确定性关系是一种非确定性关系函数关系是一种理想的关系模型函数关系是一种理想的关系模型相关关系在现实生活中大量存在,是更一般的情况相关关系在现实生活中大量存在,是更一般的情况 变量间的相互关系变

3、量间的相互关系基础知识框图表解基础知识框图表解变量间关系变量间关系函数关系函数关系相关关系相关关系 散点图散点图线性回归线性回归线性回归方程线性回归方程重点知识回顾重点知识回顾1 1、相关关系、相关关系 (1 1)概念:自变量取值一定时,因变量的取值带有一)概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系。定随机性的两个变量之间的关系叫相关关系。(2 2)相关关系与函数关系的异同点。)相关关系与函数关系的异同点。相同点:两者均是指两个变量间的关系。相同点:两者均是指两个变量间的关系。不同点:函数关系是一种确定关系,是一种因果系;不同点:函数关系是一种确定关系,是

4、一种因果系;相关关系是一种非确定的关系。相关关系是一种非确定的关系。2、两个变量的线性相关、两个变量的线性相关 (1 1)回归分析)回归分析 对具有相关关系的两个变量进行统计分析的方法叫对具有相关关系的两个变量进行统计分析的方法叫回归分析。通俗地讲,回归分析是寻找相关关系中非回归分析。通俗地讲,回归分析是寻找相关关系中非确定关系的某种确定性。确定关系的某种确定性。(2 2)散点图)散点图 A A、定义;定义;B B、正相关、负相关。正相关、负相关。(1 1)回归直线:观察散点图的特征,如果各点大)回归直线:观察散点图的特征,如果各点大致分布在一条直线的附近,就称两个变量之间具有致分布在一条直线

5、的附近,就称两个变量之间具有线性相关的关系,这条直线叫做回归直线线性相关的关系,这条直线叫做回归直线3 3、回归直线方程、回归直线方程正相关正相关负相关负相关(2)最小二乘法)最小二乘法:样本点的中心样本点的中心:回回归归方程方程:课堂互动讲练课堂互动讲练该类题属于线性回归问题该类题属于线性回归问题,解答本类题目的关键首解答本类题目的关键首先应先通过散点图来分析两变量间的关系是否相关先应先通过散点图来分析两变量间的关系是否相关,然后再利用求回归方程的公式求解回归方程然后再利用求回归方程的公式求解回归方程.题型一题型一题型一题型一线性回归分析线性回归分析学生学生学科成学科成绩绩ABCDE数学成数

6、学成绩绩(x)8876736663物理成物理成绩绩(y)7865716461(1)画出散点图;)画出散点图;(2)求物理成绩)求物理成绩y对数学成绩对数学成绩x的回归直线方程;的回归直线方程;(3)一名学生的数学成绩是)一名学生的数学成绩是96,试预测他的物理,试预测他的物理成绩成绩.【思路点拨思路点拨】先画散点图先画散点图,分析物理与数学成绩是分析物理与数学成绩是否有线性相关关系否有线性相关关系,若相关再利用线性回归模型求若相关再利用线性回归模型求解预报变量解预报变量.【解解】(1)散点图如图:散点图如图:【题后点评题后点评】求回归直线方程的一般方法是求回归直线方程的一般方法是:作出作出散点

7、图散点图,将问题所给的数据在平面直角坐标系中进将问题所给的数据在平面直角坐标系中进行描点行描点,这样表示出的两个变量的一组数据的相关这样表示出的两个变量的一组数据的相关图形就是散点图图形就是散点图,从散点图中我们可以判断样本点从散点图中我们可以判断样本点是否呈条状分布是否呈条状分布,进而判断两个变量是否具有相关进而判断两个变量是否具有相关关系关系.例题例题1 1 从某大学中随机选出从某大学中随机选出8 8名女大学生,其身名女大学生,其身高和体重数据如下表:高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359求根据一名女

8、大学生的身高预报她的体重的求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为回归方程,并预报一名身高为172172的女大的女大学生的体重。学生的体重。1.散点图;散点图;2.2.回归方程:回归方程:3.3.通过探究栏目引入通过探究栏目引入“线性回归模型线性回归模型”。此处可。此处可以引导学生们体会函数模型与回归模型之间的以引导学生们体会函数模型与回归模型之间的差别。差别。分析:由于问题中分析:由于问题中要求根据身高预报要求根据身高预报体重,因此选取身体重,因此选取身高为自变量,体重高为自变量,体重为因变量为因变量 第二课时第二课时题型二题型二题型二题型二非线性回归分析非线性回归分

9、析对于非线性回归问题对于非线性回归问题,并且没有给出经验公式并且没有给出经验公式,这这时我们可以画出已知数据的散点图时我们可以画出已知数据的散点图,把它与必修模把它与必修模块块数学数学1中学过的各种函数(幂函数、指数函中学过的各种函数(幂函数、指数函数、对数函数等)的图象作比较数、对数函数等)的图象作比较,挑选一种跟这些挑选一种跟这些散点拟合得最好的函数散点拟合得最好的函数,然后采用适当的变量代换然后采用适当的变量代换,把问题转化为线性回归问题把问题转化为线性回归问题,使其得到解决使其得到解决.例例例例2 2 炼钢厂出钢时所用的盛钢水的钢包炼钢厂出钢时所用的盛钢水的钢包,在使用在使用过程中过程

10、中,由于钢液及炉渣对包衬耐火材料的侵蚀由于钢液及炉渣对包衬耐火材料的侵蚀,使使其容积不断增大其容积不断增大,请根据表格中的数据找出使用次请根据表格中的数据找出使用次数数x与增大的容积与增大的容积y之间的关系之间的关系.使用次使用次数数x23456789增大的增大的容容积积y6.428.20 9.58 9.50 9.70 10.00 9.93 9.99使用使用次数次数x10111213141516增大增大的容的容积积y10.49 10.59 10.60 10.80 10.60 10.90 10.76【解解】先根据试验数据作散点图先根据试验数据作散点图,如图所示:如图所示:zabt,t、z的数值对

11、应表为:的数值对应表为:【题后点评题后点评】作出散点图,由散点图选择合适的作出散点图,由散点图选择合适的回归模型是解决本题的关键,在这里线性回归模回归模型是解决本题的关键,在这里线性回归模型起了转化的作用型起了转化的作用.第三课时第三课时探究?探究?身高为身高为172172的女大学生的体重一定的女大学生的体重一定是是60.316kg60.316kg吗吗?如果不是?如果不是,其原因是什其原因是什么么?(1 1)由图形观察可以看出,样本点呈条状分布,)由图形观察可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间

12、的关系。用线性回归方程刻画它们之间的关系。(2 2)从散点图还可以看到,样本点散布在某一)从散点图还可以看到,样本点散布在某一条直线的附近,而不是一条直线上,所以不能用条直线的附近,而不是一条直线上,所以不能用一次函数来描述它们之间的关系。一次函数来描述它们之间的关系。这时我们用下面的线性回归模型来描述身高和体这时我们用下面的线性回归模型来描述身高和体重的关系:重的关系:+其中和为模型其中和为模型的的未知参数未知参数,e e是是y与与 之间的误差之间的误差,通常通常称为称为随随机误差机误差。产生随机误差的原因是什么?产生随机误差的原因是什么?e 产生的主要原因:产生的主要原因:(1)所用确定性

13、函数模拟不恰当;所用确定性函数模拟不恰当;(2)忽略了某些因素的影响;忽略了某些因素的影响;(3)观测误差,如使用的测量工具不同等观测误差,如使用的测量工具不同等函数模型与回归模型之间的差别函数模型与回归模型之间的差别一次函数模型:y=bx+a 线性回归模型线性回归模型y=bx+a+e增加了随机误差项增加了随机误差项e,因,因变量变量y 的值由自变量的值由自变量x和随机误差项和随机误差项e 共同确定,即自共同确定,即自变量变量x 只能只能解析部分解析部分y 的变化的变化.在统计中,我们也把自变量在统计中,我们也把自变量x称为称为解析变量解析变量,因变量因变量y称为称为预报变量预报变量.线性回归

14、模型:y=bx+a+e随机误差随机误差e的估计量的估计量样本点:样本点:相应的随机误差为:相应的随机误差为:随机误差的估计值为:随机误差的估计值为:称为相应于点称为相应于点 的的残差残差.残差分析残差分析在研究两个变量间的关系时,首先要根据散点图来粗在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否是线性相关,是否可以用线性回归模略判断它们是否是线性相关,是否可以用线性回归模型来拟合数据型来拟合数据.然后,可以通过残差然后,可以通过残差 来来判断模型拟合的效果,判断原始数据中是否存在可疑判断模型拟合的效果,判断原始数据中是否存在可疑数据数据.这方面的分析工作称为残差分析这方面的分析工

15、作称为残差分析.0.3820.382-2.883-2.8836.6276.6271.1371.137-4.618-4.6182.4192.4192.6272.627-6.373-6.373残差残差59594343616164645454505057574848体重体重/kg/kg170170155155165165175175170170157157165165165165身高身高/cm/cm8 87 76 65 54 43 32 21 1编号编号下表为女大学生身高和体重的原始数据以及相应的残下表为女大学生身高和体重的原始数据以及相应的残差数据:差数据:e以纵坐标为残差,横坐标为编号,作出图形

16、(以纵坐标为残差,横坐标为编号,作出图形(残差图残差图)来分析残差特性来分析残差特性.由图可知,第由图可知,第1个样本点和第个样本点和第6个样本点的残差比较大,个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的需要确认在采集这两个样本点的过程中是否有人为的错误错误.如果数据采集有错误,就予以纠正,然后重新如果数据采集有错误,就予以纠正,然后重新利用线性回归模型拟合数据利用线性回归模型拟合数据;如果数据采集没有错误,如果数据采集没有错误,则需要寻找其他原因则需要寻找其他原因.如何刻画模型拟合的精度?如何刻画模型拟合的精度?相关指数:相关指数:在含有一个解释变量的线性模型中,在含

17、有一个解释变量的线性模型中,R2恰好等于相关恰好等于相关系数系数r的平方的平方.R2取值越大,则残差平方和越小,即模型的拟合效果取值越大,则残差平方和越小,即模型的拟合效果越好越好.R2=0.64,表明:,表明:“女大学生的身高解释了女大学生的身高解释了64的体的体重变化重变化”,或者说,或者说“女大学生的体重差异有女大学生的体重差异有64是是由身高引起的由身高引起的”.解释解释预报预报1题型三题型三题型三题型三残差分析残差分析通过对残差图的分析,得出模型的拟合效果通过对残差图的分析,得出模型的拟合效果.在在7块形状、大小相同的并排试验田上进行块形状、大小相同的并排试验田上进行施肥量对水稻产量

18、影响的试验,得到如下表所示的施肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:一组数据(单位:kg):例例例例3 3施肥量施肥量x/kg15202530354045水稻水稻产产量量y/kg330345365405445450455(1)以施肥量以施肥量x为解释变量,水稻产量为解释变量,水稻产量y为预报变量,为预报变量,作出散点图;作出散点图;(2)求求y与与x之间的回归方程,并求施肥量为之间的回归方程,并求施肥量为28 kg时水稻产量的预报值;时水稻产量的预报值;(3)计算残差,并计算残差平方和;计算残差,并计算残差平方和;(4)求求R2,并说明其含义,并说明其含义【解解】(1)散点

19、图如图所示:)散点图如图所示:(2)由散点图可以看出,样本点呈条状分布,)由散点图可以看出,样本点呈条状分布,施肥量和水稻产量有较好的线性相关关系,因此施肥量和水稻产量有较好的线性相关关系,因此可以用线性回归方程近似刻画它们之间的关系。可以用线性回归方程近似刻画它们之间的关系。【题后点评题后点评】在求回归方程时,先画散点图,看在求回归方程时,先画散点图,看样本是否能很好地符合线性相关关系或进行相关样本是否能很好地符合线性相关关系或进行相关性检验性检验.相关指数相关指数R2表示解释变量对预报变量的表示解释变量对预报变量的贡献率贡献率.变式训练变式训练变式训练变式训练次数次数(x)30333537

20、39444650成成绩绩(y)3034373942464851某运动员训练次数与运动成绩之间的数据关系如某运动员训练次数与运动成绩之间的数据关系如下下:(1)作出散点图;)作出散点图;(2)求出线性回归方程;)求出线性回归方程;(3)作出残差图;)作出残差图;(4)计算)计算R2,并作出解释;,并作出解释;(5)试预测该运动员训练)试预测该运动员训练47次及次及55次的成绩次的成绩.解:解:(1)作出该运动员训练次数作出该运动员训练次数(x)与成绩与成绩(y)之之间的散点图间的散点图,如图所示:如图所示:由散点图可知由散点图可知,它们它们之间具有线性相关之间具有线性相关关系关系.(4)计算相关

21、指数计算相关指数R2计算相关指数计算相关指数R20.9855.说明了该运动的成绩的说明了该运动的成绩的差异有差异有98.55%是由训练次数引起的是由训练次数引起的(5)作出预报作出预报由上述分析可知,我们可用回归方程由上述分析可知,我们可用回归方程1.0415x0.003875作为该运动员成绩的预报值作为该运动员成绩的预报值将将x47和和x55分别代入该方程可得分别代入该方程可得y49和和y57.故预测运动员训练故预测运动员训练47次和次和55次的成绩分别为次的成绩分别为49和和57.建立回归模型的基本步骤:建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪)确定研究对象,

22、明确哪个变量是解释变量,哪个变量是预报变量个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系);观察它们之间的关系(是否存在线性关系);(3)由经验确定回归方程的类型(如观察到数据呈线)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程性关系,则选用线性回归方程y=bx+a););(4)按一定规则估计回归方程中的参数(如最小二)按一定规则估计回归方程中的参数(如最小二乘法);乘法);(5)得出结果后分析残差图是否异常(个别数据对)得出结果后分析残差图是否异常(个别数据对应残差过大,或残

23、差呈现不随机的规律性等),若存应残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误,或模型是否合适等在异常,则检查数据是否有误,或模型是否合适等.1)1)确定解释变量和预报变量确定解释变量和预报变量;2)2)画出散点图画出散点图;3)3)确定回归方程类型确定回归方程类型;4)4)求出回归方程求出回归方程;5)5)利用相关指数或残差进行分析利用相关指数或残差进行分析.建立回归模型的基本步骤建立回归模型的基本步骤预报精度预报精度1.相关指数相关指数R22.残差残差e在含有一个解释在含有一个解释变量的线性变量的线性 模型模型中中R2=r2(相关关系相关关系)判断判断x xi i确定差异确定差异百分数百分数随机误差随机误差 ,它的估计值为它的估计值为 .对于样本点对于样本点 它们随机误它们随机误差的估计值差的估计值 称相应残差称相应残差.方差方差1)1)衡量预报精度衡量预报精度2)2)确定样本的异常点确定样本的异常点.小小 结结 实际问题实际问题 样本分析样本分析 回归模型回归模型抽样抽样回回归归分分析析预预报报精精度度预预报报 例题讲解例题讲解 课堂练习课堂练习作作 业业教材教材3636 2 2 结束

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!