《线性回归思想》PPT课件.ppt

上传人:za****8 文档编号:22629468 上传时间:2021-05-29 格式:PPT 页数:31 大小:890KB
收藏 版权申诉 举报 下载
《线性回归思想》PPT课件.ppt_第1页
第1页 / 共31页
《线性回归思想》PPT课件.ppt_第2页
第2页 / 共31页
《线性回归思想》PPT课件.ppt_第3页
第3页 / 共31页
资源描述:

《《线性回归思想》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《线性回归思想》PPT课件.ppt(31页珍藏版)》请在装配图网上搜索。

1、2021/1/27 郑平正 制作 3.1回归分析的基 本思想及其初步 应用(一) 高二数学 选修 1-2 2021/1/27 郑平正 制作 复习 一 变量之间的关系 1 确定性的函数关系 2 不确定性的相关关系: 自变量取值一定时,因变量的取值带有一 定随机性的两个变量之间的关系,叫做相 关关系,相关关系是一种非确定的关系 2021/1/27 郑平正 制作 . 年龄 脂肪 23 9.5 27 17.8 39 21.2 41 25.9 45 49 27.5 26.3 50 28.2 53 29.6 54 30.2 56 31.4 57 30.8 年龄 脂肪 58 33.5 60 35.2 61

2、34.6 如上的一组数据,你能分析人体的脂肪含量与年龄 之间有怎样的关系吗? 二 线性回归分析的步骤 : 2021/1/27 郑平正 制作 下面我们以年龄为横轴, 脂肪含量为纵轴建立直 角坐标系,作出各个点, 称该图为 散点图 。 如图: O 20 25 30 35 40 45 50 55 60 65 年龄 脂肪含量 5 10 15 20 25 30 35 40 1 画散点图 将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量 的一组数据的图形,这样的图像叫散点图 2021/1/27 郑平正 制作 从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在 从左下角到右上角的区域。

3、称它们成 正相关 。 但有的两个变量的相关,如下图所示: 如高原含氧量与海拔高度 的相关关系,海平面以上, 海拔高度越高,含氧量越 少。 作出散点图发现,它们散 布在从左上角到右下角的区 域内。又如汽车的载重和汽 车每消耗 1升汽油所行使的 平均路程,称它们成 负相关 . 注:可考虑让学生思考书 P77的思考 . O ( 1)正相关,负相关 2021/1/27 郑平正 制作 我们再观察它的图像发现这些点大致分布在一条直线附 近 ,像这样,如果散点图中点的分布从整体上看大致在 一条直线附近,我们就称这两个变量之间具有线性相 关关系 ,这条直线叫做 回归直线 ,该直线叫 回归方程 。 那么,我们该

4、 怎样来求出 这个回归方 程? 请同学们展开 讨论,能得 出哪些具体 的方案? 20 25 30 35 40 45 50 55 60 65 年龄 脂肪含量 0 5 10 15 20 25 30 35 40 ( 2) 线性相关 2021/1/27 郑平正 制作 我们上面给出的几种方案可靠性都不是很强, 人们经过长期的实践与研究,已经找到了 计算回归方程的斜率与截距的一般公式 : xbya xnx yxnx xx yyxx b n i i n i i i n i i n i ii y , )( )( 1 2 2 1 1 2 1 以上公式的推导较复杂,故不作推导,但它的原 理较为简单:即各点到该直线

5、的距离的平方和最 小,这一方法叫 最小二乘法 。(参看如书 P80) 2 回归方程的求解 线性回归分析的步骤 : 1、画散点图 4、用回归直线方程进行预报 3、求回归直线方程 y bx a 2、求 ,ba nn ( x -x ) ( y - y ) x y - n xy i i i i i =1 i =1 b= = , nn 222 ( x -x ) x - n x ii i =1 i =1 a = y - b x . nn 11 x = x , y = y . ii nn i =1 i =1 其 中 最小二乘估计公式 : y bx a ( , )xy 称为样本点的中心 。 三 描述两个变量之

6、间线性相关关系的强弱 的相关系数 0. 75 1 , 1 , 0. 75 , 0 25 , 0. 25 , r r r 当 , 表 明 两 个 变 量 正 相 关 很 强 ; 当 表 明 两 个 变 量 负 相 关 很 强 ; 当 . 表 明 两 个 变 量 相 关 性 较 弱 。 1 22 1 22 2 111 2 1 ( ) ( ) ( () ) ( )( n ii i nn ii ii n ii i nn ii ii x y nx x y xy x n x y n y y x x y y r 课前检测: 假设关于某设备的使用年限 x和所支出的维修费 用 y(万元),有如下的统计资料。 使

7、用年限 x 2 3 4 5 6 维修费用 y 2.2 3.8 5.5 6.5 7.0 若由资料知 ,y对 x呈线性相关关系。试求: ( 1)线性回归方程 的回归系数 ; ()估计使用年限为 10年时,维修费用是多少? y bx a ab、 1. 23 , 0. 08 .ba 1.23 0.08.yx 使用年限为 10年时,维修费用是 :12.38万元 2008年 5月,中共中央国务院关于加 强青少年体育、增强青少年体质的意 见指出城市超重和肥胖青少年的比例 明显增加 .“身高标准体重”该指标对 于学生形成正确的身体形态观具有非 常直观的教育作用 . “身高标准体重” 从何而来?我们怎样去研究

8、? 创设情境: 例 1 从某大学中随机选取 8名女大学生,其身高和体重数据如表 1-1所示。 编号 1 2 3 4 5 6 7 8 身高 /cm 165 165 157 170 175 165 155 170 体重 /kg 48 57 50 54 64 61 43 59 求根据女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 问题呈现:女大学生的身高与体重 0 .8 4 9 8 5 .7 1 2yx 解; 1.由于问题中 要求根据身高预报 体重,因此选取身 高为自变量 x,体 重为因变量 y 学身 高 172cm女 大 生 体 重 y = 0 . 8 4 9

9、 1 7 2 - 8 5 . 7 1 2 = 6 0 . 3 1 6 ( k g ) 3.回归方程: 2. 散点图; 4.本例中 , r=0.7980.75这表明体重与身高有很强的线性相关 关系,从而也表明我们建立的回归模型是有意义的。 8 1 ii i xy 8 2 1 i i x x y 72315 218774 165.25 54.5 2021/1/27 郑平正 制作 对回归模型进行统计检验 探究 1:身高为 172cm的女大学生的体重一定是 60.316kg吗?如果不是,你能解析一下原因吗? 答:身高为 172cm的女大学生的体重不一定是 60.316kg, 但一般可以认为她的体重接近

10、于 60.316kg. 下图中的样本点和回归直线的相互位置说明了这一点 . y bx a 由于样本点不在同一条直线上,只是散布在某一条直线附近, 所以身高与体重的关系可用 线性回归模型 :y=bx+a+e, (3) 来表示,其中 a和 b为模型的未知参数, e是 y与 bx+a之间的误差 . 通常 e为随机变量,称为随机误差 (random error),即 e称为随机 误差 .它的均值 E(e)=0,方差 D(e)=2.这样线性回归模型的完整表 达式为: 一般假定均值为 0,即期望 各点都在直线 y=bx+a上 . 真实值 a,b,y 思考:产生随机误差 e的原因 (主要来源 )是什么? 一

11、个人的体重除了受身高的影响外,还受其他许多因素的影 响 .其主要来源是 (误差越小 ,回归模型的拟合效果越好! ) (1)用线性回归模型近似真实模型 (真实模型是客观存在的,只 是通常我们不知道真实模型到底是什么 )所引起的误差 . (2)忽略了某些因素的影响 .因为影响变量 y的因素不只是变量 x 一个 .例如 :遗传因素、饮食习惯、是否喜欢运动等, 所引起 的误差都包含在 e中 . (3)观测误差 .由于测量工具 等 原因造成度量误差也 包含在 e中 . 2021/1/27 郑平正 制作 探究 2:在线性回归模型中, e是用 bx+a预报真实值 y的随机 误差,它是一个 不可观测的量, 那

12、么怎样研究随机误差呢? 是真实值 与估计值 的差! 2021/1/27 郑平正 制作 思考:如何发现数据中的错误?如何衡量模型的拟合效果? 0 .8 4 9 8 5 .7 1 2 ,iiyx ,i i ie y y 3 3 3 5 0 4 7 . 5 8 1 2 . 4 1 9e y y 如 2021/1/27 郑平正 制作 382.0883.2627.6137.1618.4419.2627.2373.6e 5943616454505748kg/ 170155165175170157165165cm/ 87654321 残差 体重 身高 编号 残差图 2021/1/27 郑平正 制作 -8 -

13、6 -4 -2 0 2 4 6 8 0 1 2 3 4 5 6 7 8 9 编号 残差 31.3 图 2021/1/27 郑平正 制作 2 2 1 2 1 () 1 () n i i i n i i yy R yy 2021/1/27 郑平正 制作 即在实际应用中应该尽量选择 R2 大的回归模型 . 2021/1/27 郑平正 制作 例 2、在一段时间内,某中商品的价格 x元和需求量 Y件之间 的一组数据为: 求出 Y对的回归直线方程,并说明拟合效果的好坏。 价格 x 14 16 18 20 22 需求量 Y 12 10 7 5 3 解: 1 8 , 7 .4 ,xy 5 5 5 22 1 1

14、 1 166 0 , 327 , 620 ,i i i i i i i x y x y 7 . 4 1 . 1 5 1 8 2 8 . 1 .a 1 . 1 5 2 8 . 1 .yx 回 归 直 线 方 程 为 : 5 1 5 2 2 1 5 5 ii i i i x y x y b xx 2 620 5 18 7.4 1.15. 1660 5 18 2021/1/27 郑平正 制作 例 2、在一段时间内,某中商品的价格 x元和需求量 Y件之间 的一组数据为: 求出 Y对的回归直线方程,并说明拟合效果的好坏 . 价格 x 14 16 18 20 22 需求量 Y 12 10 7 5 3 列出

15、残差表为 5 2 1 ()ii i yy 0.3, 5 2 1 ()i i yy 53.2, 5 2 2 1 5 2 1 () 1 () ii i i i yy R yy 0.994 因而,拟合效果较好 . iiyy iyy 0 0.3 -0.4 -0.1 0.2 4.6 2.6 -0.4 -2.4 -4.4 课堂总结: 1、线性回归分析的步骤 2、回归模型的建立 3、随机误差的研究 知识小节 : 数学思想小结 : 1、最小二乘法思想 2、函数与方程的思想 3、数形结合 学以致用: 1、 在对两个变量,进行线性回归分析时有 下列步骤: 对所求出的回归方程作出解释,收集数据( , ) 求线性回归

16、方程,求相关系数,根据所搜集的数据绘 制散点图如果根据可靠性要求能够作出变量,具有线 性相关结论,则在下列操作顺序中正确的是 ( ) ix iy 学以致用: 2、对于相关指数 ,下列说法正确的是 ( ) 2R 2R 2R 、 的取植越小,模型拟合效果越好 、 的取值可以是任意大,且 取值越大拟合效果越好 、 的取值越接近,模型拟合效果越好 、以上答案都不对 2R 2R 2R 学以致用: 3、甲、乙、丙,丁四位同学各自对,两变量 的线性相关性做实验,并用回归分析方法分别求得 相关系数 r与残差平方和 m如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 则哪位同学的实验结果体现,两变量有更强的线 性相关性 甲 乙 丙 丁 学以致用: 4、 已知两个变量 x和 y之间有线性相关性,次实 验得到样本如下: 6.1 3.9 2 0 y 3 2 1 0 x ()则 y对 x的线性回归方程是 ()相应于各样本点的残差 ( i=1,2,3,4)分别是, , ie

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!