高中数学 第三章 统计案例整合学案 北师大版选修2-3-北师大版高二选修2-3数学学案

上传人:仙*** 文档编号:159637524 上传时间:2022-10-09 格式:DOC 页数:6 大小:544.50KB
收藏 版权申诉 举报 下载
高中数学 第三章 统计案例整合学案 北师大版选修2-3-北师大版高二选修2-3数学学案_第1页
第1页 / 共6页
高中数学 第三章 统计案例整合学案 北师大版选修2-3-北师大版高二选修2-3数学学案_第2页
第2页 / 共6页
高中数学 第三章 统计案例整合学案 北师大版选修2-3-北师大版高二选修2-3数学学案_第3页
第3页 / 共6页
资源描述:

《高中数学 第三章 统计案例整合学案 北师大版选修2-3-北师大版高二选修2-3数学学案》由会员分享,可在线阅读,更多相关《高中数学 第三章 统计案例整合学案 北师大版选修2-3-北师大版高二选修2-3数学学案(6页珍藏版)》请在装配图网上搜索。

1、n n 1 2 3n 1 2高中数学 第三章 统计案例整合学案 北师大版选修 2-3 知识建构综合应用专题一确定回归直线方程的策略准确确定回归直线方程 ,有利于进一步加强数学应用意识 ,培养运用所学知识解决实际问题 的能力,正确地求出回归直线方程是本节的重点,现介绍求回归直线方程的三种方法. 一、利用回归直线过定点确定回归直线方程回归直线方程 y=a+bx 经过样本的中心(x,y)点,(x,y)称为样本点的中心,回归直线一定 过此点.【例 1】观察两个相关变量的如下数据:xy-1-0.9-2-2-3-3.1-4-3.9-5-5.15544.132.922.110.9则两个变量间的回归直线为(

2、)A.y=0.5x-1 B.y=x C.y=2x+0.3 D.y=x+1答案:B二、利用公式求 a,b,确定回归直线方程利用公式求回归直线方程时应注意以下几点:求 b 时利用公式 b=i =1( x1-x )( y -y ) i2( x -x )i,先求出x=1 1(x +x +x +x ), y = (y +y + n ni =1y +y ).3 n再由 a= y -b x 求 a 的值,并写出回归直线方程.线性回归方程中的截距 a 和斜率 b 都是通过样本估计而来,存在着误差,这种误差可能导致 预报结果的偏差.回归直线方程 y=a+bx 中的 b 表示 x 每增加 1 个单位时 y 的变化

3、量,而 a 表示 y 不随 x 的变 化而变化的量.可以利用回归直线方程 y=a+bx 预报在 x 取某一个值时 y 的估计值.【例 2】某 5 名学生的数学和化学成绩如下表:学生学科ABCDE数学成绩(x)88767366635 5 10n 10101化学成绩(y) 78 65 71 64 61 (1)画出散点图;(2)求化学成绩 y 对数学成绩 x 的回归直线方程.解:(1)散点图略.(2)x=1 1(88+76+73+66+63)=73.2, y = (78+65+71+64+61)=67.8. 5 5所以 b=i =1( xi-x )( y -y )i0.625.( x1-x )2i

4、=1a= y -b x =67.8-0.62573.2=22.05.所以 y 对 x 的回归直线方程为y=0.625x+22.05.三、先判定相关性,再求回归直线方程利用样本相关系数 r 来判断两个变量之间是否有线性相关关系时,可以依据若 |r| 0.75,我们认为有很强的线性相关关系,可以求回归直线方程,并可用求得的回归直线方程 来预报变量的取值;若|r|0.75,则认为两个变量之间的线性相关关系并不强,这时求回归 直线方程没有太大的实际价值.【例 3】10 名同学在高一和高二的数学成绩如下表:xy7476717572716870767673796765707765627472其中 x 为高

5、一数学成绩,y 为高二数学成绩. (1)y 与 x 是否具有相关关系;(2)如果 y 与 x 具有线性相关关系,求回归直线方程. 解:(1)由已知表格中的数据,求得x =71, y =72.3,( x -x )( y -y ) 1 ir=i =10.78.( x -x ) i2( y -y) i2i =1i =1由于 0.780.75,所以 y 与 x 之间具有很强的线性相关关系. (2)y 与 x 具有线性相关关系,设回归直线方程为:y=a+bx,则有( x -x )( y -y ) i ib=i =1( x -x ) i2=1.22,i =1a= y -b x =72.3-1.2271=-

6、14.32.所以 y 关于 x 的回归直线方程为 y=1.22x-14.32.专题二可线性化的回归分析一、曲线线性化的意义曲线的线性化是曲线拟合的重要手段之一,对于某些非线性的资料可以通过简单的变量 替换使之线性化,这样就可以按最小二乘法原理求出变换后变量的线性回归方程,在实际工 作中常利用该线性回归方程绘制资料的标准工作曲线,同时根据需要可将此线性回归方程还 原成曲线回归方程,实现对曲线的拟合.二、常用的非线性函数(一)指数函数 y=aebx (1)对(1)式的两边取对数,得 lny=lna+bx当 b0 时,y 随着 x 的增大而增大;当 b0 时,y 随着 x 的增大而减小.当以 lny

7、 和 x 绘制的散点图呈直线趋势时,可考虑采用指数函数来描述 y 与 x 间的非线性关 系,lna 和 b 分别为截距与斜率.更一般的指数函数是 y=aebx+k,式中的 k 为一常量,往往未知,应用时可试用不同的值. (二)对数函数 y=a+blnx(x0)当 b0 时,y 随着 x 的增大而增大,先快后慢;当 b0 时,y 随着 x 的增大而减小,先快 后慢,当以 y 和 lnx 绘制的散点图呈直线趋势时,可考虑采用对数函数描述 y 与 x 间的非线 性关系,式中 a 和 b 分别为截距与斜率.更一般的对数函数是 y=a+bln(x+k),式中的 k 为一常量,往往未知.(三)幂函数 y=

8、axb(a0,x0) (2)当 b0 时,y 随着 x 的增大而增大;b0 时,y 随着 x 的增大而减小.对(2)式的两边取对数,得 lny=lna+blnx,当以 lny 和 lnx 绘制的散点图呈直线趋势时,可考虑采用对数函数描述 y 与 x 间的非线性关 系,式中 lna 和 b 分别为截距与斜率.更一般的幂函数是 y=axb+k,式中的 k 为一常量,往往未知.以上三种模型是我们在日常生活中常遇到的曲线模型 ,掌握这三种模型 ,有利于我们研究更 多的曲线拟合与回归分析的问题.三、利用线性回归拟合曲线的一般步骤(一)绘制散点图一般根据资料性质结合专业知识便可确定资料的曲线类型 ,不能确

9、定时,可在方格坐标纸上 绘制散点图,根据散点的分布,选择接近的、合适的曲线类型.(二)进行变量替换 y=f(y),x=g(x)使变换后的两个变量呈线性相关关系.(三)按最小二乘法原理求线性回归方程及进行方差分析.(四)将线性化方程转换为关于原始变量 x,y 的回归方程.【例 1】经过调查得到 8 个厂家同种类型的产品年新增加投资额和年利润额的数据资料,如 表(1)所示.表(1) 八个厂家年新增投资额与年利润额数据资料厂家 1年新增投资额 X(万元)4 年利润额 Y(万元)626731094111051517617247182382026lnY1.79 1.95 2.20 2.30 2.83 3

10、.18 3.14 3.26图(2)给出了年利润额 Y 与年新增加投资额 x 的散点图,从图中可以清楚地看出来,随着 x 的增大 Y 也有明显的增加的趋势,因此两者之间存在着相关关系,但是这种相关关系与其用一条直线来描述倒不如用曲线描述更加合适,因此 Y 与 x 之间更加倾向于被认为是一种非线 性关系.回归方程也需要用一些非线性函数来刻画,比如图(2) 年新增加投资额与年利润额数据的散点图图 3 经过对数变换后的散点图Y= e1x; 0或者 Y= + x2 0 1等等.图(3)给出的是变量 lnY 与变量 x 的散点图,从中可以看出这些点基本上是围绕一 条直线波动,说明变量 lnY 与 x 之间

11、近似是一种线性关系,从而也印证了回归方程取形式的 合理性.同时,图(3)也提示我们一种求解回归方程的思路,即通过求解变量 lnY 对 x 的线性回 归方程即可得到相应的式所表示的 Y 和 x 的回归方程,即在图(3)中的回归直线同图(2)中 的曲线()是一致的.具体来说,首先对样本数据(x ,Y ),i=1,2,n 作对数变换i iZ =lnY ,i=1,2,n; i i然后利用最小二乘法求出变量 Z 对 x 的回归方程Z=a +a x; 0 1即图(3)中的直线方程,则相应的形如式的 Y 对 x 的回归方程是Y=ez=ea0ea1x; 即 =ea0, =a .0 1 1利用表(1)中给出的数

12、据,可以得到 lnY 对 x 的线性回归方程是Z=1.314+0.100x由此可得 Y 对 x 的回归方程是Y=3.720 5e0.100x; 如果采用形如式的抛物线型回归方程,容易看出,令 =x2,式就是表示了变量 Y 对 的 线性回归方程:Y= + ; 0 1所以,对样本数据做变换 =x 2(i=1,2,n),利用( ,Y )(i=1,2,n)求i i i i解出中的系数估计值 、 代入式即得到 Y 对 x 的回归方程.0 1对表(1)中的数据计算结果为Y=4.413+0.057x2; 专题三独立性检验的基本方法判断结论成立的可能性的一般步骤:(1)假设两个分类变量 X 和 Y 没有关系;

13、(2)给定一个显著水平,查表给出临界值;(3)计算 2=n(ad -bc ) 2( a +c )( a +b )(c +d )(b +d );(4)若 2 大于临界值,则认为 x 与 y 有关系,否则没有充分的理由说明这个结论不成立XX12Y1acY2bd总计a+bc+d总计a+cb+da+b+c+d【例 1】某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系, 随机抽取 189 名员工进行调查,所得数据如下表所示:工作积极工作一般合计积极支持企业改革543286不太赞成企业改革4063103合计9495189对于人力资源部的研究项目,根据上述数据能得出什么结论?分析:首先

14、由已知条件确定 a,b,c,d,n 的数值,再利用公式求出 2 的观测值,最 后与临界值比较再下结论.解:由题目中表的数据可知:a=54,b=40,c=32,d=63,a+b=94,c+d=95,a+c=86,b+d=103,n=189. 代入公式得2=189 (54 +63 -40 32) 94 95 86 103210.759.因为 10.7596.635,所以有 99%的把握认为员工“工作积极”与“积极支持企业改革”是 有关的,可以认为企业的全体员工对待企业改革态度和工作积极性是有关的.【例 2】在一次恶劣气候的飞行航程中调查男女乘客晕机的情况如下表所示,根据此资料您 是否认为在恶劣气候

15、飞行中男人比女人更容易晕机?男人女人合计晕机24832不晕机312657合计553489解:这是一个 22 列联表的独立性检验问题,根据列联表中的数据,得到2=89 (24 26 -31 8) 55 34 32 5723.689.因为 3.6892.706,所以有 90%的把握认为此次飞行中晕机与否跟男女性别有关. 几点注意:(1)在列联表中注意各项的对应及有关值的确定,避免混乱.(2)若要判断 X 与 Y 有关时,先假设 X 与 Y 无关.(3)把计算出的 2的值与相关的临界值作比较,确定出“X 与 Y 有关系”的把握.科海观潮相关与相关系数一、什么是相关事物总是相互联系的,它们之间的关系多

16、种多样,分析起来,大概有以下几种情况:(1) 一种是因果关系,即一种现象是另一种现象的因,而另一种现象则是果.例如学习的努力程 度是学习成绩好坏的因(至少是部分的因);在一定刺激强度范围内,刺激强度经常是反应 强度的因等.(2)第二种是共变关系 ,即表面看来有联系的两种事物都与第三种现象有关 ,这 时两种事物之间的关系,便是共变关系.例如春天出生的婴儿与春天栽种的小树,就其高度而言,表面上看来都在增长,好像有关,其实,这二者都是受时间因素影响在发生变化,在它们本 身之间并没有直接的关系.(3)第三种是相关关系,即两类现象在发展变化的方向与大小方面 存在一定的关系,但不能确定这两类现象之间哪个是

17、因,哪个是果;也有理由认为这两者并不 同时受第三因素的影响 ,即不存在共变关系 .具有相关关系的两种现象之间 ,关系是复杂的 , 甚至可能包含有暂时尚未认识的因果关系及其共变关系在内 .例如,同一组学生的语文成绩 与数学成绩的关系,即属于相关关系.统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度.相关的情况有以下 三种:一是两列变量变动方向相同,即一列变量变动时,另一列变量亦同时发生或大或小与前 一列变量同方向的变动 ,这称为正相关 .如身高与体重的关系 ,一般讲身长越长体重就越重 . 第二种相关情况是负相关,这时两列变量中若有一列变量变动时,另一列变量呈或大或小,但 与前一列变量指

18、向相反的变动.例如初学打字时练习次数越多,出现错误的量就越少等.第三 处相关情况是零相关 ,即两列变量之间无关系 .这种情况下,一列变量变动时 , 另一列变量作 无规律的变动 .如学习成绩优劣与身高之间的关系 ,就属零相关,即无相关关系,二者都是独 立的随机变量.二、相关系数相关系数是两列变量间相关程度的数字表现形式 ,或者说是表示相关程度的指标 ,作为 样本间相互关系程度的统计特征数,常用 r 表示,作为总体参数,一般用 表示,并且是指线 性相关而言.相关系数的取值介于-1.00 至+1.00 之间,常用小数形式表示.它只是一个比率,不代表 相关的百分数,更不是相关量的相等单位的度量.相关系

19、数的正负号,表示相关方向,正值表 示正相关,负值表示负相关.相关系数取值的大小表示相关的程度.相关系数为 0 时,称零相 关即毫无相关,为 1.00 时,表示完全正相关,相关系数为-1.00 时,为完全负相关.这二者都是 完全相关.如果相关系数的绝对值在 1.00 与 0 之间不同时,则表示关系程度不同.接近 1.00 端一般为相关程度密切,接近 0 端一般为关系不够密切.(注意:若是非线性相关关系,而且直 线相关计算 r 值可能很小,但不能说两变量关系不密切)关于这一点如何判定,尚需考虑计算 相关系数时样本数目的多少.如果样本数目较少,受取样偶然因素的影响较大,很有可能本来 无关的两类事物

20、, 却计算出较大的相关系数来 . 例如欲研究身高与学习有无关系 ,如果只选 3、5 个人,很可能遇到身材愈高学习愈好这一类偶然现象,这时虽然计算出的相关系数可能 接近 1.00,但实际上这两类现象之间并无关系 .究竟如何综合考虑样本数目大小 ,相关系数 取值大小而判定相关是否密切这一问题,一般要经过统计检验后方能确定.相关系数不是等距的度量值 ,因此在比较相关程度时 ,只能说绝对值大者比绝对值小者 相关更密切一些,如只能说相关系数 r=0.50 的两列数值比相关系数 r=0.25 的两列数值之间 的关系程度更密切 ,而绝不能说前二者的密切程度是后二者密切程度的两倍 .也不能说相关 系数从 0.25 到 0.50 与从 0.50 到 0.75 所提高的程度一样多.存在相关关系,即相关系数取值 较大的两类事物之间,不一定存在因果关系,这一点要从事物的本质方面进行分析,绝不可简 单化.计算相关系数一般要求成对的数据 ,即若干个体中每个个体要有两种不同的观测值 .例 如每个学生(智力相同者)的算术和语文成绩 ;每个人的视反应和听反应时 ;每个学生的智力 分数与学习成绩等等.任意两个个体之间的观测值不能求相关.计算相关的成对数据的数目, 一般以 30 以上为宜.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!