欢迎来到装配图网! | 帮助中心 装配图网zhuangpeitu.com!
装配图网
ImageVerifierCode 换一换
首页 装配图网 > 资源分类 > DOC文档下载
 

第3讲变量间的相关关系与统计案例

  • 资源ID:46497374       资源大小:194KB        全文页数:13页
  • 资源格式: DOC        下载积分:19积分
快捷下载 游客一键下载
会员登录下载
微信登录下载
三方登录下载: 微信开放平台登录 支付宝登录   QQ登录   微博登录  
二维码
微信扫一扫登录
下载资源需要19积分
邮箱/手机:
温馨提示:
用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

第3讲变量间的相关关系与统计案例

第3讲变量间的相关关系与统计案例【2013年高考会这样考】以选择题或填空题的形式考查回归分析及独立性检验中的基本思想方法及其简单 应用.【复习指导】高考在该部分的主要命题点就是回归分析和独立性检验的基础知识和简单应用复 习时要掌握好回归分析和独立性检验的基本思想、方法和基本公式.KAOJIiZIZHUDAOXUE B 01 考基自主导学基础梳理1. 相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关 系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种 相关关系称为负相关.2. 线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量 之间具有线性相关关系,这条直线叫回归直线.3. 回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘 法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(xi,yi),(x2,y2),,, (xn,yn),其回归方程为 9=bx+ a,贝Unn_ xi- xyi y Hxiyi nx ya i = 1 b=2Xi- xnZa 一 a 一 a= y b x .其中,b是回归方程的斜率,a是在y轴上的截距.4. 样本相关系数n _ Xi x yi yr二,用它来衡量两个变量间的线性相关关系.nn、/ 送(Xi f Z (yi 7 fi = 1i = 1工(y $)It当r >0时,表明两个变量正相关;(2) 当rv0时,表明两个变量负相关;(3) r的绝对值越接近1 ,表明两个变量的线性相关性越强;、的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常当|r|>0.75时,认为两个变量有很强的线性相关关系.5. 线性回归模型(1) y= bx+ a+ e中,a、b称为模型的未知参数;e称为随机误差.(2) 相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2二,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好丄线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.6. 独立性检验(1) 用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如: 是否吸烟,宗教信仰,国籍等.(2) 列出的两个分类变量的频数表,称为列联表.(3) 一般地,假设有两个分类变量 X和丫,它们的值域分别为X1, X2和y1, y2,其 样本频数列联表(称为2 X 2列联表)为:2 X 2列联表y1y2总计X1aba+ bX2cdc+ d总计a+ cb+ da+ b+c+dK2= a+ b a+cc+d b+ d (其中n = a+ b+ c+ d为样本容量),可利用独立性检验 判断表来判断“ x与y的关系”.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方 法称为两个分类变量的独立性检验.助电 < 傅_两个规律函数关系是一种确定的关系,相关关系是一种非确定的关系:事实上,函数关系 是两个非随机变.量.的.关.系,.而相关关系是非随机.变量与随机变量的关系(2) 当 K2>. 3.841时,则有.95%的把握说事.A与B有关; 当K2> 6.635时,则有.99%的把握说事件_A与旦有关.; 当k2< 2.706时,则认为事件.A与.B无关.三个注意(1) 回归分析是对具有相关关系的两个变量进行统计分析的方法, 只有在散点图大致 呈线性时,求出的回归直线方程才有实际意义,.否则,求出的回归直线方程毫无意 义,(2) 线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.一独立性检验的随机变量.K2 = 3.841 .是判断是否有关系的临界值,.K2<3.841应判断 为没有充分证据显示事件.一.A.与.B.有关系.,而不能作为小于.95%的量化值来判断. 双基自测1. (人教A版教材习题改编)下面哪些变量是相关关系().A .出租车车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D .铁块的大小与质量解析 A, B, D都是函数关系,其中A一般是分段函数,只有 C是相关关系. 答案 C2. 对变量x, y有观测数据(Xi, y)(i = 1,2, , , 10),得散点图(1);对变量u, v有 观测数据(ui、vi)(i = 1,2, , , 10),得散点图(2).由这两个散点图可以判断().A .变量 x与y正相关,u与 v正相关B. 变量x与y正相关,u与v负相关C. 变量x与y负相关,u与v正相关D. 变量x与y负相关,u与v负相关解析 由题图可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点 整体呈递增趋势,u与v正相关.答案 C3. (2012南昌模拟)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可 能是().A.y=- 10x+ 200B.y = 10x+ 200C.y =- 10x- 200D.y = 10x- 200解析 因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数, 再排除C,故选A.答案 A4. (2012枣庄模拟)下面是2X 2列联表:y1y2合计X1a2173x2222547合计b46120则表中a,b的值分别为().A. 94,72 B . 52,50 C. 52,74 D . 74,52解析 t a+ 21 = 73,二 a= 52,又 a + 22= b,: b= 74.答案 C5. 在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是 的(有关,无关)解析由观测值k= 27.63与临界值比较,我们有99%的把握说打鼾与患心脏病有关.答案有关02tKJLCXIANGTANJIUDAOXIi9 考向探宝导析考向一相关关系的判断【例1】?山东鲁洁棉业公司的科研人员在 7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据 仲位:kg):施化肥量x15202530354045棉花产量y330345365405445450455(1) 画出散点图;(2) 判断是否具有相关关系.审题视点(1)用x轴表示化肥施用量,y轴表示棉花产量,逐一画点.(2)根据散点图,分析两个变量是否存在相关关系.解(1)散点图如图所示500450 -* 400-+, 吒0 1020304051)施化肥fit由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.”利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线附近,变量 之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相 关关系.【训练1】 根据两个变量x, y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系 (填“是”与“否”).解析 从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系.答案否考向二独立性检验【例2】?(2010全国新课标)为调查某地区老年人是否需要志愿者提供帮助,用简单 随机抽样方法从该地区调查了 500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1) 估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2) 能否有99%的把握认为该地区老年人是否需要志愿者提供帮助与性别有关?(3) 根据(2)的结论,能否提出更好的调查方法来估计该地区老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:2P(K2> k)0.0500.0100.001k3.8416.63510.828k2_nad- bc2a+ b c+ d a+ c b+ d2 2 审题视点第问由a=40,b= 30,c= 160,d= 270,代入公式可求 K,由K的值与6.635比较断定第(3)问从抽样方法说明.解(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中, 需要志愿者提供帮助的老年人的比例的估计值为 琮_ 14%.2C 500 X 40 X 270-30 X 160(2)K =Q 9.96770 X 430 X 200 X 300由于9.967> 6.635,所以有99%的把握认为该地区老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先 确定该地区老年人中男、女的比例,再把老年人分成男、女两层,采用分层抽样方 法,这要比采用简单随机抽样方法更好.(1)根据样本数据制成2X 2列联表;n ad be2心H 独立性检验的步骤: 根据公式宀a+ b a+eb+d e+ d计算的观测值;(3) 比较K2与临界值的大小关系作统计推断.【训练2】 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了 500件,量其内径尺寸,得结果如下表:甲厂:分组29.86,29.90,29.94,29.98,30.02,30.06,30.10,29. 90)29. 94)29. 98)30. 02)30. 06)30. 10)30. 14)频数12638618292614乙厂:分组29.86,29.90,29.94,29.98,30.02,30.06,30.10,29. 90)29. 94)29. 98)30. 02)30. 06)30. 10)30. 14)频数297185159766218(1)试分别估计两个分厂生产零件的优质品率;(2)由以上统计数据填下面2X 2列联表,并问是否有99%的把握认为“两个分厂生 产的零件的质量有差异”.甲厂乙厂合计优质品非优质品合计附 K2门何-bcf(a+ b(c+ d(a+ cb+ d)P(K请画出上表数据的散点图; 请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y= bx+ a; 已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的 线性回归方程预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3X 2.5+ 4X 3+ 5X 4+ 6X 4.5= 66.5)审题视点(2)问利用公式求2、b,即可求出线性回归方程.问将x= 100代入回归直线方程即可.解(1)由题设所给数据,可得散点图如图所示.> k)0.050.01k3.8416.635解 甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360320500360X 100%= 72%;乙厂抽查的产品中有 320件优质品,从而乙厂生产的零件的优质品率估计为X 100%= 64%.甲厂乙厂合计优质品360320680非优质品140180320合计5005001 000221 000X 360X 180-320X 140K =丄7 35 > 6 635K500 X 500 X 680 X 320",所以有99%的把握认为“两个分厂生产的零件的质量有差异”.考向三线性回归方程【例3】?(2012菏泽模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记 录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.54由对照数据,计算得:"x2 = 86,i = 1x =时牛盼6 = 4.5(吨),亍=2占+ 3, 4+ 45 = 3.5(吨).4已知二 Xiyi= 66.5,i = 1所以,由最小二乘法确定的回归方程的系数为:4x Xiyi - 4 x 66.5-4X 4.5X 3.5286- 4X 4.52a= y b x = 3.5 0.7X4.5= 0.35.因此,所求的线性回归方程为y= 0.7x+ 0.35.由的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90 (0.7X 100+ 0.35)= 19.65(吨标准煤).":A":;?|I:)在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具 有线性相关关系,若它们之间有线性相关关系,再求回归直线方程.【训练3】(2011江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y对x的线性回归方程为().A. y=x1B. y=x + 1父亲身咼x/cm174176176176178儿子身高y/cm175175176177177xC. y= 88 + 1xD. y= 176解析由题意得174+ 176+ 176+ 176+ 1785=176(cm),y = 175+ 175+ ;6+ 177+ 177=仃 6(cm),由于(x, y )一定满足线性回归方程,经验证知选C.答案 C03KAQTI2HUANXIAHGTUPO 京考题专项突破阅卷报告15数据处理不当导致计算错误而失分【问题诊断】 由于大多数省市高考要求不准使用计算器,而线性回归问题和独立 性检验问题仍是近几年新课标高考的常考点,并且大多是考查考生的计算能力,就 计算方面常有不少考生因计算出错而失分.实录(1) x = 2 006,7 = 236+ 246+ 257+ 276+ 286= 260.2.【防范措施】 平时训练时首先养成勤于动手的习惯,亲自动手计算,再者考场上 要保持心态放松,做题时细心认真,最终可减少错误的发生.【示例】?(2011安徽)某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20022004200620082010需求量(万吨)236246257276286(1) 利用所给数据求年需求量与年份之间的回归直线方程y= bx+ a;利用(1)中所求出的直线方程预测该地 2012年的粮食需求量.xxb =2002 2006 236 260.2 + 2004 2006 246 260.2 + 2006 2006 257 260.2 2002 - 2006 2 + 2004 2006 2+ 2006- 2006 2+ 2008 2006 2+ 2010 2006 2(2008 2006 (276 260.2 +2010 2006 (286 260.2)+ 2002 2006 2 + 2004 2006 2 + 2006 2006 2 + 2008 2006 2+ 2010- 2006 2=6.2,错因 求b时计算出错,b值不准确.a= y bx = 260.2 6.2X 2 006= 12 177. y= 6.2x 12 177.(2)y= 6.2X 2 012- 12 177= 2974正解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:年份2006-4-2024需求量257-21-1101929对预处理后的数据,容易算得,x = 0, y = 3.2,-4 X -21 土 2 X - 11 +2X 19+ 4X 29 5X 0X 3.2 b =- 4+2 2 + 22+ 42-5X 02a= y b x = 3.2.由上述计算结果,知所求回归直线方程为y 257= b(x- 2 006) + a= 6.5(x- 2 006)+ 3.2,即 y= 6.5(x- 2 006) + 260.2. (2)利用直线方程,可预测2012年的粮食需求量为6. 5(2 012- 2 006)+ 260.2= 6.5X 6+ 260.2= 299.2(万吨).

注意事项

本文(第3讲变量间的相关关系与统计案例)为本站会员(小**)主动上传,装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知装配图网(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!