第十章--相关与回归分析ppt课件

上传人:风*** 文档编号:178102672 上传时间:2022-12-27 格式:PPT 页数:73 大小:437.50KB
收藏 版权申诉 举报 下载
第十章--相关与回归分析ppt课件_第1页
第1页 / 共73页
第十章--相关与回归分析ppt课件_第2页
第2页 / 共73页
第十章--相关与回归分析ppt课件_第3页
第3页 / 共73页
资源描述:

《第十章--相关与回归分析ppt课件》由会员分享,可在线阅读,更多相关《第十章--相关与回归分析ppt课件(73页珍藏版)》请在装配图网上搜索。

1、第十章第十章 相关与回归分析相关与回归分析有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。弗朗西斯高尔顿先生被誉为现代相关和回归的弗朗西斯高尔顿先生被誉为现代相关和回归的创始人创始人1875年,他利用豌豆试验来确定尺寸的遗传规律。年,他利用豌豆试验来确定尺寸的遗传规律。他挑选他挑选7组不同尺寸的豌豆,说服他的朋友每一组组不同尺寸的豌豆,说服他的朋友每一组种植种植10粒种子,最后把原始的豌豆种子与新长的粒种子,最后把原始的豌豆种子与新长的豌豆种子进行尺寸比较豌豆种子进行尺寸比较当结果被绘制出来之后,他发

2、现并非每一个子代都与父代一样,当结果被绘制出来之后,他发现并非每一个子代都与父代一样,相同的是,尺寸小的豌豆会得到更大的子代,而尺寸大的豌豆相同的是,尺寸小的豌豆会得到更大的子代,而尺寸大的豌豆却得到较小的子代却得到较小的子代高尔顿将此方法用到人类身上,他将父母和孩子的身高高尔顿将此方法用到人类身上,他将父母和孩子的身高转换成转换成z值,对比父母的身高与他们孩子的身高。他并值,对比父母的身高与他们孩子的身高。他并发现孩子们的发现孩子们的z值偏离均值的程度小于父母的偏离程度,值偏离均值的程度小于父母的偏离程度,即非常矮小的父母倾向于有偏高的孩子;而非常高大的即非常矮小的父母倾向于有偏高的孩子;而

3、非常高大的父母则倾向于有偏矮的孩子。它把这叫做对均值的父母则倾向于有偏矮的孩子。它把这叫做对均值的“回回归归”,这一发现构成了回归分析的基础,这一发现构成了回归分析的基础第一节第一节 相关与回归概述相关与回归概述有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。一、变量间的关系及分类一、变量间的关系及分类统计变量之间的关系,存在着两种不同的类型,统计变量之间的关系,存在着两种不同的类型,一种是函数关系,另一种是相关关系一种是函数关系,另一种是相关关系函数关系是指变量之间存在着的一种固定的、严格函数关系是

4、指变量之间存在着的一种固定的、严格的数量依存关系,即一个变量数值的变动,都会有的数量依存关系,即一个变量数值的变动,都会有另一个变量的数值与之完全对应另一个变量的数值与之完全对应相关关系是指变量之间存在着的一种非确定性的数相关关系是指变量之间存在着的一种非确定性的数量依存关系,即一个变量发生数值变化时,另一变量依存关系,即一个变量发生数值变化时,另一变量也相应地发生数值变化,但其数值是不固定的量也相应地发生数值变化,但其数值是不固定的太阳和地球的运动就是函数太阳和地球的运动就是函数你和你父亲之间就是相关你和你父亲之间就是相关不可能是函数,如是函数,他动一下胳膊,你就要动一下腿不可能是函数,如是

5、函数,他动一下胳膊,你就要动一下腿有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。二、相关分析的主要内容二、相关分析的主要内容相关分析是研究两个或两个以上的变量相关分析是研究两个或两个以上的变量之间相关程度及大小的一种统计方法之间相关程度及大小的一种统计方法其主要内容包括:其主要内容包括:1.确定现象之间是否存在相关关系,以及相确定现象之间是否存在相关关系,以及相关关系呈现的形态关关系呈现的形态2.确定相关关系的密切程度确定相关关系的密切程度3.相关系数的检验相关系数的检验有利于学习和创新的组织管理机

6、制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。三、回归分析的主要内容三、回归分析的主要内容回归分析是寻找存在相关关系的变量间的数学回归分析是寻找存在相关关系的变量间的数学表达式,并进行统计推断的一种统计方法表达式,并进行统计推断的一种统计方法主要内容包括:主要内容包括:.进行参数估计。即如何根据样本数据对回归模型进行参数估计。即如何根据样本数据对回归模型的参数进行估计,求出具体的回归方程的参数进行估计,求出具体的回归方程.进行显著性检验。即对回归方程、参数估计值进进行显著性检验。即对回归方程、参数估计值进行显著性检验与校正,以

7、便使回归方程或参数更加行显著性检验与校正,以便使回归方程或参数更加优良优良.进行预测和控制进行预测和控制四、相关与回归四、相关与回归相关仅判定变量之间是否存在关系相关仅判定变量之间是否存在关系(存在性)(存在性)这关系的大小、正确与否都是回归分析的内容这关系的大小、正确与否都是回归分析的内容(关系的具体表现)(关系的具体表现)有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。五、回归分析的分类五、回归分析的分类在对回归分析进行分类时,主要有两种分类方在对回归分析进行分类时,主要有两种分类方式式第一,根据

8、变量的数目,可以分类一元回归、多元第一,根据变量的数目,可以分类一元回归、多元回归回归第二,根据自变量与因变量的表现形式,分为线性第二,根据自变量与因变量的表现形式,分为线性与非线性与非线性所以,回归分析包括四个方向:一元线性回归分析、多元所以,回归分析包括四个方向:一元线性回归分析、多元线性回归分析、一元非线性回归分析、多元非线性回归分线性回归分析、一元非线性回归分析、多元非线性回归分析析我们把一元非线性回归分析和多元非线性回归分析合并为我们把一元非线性回归分析和多元非线性回归分析合并为曲线回归分析曲线回归分析第二节第二节 相关分析相关分析有利于学习和创新的组织管理机制,创造充满活力的创新激

9、励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。一、相关关系的分类一、相关关系的分类.按相关关系涉及因素的多少按相关关系涉及因素的多少单相关与复相关单相关与复相关.按相关关系的表现形式按相关关系的表现形式线性相关和非线性相关线性相关和非线性相关.按相关的方向按相关的方向正相关和负相关正相关和负相关4.按相关程度来分按相关程度来分完全相关、不完全相关和不相关(完全不相关)完全相关、不完全相关和不相关(完全不相关)对立、反义词对立、反义词有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放

10、又相互信任的合作环境。二、相关关系的度量二、相关关系的度量在进行相关分析时,可通过在进行相关分析时,可通过相关表相关表散点图散点图计算相关系数计算相关系数有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。相关表是根据现象变动样本资料编制出相关表是根据现象变动样本资料编制出来的反映变量间相关关系的统计表来的反映变量间相关关系的统计表散点图,是利用坐标系,将两变量相对散点图,是利用坐标系,将两变量相对应的变量值用坐标点形式描绘出来的二应的变量值用坐标点形式描绘出来的二维数据图维数据图有利于学习和创新的组织管

11、理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。三、相关系数三、相关系数相关表与散点图只能粗略的反映变量间相关表与散点图只能粗略的反映变量间相关关系的方向、形式和密切程度,要相关关系的方向、形式和密切程度,要确切地反映相关关系的密切程度,还需确切地反映相关关系的密切程度,还需计算相关系数计算相关系数相关系数有很多种形式,常用由卡尔相关系数有很多种形式,常用由卡尔.皮尔皮尔逊提出的相关系数逊提出的相关系数有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相

12、互信任的合作环境。1.相关系数的计算相关系数的计算相关系数用来度量的两个变量,设为相关系数用来度量的两个变量,设为x与与y根据总体数据计算的两个变量之间线性相关强根据总体数据计算的两个变量之间线性相关强度的统计量,叫做总体相关系数,用度的统计量,叫做总体相关系数,用表示表示根据样本计算的两个变量之间线性相关强度的根据样本计算的两个变量之间线性相关强度的统计量,叫做样本相关系数,简称相关系数,统计量,叫做样本相关系数,简称相关系数,用用r表示表示相关系数相关系数r的测定方法有两种,第一种称积差法,的测定方法有两种,第一种称积差法,第二种称简捷法第二种称简捷法r是是的一个估计量,得到的一个估计量,

13、得到是不可能的,需要是不可能的,需要用用r来估计来估计。另外,估计得到的值需要进行另外,估计得到的值需要进行检验检验有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。用积差法计算线性相关系数的公式为:用积差法计算线性相关系数的公式为:nyynxxnyyxxryxxy222)()()(用简捷法计算相关系数的公式为:用简捷法计算相关系数的公式为:2222)()(yynxxnyxxynr 在上式中,在上式中,r r 称为相关系数,称为相关系数,2xy称为协方称为协方差;差;x是变量是变量 x x 的标准差;的

14、标准差;y是变量是变量 y y 的标准的标准差。差。可以看到,简捷法是积差法的简化、变形。可以看到,简捷法是积差法的简化、变形。有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。【例【例10-1】根据抽样知,某企业销售额】根据抽样知,某企业销售额与流通费用的相关情况,如表与流通费用的相关情况,如表10-1,根,根据积差法与简捷法分别计算相关系数据积差法与简捷法分别计算相关系数r。年份(年)年份(年)销售额(万元)销售额(万元)流通费用(万元)流通费用(万元)19981998199919992000200

15、0200120012002200220032003200420042005200520062006101016163232404074741201201971972462463453451.81.83.13.15.25.27.77.710.410.413.313.318.818.821.221.228.328.3有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。9891.0944.648911160699.8413)()()(222nyynxxnyyxxryxxy9891.0)8.109(19889)1

16、080(24120698.10910809.215899)()(222222yynxxnyxxynr有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。2.相关系数的性质相关系数的性质第一、相关系数介于第一、相关系数介于1到到1之间之间第二、第二、r具有对称性,具有对称性,x与与y的相关系数和的相关系数和y与与x的相关系数相等的相关系数相等第三、第三、r的数值大小与的数值大小与x和和y的原点及尺度的原点及尺度无关无关有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为

17、中心的企业文化氛围,依赖既开放又相互信任的合作环境。3.3.线性相关系数的分类线性相关系数的分类第一、根据第一、根据r r的数值分为正相关、负相关的数值分为正相关、负相关第二、根据第二、根据r r数值,分为完全相关、不完数值,分为完全相关、不完全相关、完全不相关全相关、完全不相关第三、根据第三、根据r r的数值,分为低度相关、中的数值,分为低度相关、中度相关、高度相关度相关、高度相关有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。四、相关系数显著性检验四、相关系数显著性检验相关系数是根据样本数据计算出

18、来的,相关系数是根据样本数据计算出来的,两个不相关的变量,其样本相关系数也两个不相关的变量,其样本相关系数也可能较高可能较高两个相关性很高的变量,其样本相关系两个相关性很高的变量,其样本相关系数也可能较低数也可能较低要从样本相关系数判断总体是否也具有这样要从样本相关系数判断总体是否也具有这样的关系,需要对相关系数进行假设检验的关系,需要对相关系数进行假设检验有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。在相关系数的显著性检验中,通常不采用正态在相关系数的显著性检验中,通常不采用正态检验,而采用检验,

19、而采用 t t 分布进行检验。假设检验的步分布进行检验。假设检验的步骤与第九章相同,但统计量采用骤与第九章相同,但统计量采用212rnrt,临,临界值为界值为)2(2nt,其中,其中 n n 为变量值的对数为变量值的对数 有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。【例【例10-2】某银行】某银行25个月的不良贷款与个月的不良贷款与贷款余额之间的相关系数贷款余额之间的相关系数r为为0.8436,在在0.05的显著性水平下,检验不良贷款的显著性水平下,检验不良贷款与贷款余额之间的相关系数是否显著与贷

20、款余额之间的相关系数是否显著有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。提出假设提出假设 0:0:10HH 给定显著性水平给定显著性水平 0.050.05 计算统计量计算统计量 5344.78436.012258436.01222rnrt 求临界值求临界值 0687.2)2(2nt 做出决策做出决策 02)2(Hntt拒绝原假设 所以,在所以,在 0.050.05 的显著性水平下,不良贷的显著性水平下,不良贷款与贷款余额之间高度相关款与贷款余额之间高度相关 第三节第三节 一元线性回归分析一元线性回

21、归分析有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。一、一元线性回归模型一、一元线性回归模型1.回归模型的一般形式回归模型的一般形式对于具有线性关系的两个变量,可以用一个对于具有线性关系的两个变量,可以用一个方程来表示它们之间的线性关系方程来表示它们之间的线性关系描述因变量描述因变量y如何依赖于自变量如何依赖于自变量x和误差项和误差项的方程称为回归模型。对于只涉及一个自变的方程称为回归模型。对于只涉及一个自变量的一元线性回归模型可表示为量的一元线性回归模型可表示为xy10有利于学习和创新的组织管理机

22、制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。y叫做因变量或被解释变量,叫做因变量或被解释变量,x叫做自变量叫做自变量或解释变量,或解释变量,0表示截距,表示截距,1表示斜率,表示斜率,10、都被称作总体参数,都被称作总体参数,表示误差项,反表示误差项,反映除映除 x x 和和 y y 之间的线性关系之外的随机因素对之间的线性关系之外的随机因素对y y 的影响,是不能由的影响,是不能由 x x 和和 y y 之间的线性关系所之间的线性关系所解释的变异性。解释的变异性。有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,

23、以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。3.回归方程回归方程描述因变量描述因变量y的期望值如何依赖于自变量的期望值如何依赖于自变量x的方程称为回归方程。根据对一元线性回归的方程称为回归方程。根据对一元线性回归模型的假设,可以得到它的回归方程为模型的假设,可以得到它的回归方程为xyE10)(有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。4.估计的回归方程估计的回归方程如果回归方程中的参数已知,对于一个给定如果回归方程中的参数已知,对于一个给定的的x值,利用回归

24、方程就能计算出值,利用回归方程就能计算出y的期望的期望值值用样本统计量代替回归方程中的未知参数用样本统计量代替回归方程中的未知参数,就得到估计的回归方程,简称回归直线就得到估计的回归方程,简称回归直线xy10有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。二、参数估计与预测二、参数估计与预测1.参数的最小二乘法估计参数的最小二乘法估计对于回归直线,关键在于求解参数对于回归直线,关键在于求解参数常用高斯提出的最小二乘法,也叫做最小平常用高斯提出的最小二乘法,也叫做最小平方法,它是使因变量的观察值方法,它

25、是使因变量的观察值y与估计值之与估计值之间的离差平方和达到最小来求解间的离差平方和达到最小来求解2102)()(xyyyQy2221010221202xyxxnyQ展开,21010yyxxxxnxyxxnxxn10221)(yy有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。根据统计,根据统计,70年代世界制造业总产量与世界制成年代世界制造业总产量与世界制成品总出口量的变化关系如表品总出口量的变化关系如表10-2。求回归直线。求回归直线年年 度度总产量年增长率总产量年增长率()x x总出口量年增长率总

26、出口量年增长率()y y197019704.04.08.58.5197119714.04.08.08.0197219728.58.510.510.5197319739.59.515.515.5197419743.03.08.58.519751975-1.0-1.0-4.5-4.5197619768.08.013.513.5197719775.05.05.05.0197819785.05.06.06.0197919794.04.07.07.0有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。03.0)0.

27、50534.10.77(101534.1)0.50(6.334100.770.508.51410)(102221xyxxnyxxynxy534.103.0有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。2.利用回归直线进行估计和预利用回归直线进行估计和预测测(1)点估计)点估计利用估计的回归方程,对于利用估计的回归方程,对于x的某一个特定的值的某一个特定的值,求出求出y的一个估计值的一个估计值 就是点估计就是点估计点估计分两种:一个是平均值的点估计,一个是个别值的点估计分两种:一个是平均值的点估计,一

28、个是个别值的点估计点估计点估计的条件下,对于同一个特定的点估计的条件下,对于同一个特定的,平均值的点估计,平均值的点估计和个别值的点估计的结果是一样的和个别值的点估计的结果是一样的(2)区间估计)区间估计利用估计的回归方程,对于利用估计的回归方程,对于x的一个特定值的一个特定值,求出,求出y的一个估计值的区间就是区间估计的一个估计值的区间就是区间估计区间估计有两种:一个是置信区间估计,它是对区间估计有两种:一个是置信区间估计,它是对x的一个的一个给定值给定值,求出,求出y的平均值的估计区间;一个是预测区间估的平均值的估计区间;一个是预测区间估计,它是对计,它是对x的一个给定值的一个给定值,求出

29、,求出y的一个个别值的估计的一个个别值的估计区间区间第第一一、置置信信区区间间估估计计 设设0 x为为一一个个给给定定值值,)(0yE为为给给定定0 x时时,因因变变量量 y 的的平平均均值值。0100 xy为为)(0yE的的估估计计值值。不不能能期期望望估估计计值值0 y精精确确的的等等于于)(0yE。要要用用0 y推推断断)(0yE,必必须须考考虑虑0 y的的方方差差。对对于于给给定定的的0 x,用用0 ys表表示示0 y标标准准差差的的估估计计量量,公公式式为为220)()(10 xxxxnssey 则则在在 1 1置置信信水水平平下下的的置置信信区区间间为为22020)()(1xxxx

30、nstye 第第二二、预预测测区区间间估估计计 为为求求出出预预测测区区间间,需需要要标标准准差差用用220)()(11xxxxnsseind表表示示。在在 1 1置置信信水水平平下下预预测测区区间间为为 22020)()(11xxxxnstye 有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。【例【例10-4】某企业从有关资料中发现广告投入和产】某企业从有关资料中发现广告投入和产品销售有较密切的关系。近年该企业广告费和销售品销售有较密切的关系。近年该企业广告费和销售额资料见表额资料见表10-3,若,

31、若2003年广告费为年广告费为120万元,请万元,请用一元线性回归求用一元线性回归求2003年产品销售额的置信区间与年产品销售额的置信区间与预测区间(预测区间(0.05)年份年份广告费广告费x x(万元)万元)销售额销售额y y(百万元)百万元)1994199419951995199619961997199719981998199919992000200020012001200220023535525260607272858580809595100100105105181825253030383841414444494952526060有利于学习和创新的组织管理机制,创造充满活力的创新激励机制

32、,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。xxy57.065.31075.6412057.065.30y365.2)7()(25.02tknt43.29.52)(2nyyse)0199.69,4801.60(2699.475.64743.043.2365.275.64)()(122020 xxxxnstye3516.475.642459.143.2365.275.64)()(1122020 xxxxnstye)1016.69,3984.60(有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依

33、赖既开放又相互信任的合作环境。三、回归直线的拟合优度三、回归直线的拟合优度回归直线在一定程度上描述了变量回归直线在一定程度上描述了变量x与变量与变量y之间的数量关系之间的数量关系利用方程,可根据自变量利用方程,可根据自变量x的取值来估计或的取值来估计或预测因变量预测因变量y的取值,但估计或预测的精度的取值,但估计或预测的精度如何将取决于回归直线对观测数据的拟合程如何将取决于回归直线对观测数据的拟合程度度回归直线与各观测点的接近程度称为回回归直线与各观测点的接近程度称为回归直线对数据的拟合优度归直线对数据的拟合优度常用判定系数、估计标准误差常用判定系数、估计标准误差有利于学习和创新的组织管理机制

34、,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。1.判定系数判定系数因变量因变量y的取值是不同的,的取值是不同的,y取值的这种波动称为变取值的这种波动称为变差。因变量差。因变量y取值的变差来源于两个方面:一是由于取值的变差来源于两个方面:一是由于自变量自变量x的取值不同造成的,二是除的取值不同造成的,二是除x以外的其他因以外的其他因素的影响素的影响222)()()(yyyyyy有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。总平方和可以分

35、解为回归平方和、残差平方和总平方和可以分解为回归平方和、残差平方和两部分两部分回归平方和回归平方和SSR反映了反映了y的总变差中,由于的总变差中,由于x与与y之间的线性关系引起的之间的线性关系引起的y的变化部分的变化部分残差平方和残差平方和SSE反映了除了反映了除了x对对y的线性影响之的线性影响之外的其他因素对外的其他因素对y变差的作用,是不能由回归变差的作用,是不能由回归直线来解释的直线来解释的y的变差部分的变差部分可以看出,回归直线拟合的好坏取决于可以看出,回归直线拟合的好坏取决于SSR及及SSE的的有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为

36、中心的企业文化氛围,依赖既开放又相互信任的合作环境。判定系数是指回归平判定系数是指回归平方和占总平方和的比方和占总平方和的比例,例,用用2R表示表示易知易知102 R 02R说明说明 y y 的变化与的变化与 x x 无关,无关,x x 完全无助于完全无助于解释解释 y y 的变差的变差 如如12R说明残差平方和为说明残差平方和为0 0,拟合是完全的,拟合是完全的,y y 的变化只与的变化只与 x x 有关有关 22222)()(1)()(yyyyyyyySSTSSRR22222222222222)()()()()()(yxbnyynxxbyyxxbyyyyR有利于学习和创新的组织管理机制,创

37、造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。【例【例10-5】根据】根据WTO的统计数字,的统计数字,70年代世界制造年代世界制造业总产量与世界制成品总出口量的变化关系如表业总产量与世界制成品总出口量的变化关系如表10-4,求判定系数求判定系数年年 度度总产量年增长率总产量年增长率()x x总出口量年增长率总出口量年增长率()y y197019704.04.08.58.5197119714.04.08.08.0197219728.58.510.510.5197319739.59.515.515.5197419743.03.08.5

38、8.519751975-1.0-1.0-4.5-4.5197619768.08.013.513.5197719775.05.05.05.0197819785.05.06.06.0197919794.04.07.07.0795.010772.843)10506.334(534.12222222yxbR有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。2.估计标准误差估计标准误差设数据量为设数据量为n,变量的个数为变量的个数为k,则则SST的自由度为的自由度为n1,SSR的自由度为的自由度为k1,SSE的自

39、由度为的自由度为nk估计标准误差,也称作估计标准误,是度量估计标准误差,也称作估计标准误,是度量各实际观测点在直线周围散布状况的一个统各实际观测点在直线周围散布状况的一个统计量计量knSSEse2y102nxyyse有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。【例【例10-6】某企业对车间】某企业对车间9名学徒进行名学徒进行调查,得到学徒期限与每天产量情况如调查,得到学徒期限与每天产量情况如表表10-5,求其估计标准误差,求其估计标准误差编号编号学徒期(年)学徒期(年)x x日产量(件)日产量(件

40、)y y1 10.50.550502 21 180803 31 11001004 41.51.51301305 52 21501506 62 21701707 72 21801808 82.52.52202209 92.52.5240240合计合计151513201320有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。142955.137352)(2nyyse142925505.87132083.02256002y102nxyyse有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导

41、向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。四、显著性检验四、显著性检验显著性检验的主要目的是根据所建立的估计方显著性检验的主要目的是根据所建立的估计方程用自变量程用自变量x来估计或预测因变量来估计或预测因变量y的取值。当的取值。当建立了估计方程后,还不能马上进行估计或预建立了估计方程后,还不能马上进行估计或预测,因为该估计方程是根据样本数据得到的,测,因为该估计方程是根据样本数据得到的,它是否真实的反映了变量它是否真实的反映了变量x和和y之间的关系,则之间的关系,则需要通过检验后才能证实需要通过检验后才能证实根据样本数据拟合回归方程时,实际上就已经假定根据样本数据

42、拟合回归方程时,实际上就已经假定变量变量x与与y之间存在着线性关系,并假定误差项是一之间存在着线性关系,并假定误差项是一个服从正态分布的随机变量,且具有相同的方差。个服从正态分布的随机变量,且具有相同的方差。但这些假设是否成立需要检验但这些假设是否成立需要检验显著性检验包括两方面显著性检验包括两方面线性关系检验线性关系检验回归系数检验回归系数检验有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。1.1.线性关系检验线性关系检验 线性关系检验是检验自变量线性关系检验是检验自变量 x x 和因变量和因变量

43、y y之间的线性关系是否显著,或者说,它们之间之间的线性关系是否显著,或者说,它们之间能否用一个线性模型能否用一个线性模型xy10来表示。来表示。检验时,我们使用统计量检验时,我们使用统计量knSSEkSSRF1,临界值采用,临界值采用),1(knkF 有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。【例【例10-7】某银行】某银行25个月的不良贷款与个月的不良贷款与贷款余额之间的数据如表贷款余额之间的数据如表10-6,要求:,要求:在在0.05的显著性水平下,检验不良贷款的显著性水平下,检验不良贷款

44、与贷款余额之间的线性关系是否显著与贷款余额之间的线性关系是否显著提出假设提出假设 0:0:1110HH 给定显著性水平给定显著性水平 0.050.05 计算统计量计算统计量 75.56225164421.901248598.2221knSSEkSSRF 求临界值求临界值 28.4)23,1(05.0F 做出决策做出决策 005.0)23,1(HFF拒绝原假设 在在 0.050.05 的显著性水平下,不良贷款与贷的显著性水平下,不良贷款与贷款余额之间的线性关系显著。款余额之间的线性关系显著。有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛

45、围,依赖既开放又相互信任的合作环境。2.回归系数的检验回归系数的检验回回归归系系数数的的显显著著性性检检验验是是要要检检验验自自变变量量对对因因变变 量量 的的 影影 响响 是是 否否 显显 著著。在在 一一 元元 线线 性性 回回 归归xy10中中,已已经经根根据据最最小小二二乘乘法法求求出出了了估估计计的的回回归归方方程程xy10,对对它它的的回回归归系系数数的的显显著著性性检检验验是是通通过过1来来检检验验1是是否否为为 0 0,即即对对0:10H进进行行检检验验。检检验验时时采采用用统统计计量量11st,临临 界界 值值 采采 用用)(2knt,其其 中中22)(1xnxsse 有利于

46、学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。【例【例 1010-8 8】某地区施肥量与平均亩产之间】某地区施肥量与平均亩产之间估计的一估计的一元线性回归方程为元线性回归方程为xy038.083.0,已知已知 n n2525,0053.0es,在,在 0.050.05 的显著性水平的显著性水平下,对回归系数进行显著性检验。下,对回归系数进行显著性检验。提出假设提出假设 0:0:1110HH 给定显著性水平给定显著性水平 0.050.05 计算统计量计算统计量 53.70053.00038.011st 求临

47、界值求临界值 069.2)23(205.0t 做出决策做出决策 0205.0)23(Htt拒绝原假设 在在 0.050.05 的显著性水平下,的显著性水平下,回归系数显著回归系数显著 有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。3.线性关系检验与回归系数检验的区别线性关系检验与回归系数检验的区别线性关系的检验是检验自变量与因变量是否可线性关系的检验是检验自变量与因变量是否可以用线性来表达,而回归系数的检验是对样本以用线性来表达,而回归系数的检验是对样本数据计算的回归系数检验总体中回归系数是否数据计

48、算的回归系数检验总体中回归系数是否为为0在一元线性回归中,自变量只有一个,线性关系检在一元线性回归中,自变量只有一个,线性关系检验与回归系数检验是等价的验与回归系数检验是等价的多元回归分析中,这两种检验的意义是不同的。线多元回归分析中,这两种检验的意义是不同的。线性关系检验只能用来检验总体回归关系的显著性,性关系检验只能用来检验总体回归关系的显著性,而回归系数检验可以对各个回归系数分别进行检验而回归系数检验可以对各个回归系数分别进行检验第四节第四节 多元线性回归分析多元线性回归分析有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖

49、既开放又相互信任的合作环境。一、模型概述与假设一、模型概述与假设1.模型概述模型概述经济活动中,经常会遇到某一现象的发展和变化取经济活动中,经常会遇到某一现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况,这时需用多元线性回个自变量有依存关系的情况,这时需用多元线性回归分析归分析多元线性回归分析预测法,是指通过对两上或两个以上的多元线性回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测自变量与一个因变量的相关分析,建立预测模型进行预测和控制的方法和控制的方法为了和前面的一元

50、线性回归分析有个比较,不再使用为了和前面的一元线性回归分析有个比较,不再使用、而使用而使用A、B与与a、b多元线性回归预测模型一般式为多元线性回归预测模型一般式为nnxBxBxBxBAy.332211有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。二、参数估计与预测二、参数估计与预测1.回归方程回归方程描述因变量描述因变量y的期望值如何依赖于多个自变的期望值如何依赖于多个自变量量x的方程称为多元线性回归方程的方程称为多元线性回归方程多元线性回归方程为多元线性回归方程为用样本统计量用样本统计量 代替回归

51、方程中的未知参数,就代替回归方程中的未知参数,就得到估计的多元线性回归方程得到估计的多元线性回归方程nnxbxbxbxbayE.)(332211nnxbxbxbxbay.332211有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。2.参数的最小二乘法估计参数的最小二乘法估计222112)()(xbxbayyyQ22221122212211112211nxbxxbxayxxxbxbxayxxbxbay有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化

52、氛围,依赖既开放又相互信任的合作环境。【例【例10-9】某地区通过市场调查发现电冰箱】某地区通过市场调查发现电冰箱销售量同居民新结婚户数、居民户均收入水平销售量同居民新结婚户数、居民户均收入水平相关。该地区近年电冰箱销售量、相关。该地区近年电冰箱销售量、新结婚户新结婚户数和居民户均收入水平资料见教材表数和居民户均收入水平资料见教材表10-7。以电冰箱销售量(千台)为因变量以电冰箱销售量(千台)为因变量y,以新结以新结婚户数(千户)为自变量婚户数(千户)为自变量,以居民户均收入,以居民户均收入(千元)为自变量(千元)为自变量。若预计。若预计2003年该地区居年该地区居民新婚户数为民新婚户数为30

53、.2千户,居民户均收入千户,居民户均收入62.5千元。用二元线性回归预测该地区千元。用二元线性回归预测该地区2003年电年电冰箱需求量冰箱需求量有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。2121216.145037.82336.3348.131697.82331.47361941.73936.3341948298bbabbabba3889.10002.08387.2021bba2122113889.10002.08387.20 xxxbxbay96.655.623889.12.300002.08

54、387.203889.10002.08387.2021xxy有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。三、回归直线的拟合优度三、回归直线的拟合优度多元线性回归分析,一般用于判断回归多元线性回归分析,一般用于判断回归直线拟合优度的指标有直线拟合优度的指标有多重判定系数多重判定系数修正多重判定系数修正多重判定系数估计标准误差估计标准误差有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。1.多重判定系数多重判定

55、系数对多元线性回归方程而言,总平方和对多元线性回归方程而言,总平方和SST同样可以分解为回归平方和同样可以分解为回归平方和SSR及及残差平方和残差平方和SSE两部分两部分SSTSSRSSE多重判定系数,也称为复判定系数,是多重判定系数,也称为复判定系数,是指在多元线性回归分析中,回归平方和指在多元线性回归分析中,回归平方和占总平方和的比重占总平方和的比重SSTSSRR 2有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。2.修正多重判定系数修正多重判定系数多重判定系数大小取决于多重判定系数大小取决于SS

56、E在在SST的比重的比重样本容量一定时,样本容量一定时,SST与自变量的个数无关,而与自变量的个数无关,而SSE则会随着自变量个数的增加不断减少,至少不则会随着自变量个数的增加不断减少,至少不会增加。因此,它是自变量个数的非递减函数会增加。因此,它是自变量个数的非递减函数多元线性回归模型中,各回归模型所含的变量多元线性回归模型中,各回归模型所含的变量的数目未必相同,以多重判定系数的大小作为的数目未必相同,以多重判定系数的大小作为衡量拟合优度的尺度是不合适的衡量拟合优度的尺度是不合适的用样本容量用样本容量n和变量个数和变量个数k去修正得到修正的多重判去修正得到修正的多重判定系数,以避免增加自变量

57、而高估多重判定系数定系数,以避免增加自变量而高估多重判定系数knnRRa1)1(122有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。某城市有关某城市有关A商品需求的统计数据如表,以销售量商品需求的统计数据如表,以销售量作为因变量,以每个居民的月平均收入(百元)作为因变量,以每个居民的月平均收入(百元)和和A商品的价格(元)为自变量,得到回归直线商品的价格(元)为自变量,得到回归直线为为 ,计算修正,计算修正的多重判定系数的多重判定系数217996.18685.15875.4xxy年次年次1 12 2

58、3 34 45 56 67 78 89 91010销售量销售量y y居民人均收入居民人均收入单价单价10105 52 210107 73 315158 82 213139 95 514149 94 4202010103 3181810104 4242412123 3191913135 5232315154 4有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。4.224)(2yySST08.27)(2yySSE88.04.22408.2712SSTSSRR84.0310110)88.01(11)1(122

59、knnRRa有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。3.估计标准误差估计标准误差估计标准误差描述了回归直线附近的偏估计标准误差描述了回归直线附近的偏差,小的标准误差表明样本点接近回归差,小的标准误差表明样本点接近回归直线。在多元回归中这一概念同样正确直线。在多元回归中这一概念同样正确与一元线性回归方程类似,说明多元线性回与一元线性回归方程类似,说明多元线性回归方程估计因变量的准确程度高低、反映回归方程估计因变量的准确程度高低、反映回归方程拟合程度的统计指标是估计标准误差,归方程拟合程度的统计指

60、标是估计标准误差,公式为公式为knyyknSSEse2)(有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。【例【例10-11】某地区通过市场调查发现电冰箱销售量】某地区通过市场调查发现电冰箱销售量同居民新结婚户数、居民户均收入水平相关。该地区同居民新结婚户数、居民户均收入水平相关。该地区近年电冰箱销售量、新结婚户数和居民户均收入水平近年电冰箱销售量、新结婚户数和居民户均收入水平资料见表。若回归直线为资料见表。若回归直线为 ,求标准误差求标准误差 213887.10002.08387.20 xxy年份年

61、份电冰箱销售电冰箱销售量量y y(干台)干台)新结婚户数新结婚户数x x1 1(干户)干户)居民户均收入居民户均收入x x2 2(千元)千元)199519951996199619971997199819981999199920002000200120012002200220202626303034344040444449495555222222.522.523.123.123.423.4242424.524.5262628.528.528.528.534.034.038.638.640.040.042.542.546.046.050.250.254.854.8685.13819.143)(32

62、nyynSSEse有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。四、显著性检验四、显著性检验当用多元线性回归直线去拟合因变量当用多元线性回归直线去拟合因变量y与与解释变量自变量之间的关系,在进行参解释变量自变量之间的关系,在进行参数估计之前,我们只是根据一些分析和数估计之前,我们只是根据一些分析和图形所作的一种假设图形所作的一种假设究竟这些变量之间是否真正具有多元线性相究竟这些变量之间是否真正具有多元线性相关关系,还需进行相关统计显著性检验关关系,还需进行相关统计显著性检验只有通过检验的模型,才能用

63、于预测和分析只有通过检验的模型,才能用于预测和分析有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。1.检验检验可以对自变量可以对自变量1x,2x,kx解释因变量解释因变量y y 的能力进行检验的能力进行检验 使用的检验方法是整体检验使用的检验方法是整体检验 它它主要检验所有的自变量是否可能都具主要检验所有的自变量是否可能都具有取有取 0 0 的回归系数,的回归系数,使用使用 F F 分布。分布。检验时,我们使用原假设为检验时,我们使用原假设为0.:210kbbbH,统计量为,统计量为knSSEkSSR

64、F1,临界,临界值采用值采用),1(knkF 有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。【例【例10-12】为了解地区房屋保暖费用】为了解地区房屋保暖费用情况,某乡镇进行了实地调查,资料如情况,某乡镇进行了实地调查,资料如表教材表教材10-10。以保暖费用(元)为因。以保暖费用(元)为因变量,以室外平均温度(为避免负值,变量,以室外平均温度(为避免负值,以以 为单位)、房屋绝缘厚度(寸)、火为单位)、房屋绝缘厚度(寸)、火炉使用时间(年)为自变量,调查结果炉使用时间(年)为自变量,调查结果如下。

65、建立的回归直线为如下。建立的回归直线为,试进行,试进行0.05的显著性水平进行检验的显著性水平进行检验有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。提出假设提出假设 0.:210kbbbH 0:1值都是不是所有的bH 给定显著性水平给定显著性水平 0.050.05 计算统计量计算统计量 9.2142041695141712201knSSEkSSRF 求临界值求临界值 24.3)16,3(05.0F 做出决策做出决策 005.0)16,3(HFF拒绝原假设 在在 0.050.05 的显著性水平下,线性

66、关系显著的显著性水平下,线性关系显著 有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。2.t检验检验F F 检检验验仅仅证证明明一一些些回回归归系系数数不不等等于于 0 0,但但并并非非所所有有的的都都不不为为 0 0 除除 F F 检检验验,还还需需要要检检验验个个别别特特定定的的回回归归系系数数,以以确确定定哪哪些些系系数数可可能能为为 0 0,哪哪些些不不为为 0 0 如如某某个个个个别别的的b为为 0 0,就就可可以以把把为为系系数数为为0 0 的的自自变变量量从从回回归归直直线线中中剔剔除除出出去去 在在对对二二元元线线性性回回归归直直线线进进行行检检验验时时,是是对对某某个个个个别别的的b进进行行检检验验,原原假假设设为为0:0ibH。采采用用统统计计量量ibiisbbt,临临界界值值采采用用)(2knt,其其中中222112222112222)()()()()(1xxxxxxxxxxsseb 而而222112222112112)()()()()(2xxxxxxxxxxsseb 第

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!