MINITAB应用质量管理技术系列培训A阶段回归分析课件

上传人:阳*** 文档编号:84035308 上传时间:2022-05-02 格式:PPT 页数:49 大小:850KB
收藏 版权申诉 举报 下载
MINITAB应用质量管理技术系列培训A阶段回归分析课件_第1页
第1页 / 共49页
MINITAB应用质量管理技术系列培训A阶段回归分析课件_第2页
第2页 / 共49页
MINITAB应用质量管理技术系列培训A阶段回归分析课件_第3页
第3页 / 共49页
资源描述:

《MINITAB应用质量管理技术系列培训A阶段回归分析课件》由会员分享,可在线阅读,更多相关《MINITAB应用质量管理技术系列培训A阶段回归分析课件(49页珍藏版)》请在装配图网上搜索。

1、6 6-6 6-回归分析回归分析(Regression) 某种合成纤维的强度与其拉伸倍数有关。某种合成纤维的强度与其拉伸倍数有关。下表是下表是2424个纤维样品的强度与相应的拉伸倍个纤维样品的强度与相应的拉伸倍数的实测记录。试求数的实测记录。试求y y关于关于x x的线性回归方程。的线性回归方程。引例引例1一元线性回归分析(一元线性回归分析(Simple Linear RegressionSimple Linear Regression)一元线性回归分析(一元线性回归分析(Simple Linear RegressionSimple Linear Regression)一元线性回归分析(Sim

2、ple Linear Regression)引例引例2 在改进某合金强度的项目中,在改进某合金强度的项目中,6西格玛小组认为西格玛小组认为在某合金加工过程中影响其强度的可能的关键影响因在某合金加工过程中影响其强度的可能的关键影响因素是碳含量,为了调查碳含量对合金强度的影响,小素是碳含量,为了调查碳含量对合金强度的影响,小组在生产现场一对一地收集了碳含量与合金强度的数组在生产现场一对一地收集了碳含量与合金强度的数据。数据见(引用据。数据见(引用1)问:碳含量对合金强度是否有影响?其影响强问:碳含量对合金强度是否有影响?其影响强度有多大?度有多大?6 6-一元线性回归分析(一元线性回归分析(Sim

3、ple Linear RegressionSimple Linear Regression)6 6-单样本单样本T-检验检验双样本双样本T-检验检验F-检验检验方差分析方差分析一般线性模型一般线性模型一元线性回归一元线性回归多元线性回归多元线性回归一般线性模型一般线性模型卡方检验卡方检验二项逻辑回归二项逻辑回归二项逻辑回归二项逻辑回归连续连续连续连续非连续非连续非连续非连续YX回归分析(回归分析(Regression)6 6-回归分析(Regression)l回归分析是根据试验或观测得到的数据结果,分析、回归分析是根据试验或观测得到的数据结果,分析、推断哪些因素对过程的推断哪些因素对过程的Y

4、Y有着显著的影响,以及影响有着显著的影响,以及影响大小的常用工具大小的常用工具l回归分析研究的是在一项观测或实验中,回归分析研究的是在一项观测或实验中,X X的变化的变化是否对是否对Y Y产生影响及影响的大小。产生影响及影响的大小。l一元和多元线性回归分析中,一元和多元线性回归分析中,X X和和Y Y都是连续型数据。都是连续型数据。回归分析的基本统计原理简介回归分析的基本统计原理简介6 6-回归分析(Regression)l回归分析可以帮助我们寻找潜在的回归分析可以帮助我们寻找潜在的X X,以及确定它们,以及确定它们与与Y Y的关系。的关系。l通过回归分析,确定通过回归分析,确定X X对对Y

5、Y是否有显著的影响是否有显著的影响( (统计显统计显著性著性) ),以及他们对,以及他们对Y Y的影响程度的影响程度实践显著性。实践显著性。l获得获得X X和和Y Y的线性模型(建模),用的线性模型(建模),用X X预测预测Y Y。一元线性回归分析(一元线性回归分析(Simple Linear Regression)l在回归分析中,我们假设在回归分析中,我们假设X对对Y的影响是线性的。的影响是线性的。l当只考虑一个当只考虑一个X对对Y的影响时,称为一元线性回归。的影响时,称为一元线性回归。(X与与Y都是连续型数据)都是连续型数据)l在收集数据时,将在收集数据时,将X与与Y一一对应,即:收集到一

6、一对应,即:收集到每一个每一个X和与其对应的和与其对应的Y。一元线性回归分析(Simple Linear Regression)一元线性回归分析(Simple Linear Regression)例例1 在改进某合金强度的项目中,在改进某合金强度的项目中,6 6西格玛小组认为在西格玛小组认为在某合金加工过程中影响其强度的可能的关键影响因素某合金加工过程中影响其强度的可能的关键影响因素是碳含量,为了调查碳含量对合金强度的影响,小组是碳含量,为了调查碳含量对合金强度的影响,小组在生产现场一对一地收集了碳含量与合金强度的数据。在生产现场一对一地收集了碳含量与合金强度的数据。数据见(回归分析(引用数据

7、见(回归分析(引用1 1)问:碳含量对合金强度是否有影响?其影响强问:碳含量对合金强度是否有影响?其影响强度有多大?度有多大?6 6-数据输出结果数据输出结果多元线性回归分析(多元线性回归分析(Multiple Linear Regression)例例 在某平炉炼钢过程中,由于矿石和炉气的在某平炉炼钢过程中,由于矿石和炉气的氧化作用,铁水的总含炭量在不断降低。试氧化作用,铁水的总含炭量在不断降低。试分析一炉钢的去碳量分析一炉钢的去碳量Y Y与所加的两种矿石量与所加的两种矿石量X1X1、X2X2及融化时间及融化时间X3X3是否有关。数据见是否有关。数据见(回归分析(引用(回归分析(引用2 2)多

8、元回归分析 1 1 多元线性回归分析基本理论多元线性回归分析基本理论 2 2 标准的多元线性回归模型标准的多元线性回归模型 3 3 多元线性回归模型的估计多元线性回归模型的估计 4 4 多元线性回归模型的检验多元线性回归模型的检验 5 5 多元线性回归模型预测多元线性回归模型预测 6 6 多元线性回归模型的多元线性回归模型的MinitabMinitab实现实现 7 7 多元非线性回归多元非线性回归多元线性回归分析(多元线性回归分析(Multiple Linear Regression)1 多元线性回归分析的基本理论 u 多元线性回归是简单线性回归的推广多元线性回归是简单线性回归的推广, ,指指

9、的是多个因变量对多个自变量的回归的是多个因变量对多个自变量的回归(Multivariate Regression)(Multivariate Regression),最常用的是一,最常用的是一个因变量对多个自变量的回归。个因变量对多个自变量的回归。多元线性回归分析(Multiple Linear Regression)因变量y自变量x1自变量x2自变量xk返回目录多元线性回归分析(Multiple Linear Regression)计算估计多元回归方程计算估计多元回归方程u 多元线性回归模型多元线性回归模型u u 多元线性回归方程多元线性回归方程u tktkttuxxy221是样本统计量kk

10、tkttbbbxbxbby,21221样本数据:样本数据:x x1 1 x x2 2 x xk k y y. . . . . . . . . . . . .是未知参数kktkttxxyE,)(21221b b1 1,b,b2 2,b,bk k是是 1 1,2 2,k k的估计值的估计值2 标准的多元线性回归模型多元线性回归分析(Multiple Linear Regression)多元线性回归模型的性质截距截距偏回归系数偏回归系数例例二元线性回归模型:二元线性回归模型:23121xbxbbyb b2 2:假定:假定x x2 2固定时固定时x x1 1每变动每变动1 1个单位引起的个单位引起的y

11、 y的增量。的增量。b b3 3:假定:假定x x1 1固定时固定时x x2 2每变动每变动1 1个单位引起的个单位引起的y y的增量。的增量。 是是x x1 1和和x x2 2共同变动引起的共同变动引起的y y的平均的平均 变动,反映一组自变量与因变量的平均变动关系。变动,反映一组自变量与因变量的平均变动关系。23121xbxbby是给定是给定x x1 1、x x2 2计算得到的估计值,是计算得到的估计值,是y y的实际值的的实际值的数学期望。数学期望。y 多元线性回归分析(Multiple Linear Regression)jjjyxbxbby23121(实际值)一组自变量对一组自变量对

12、y y的线性影响的线性影响而形成的系统部分,反映而形成的系统部分,反映x x与与y y变动关系的本质特征。变动关系的本质特征。随机干扰:随机干扰:各种偶然因素观察误差和各种偶然因素观察误差和其他被忽视因素的影响。其他被忽视因素的影响。多元线性回归分析(Multiple Linear Regression)3 多元线性回归模型的估计u(一)回归系数的估计(一)回归系数的估计u u(二)随机误差方差的估计(二)随机误差方差的估计uu u(三)最小二乘估计量的性质(三)最小二乘估计量的性质u 标准的多元线性回归模型中,高斯标准的多元线性回归模型中,高斯. .马尔可夫马尔可夫定理同样成立。定理同样成立

13、。 YXXXB1kneSt22多元线性回归分析(Multiple Linear Regression)u 一一. .拟合程度的评价拟合程度的评价u 调整可决系数调整可决系数 u u u 式中,式中,n n是样本容量;是样本容量;k k是模型中回归系数的个数。是模型中回归系数的个数。u 调整可决系数调整可决系数 的特点。的特点。 )() 1()1 (1) 1/()()/(12222knnRnyykneRtt4 多元线性回归模型的检验2R多元线性回归分析(Multiple Linear Regression)多元线性回归模型的显著性检验u 回归系数回归系数 b b 的检验的检验u 1 1提出假设。

14、提出假设。 H H0 0 : j j = 0 = 0; H H1 1: j j00 u 2.2.确定显著水平确定显著水平 。u 3.3.计算回归系数的计算回归系数的t t 值。值。u 式中式中, , 是的标准差的估计值。是的标准差的估计值。 按下式计算:按下式计算:u u 式中,式中, 是是(XX)(XX)-1 -1 的第的第 j j 个对角线元素,个对角线元素, S S 2 2 是随机误差是随机误差项方差的估计值。项方差的估计值。 ,1,2,kjSbtjjbjjjbSSj 2jjjbS多元线性回归分析(Multiple Linear Regression)多元线性回归模型的显著性检验(续一)

15、4.4.确定临界值。确定临界值。 双侧检验查双侧检验查t t分布表所确定的临界值是分布表所确定的临界值是(- (-t t/2/2) )和和( (t t/2/2) );单侧;单侧检验所确定的临界值是(检验所确定的临界值是(t t )。)。5.5.做出判断。做出判断。 拒绝域拒绝域接受域双侧检验图示:多元线性回归分析(Multiple Linear Regression)u 回归方程的显著性检验回归方程的显著性检验l 具体的方法步骤具体的方法步骤 l 回归模型方差分析表回归模型方差分析表lF F统计量统计量 多元线性回归模型的显著性检验(续二)离差名称平方和自由度均 方 差回归平方和k-1SSR/

16、(k-1)残差平方和 n-kSSE/(n-k)总离差平方和 n-12)RtSSy(y2 )EtSSyt(y2()tSSTyy)-/(1)-/(knSSEkSSRF 多元线性回归分析(Multiple Linear Regression)5 多元线性回归模型预测u 基本公式:基本公式:u u 式中,式中,x xjf jf (j=2,3,k)(j=2,3,k)是给定的是给定的x xj j 在预测在预测期的具体数值;期的具体数值; 是已估计出的样本回归系数;是已估计出的样本回归系数; 是是x xj j 给定时给定时y y 的预测值。的预测值。 kfkffxbxbby221jbfy 返回目录多元线性回

17、归分析(Multiple Linear Regression)6 多元线性回归模型的MinitabMinitab实现u 在研究多元回归问题时可能感到比较复杂,下在研究多元回归问题时可能感到比较复杂,下面我们用统计软件帮助大家实现多元线性回归模面我们用统计软件帮助大家实现多元线性回归模型的建立、估计、检验以及预测问题。型的建立、估计、检验以及预测问题。u 多元回归模型在建立过程中可采用两种不同的多元回归模型在建立过程中可采用两种不同的方法,分别为:方法,分别为:实现方法实现方法直接回归法直接回归法逐步线性回归逐步线性回归向前加入变量法向前加入变量法逐步回归法逐步回归法向后淘汰变量法向后淘汰变量法

18、多元线性回归分析(Multiple Linear Regression)u 例例1 1:在研究某超市顾客人数:在研究某超市顾客人数y y与该超市促销费用与该超市促销费用x x1 1 、超市面积超市面积x x2 2 、超市位置、超市位置x x3 3之间关系时,选取变量如之间关系时,选取变量如下:下: Y Y - -某超市某一周六顾客人数(千人)某超市某一周六顾客人数(千人) X X1 1 -该超市上周促销所花的费用(万元该超市上周促销所花的费用(万元) ) X X2 2 该超市的面积(百平方米)该超市的面积(百平方米) X X3 3 超市所处位置超市所处位置(0(0表示市区、表示市区、1 1表示

19、郊区表示郊区) )u 按照按照y y变量排序后的原始数据是:变量排序后的原始数据是:y y2 23 35 57 78 8101017172424252530303131353536364242444445454848505052525555x x1 11 11.1.5 52 22 22 22.2.3 32.2.5 52.2.5 52.2.4 42.2.6 62.2.5 52.2.5 54 44.4.1 14 44.4.3 34.4.5 54.4.4 44 44.4.1 1x x2 22 21 11.1.3 31.1.3 31.1.5 51.1.5 52 22.2.5 52 22 24 43 3

20、4 43.3.5 53.3.5 53.3.5 55 55 57 78 8x x3 31 11 11 11 10 01 11 11 10 00 01 10 01 10 00 00 01 10 00 00 0多元回归案例分析:多元线性回归分析(Multiple Linear Regression)定性分析过程: 数据分析之前,我们要先考虑各个自变量数据分析之前,我们要先考虑各个自变量与因变量之间是否存在相关关系。与因变量之间是否存在相关关系。 分别绘制顾客人数分别绘制顾客人数y y与促销费用与促销费用x x1 1 、超市、超市面积面积x x2 2 的散点图,直观上测定其是否存在线性的散点图,直观上

21、测定其是否存在线性关系。通过散点图可以看出,因变量关系。通过散点图可以看出,因变量y y与自变与自变量量x x1 1 、x x2 2 之间确实存在较明显的线性相关关系,之间确实存在较明显的线性相关关系,而而x x3 3 超市位置是虚拟二元变量,我们无法从散超市位置是虚拟二元变量,我们无法从散点图中看出其中的线性关系,但经验所知其一点图中看出其中的线性关系,但经验所知其一定影响着因变量定影响着因变量y y,所以我们同时将其纳入分所以我们同时将其纳入分析模型。析模型。 模型建立过程如下:模型建立过程如下:多元线性回归分析(Multiple Linear Regression)数据见数据见多变量回归

22、多变量回归( (例例1)1)1 1、直接回归法、直接回归法: :多元线性回归分析(Multiple Linear Regression)2、最优回归实现:、最优回归实现: 若我们上面的预测方程不显著,但确实知道其中几个变若我们上面的预测方程不显著,但确实知道其中几个变量存在着一定的线性关系,我们也可以运用逐步回归的方量存在着一定的线性关系,我们也可以运用逐步回归的方法对变量进行分析处理法对变量进行分析处理 。多元线性回归分析(多元线性回归分析(Multiple Linear Regression)例例1 在某平炉炼钢过程中,由于矿石和炉气的氧在某平炉炼钢过程中,由于矿石和炉气的氧化作用,铁水的

23、总含炭量在不断降低。试分化作用,铁水的总含炭量在不断降低。试分析一炉钢的去碳量析一炉钢的去碳量Y Y与所加的两种矿石量与所加的两种矿石量X1X1、X2X2及融化时间及融化时间X3X3是否有关。数据见(回归分是否有关。数据见(回归分析(引用析(引用2 2)多元线性回归分析(多元线性回归分析(Multiple Linear Regression)练习练习 六西格玛项目小组为了调查影响熊的六西格玛项目小组为了调查影响熊的重量因素,他们收集到了这样一组数据。重量因素,他们收集到了这样一组数据。数据见数据见: 试分析试分析:熊的重量熊的重量Y与这些因素是否有关及与这些因素是否有关及其影响程度有多大其影响

24、程度有多大?7 多元非线性回归u 多元非线性回归是一元非线性回归的多元非线性回归是一元非线性回归的多元扩展,其理论基础建立在多元回归与多元扩展,其理论基础建立在多元回归与非线性回归的基础上。非线性回归的基础上。u 在实际工作中,多元非线性回归的应在实际工作中,多元非线性回归的应用非常广泛,大多数生产函数和需求函数用非常广泛,大多数生产函数和需求函数都需要用到多元非线性拟合。常用的有都需要用到多元非线性拟合。常用的有C-C-DD生产函数、产品的需求弹性分析。生产函数、产品的需求弹性分析。u 下面我们用需求弹性分析实例介绍此下面我们用需求弹性分析实例介绍此类模型的估计方法及结果处理解释。类模型的估

25、计方法及结果处理解释。xyu 例例2 2:厂商想研究其产品销售量与居民月:厂商想研究其产品销售量与居民月平均收入、商品价格之间的变化关系,现平均收入、商品价格之间的变化关系,现调查某城市有关此商品需求的数据如下:调查某城市有关此商品需求的数据如下: 年年 次次12345678910销售量销售量y y( (百件百件) )居民人均收入居民人均收入x x2 2( (百百元元) )单价单价x x3 3(10(10元元) )105210731582139514942010318104241231913523154试根据数据建立销售量试根据数据建立销售量 y y 与居民人均收入与居民人均收入 x x2 2

26、 及及商品单价商品单价 x x3 3 之间的关系。之间的关系。数据变换分析:u1.1.根据我们对经济规律的分析可知:产品销售量与根据我们对经济规律的分析可知:产品销售量与居民人均收入、商品单价呈现幂函数形式的关系,居民人均收入、商品单价呈现幂函数形式的关系,即:即:3232btbttxaxy u2.2.利用双对数变换法,同时加入随机误差项,可得利用双对数变换法,同时加入随机误差项,可得以下线性回归函数:以下线性回归函数:ttttuLxLxLy33221u3.3.这样我们就得到一般的多元线性回归模型,可以这样我们就得到一般的多元线性回归模型,可以利用软件对其进行参数估计、检验,然后通过两个利用软

27、件对其进行参数估计、检验,然后通过两个方程之间的关系,写出原方程的形式。数据见方程之间的关系,写出原方程的形式。数据见( (多多元非线性回归例元非线性回归例1)1)ttttttxLxxLxyLybba332233221lnlnlnln;式中:数据的初步变换:原数据与新产生数据列:原始数据:原始数据与三次变量变换后的数据:对变换后的数据进行建模:对变换后的数据进行建模:计算结果:404. 0316. 12928. 1tttxxy变换过的数据产生的回归方程根据两个方程间的变换关系,对产生的回归方程进行反对根据两个方程间的变换关系,对产生的回归方程进行反对数变换,得变量间的回归方程如下:数变换,得变

28、量间的回归方程如下:结果解释及预测分析: 由上式可知:居民收入的需求弹性约为由上式可知:居民收入的需求弹性约为1.161.16,而价格的需求弹性约为,而价格的需求弹性约为-0.4-0.4。也就是说,。也就是说,在其他情况不变的条件下,居民人均收入每增在其他情况不变的条件下,居民人均收入每增加加1%1%会使此商品的需求增加会使此商品的需求增加1.16%1.16%,价格每,价格每提高提高1%1%会使此商品的需求减少会使此商品的需求减少0.4%0.4%。 若此时我们要预测居民人均收入为若此时我们要预测居民人均收入为22002200元,商品单价为元,商品单价为5050元时该商品的需求量元时该商品的需求

29、量y y,只,只需将需将x x2 2=22=22,x x3 3=5=5代入方程即得:代入方程即得:)(30.36)5()22(928. 1404. 016. 1百件y一般线性模型(一般线性模型(General Linear Model)例例 某化工产品的不纯度可能受到多种因素的影响。现收某化工产品的不纯度可能受到多种因素的影响。现收集到数据见(集到数据见(GLMGLM(练习(练习3 3) 1 1、不纯度、不纯度Y Y是连续型数据;是连续型数据; 2 2、有多个、有多个X X为可能的影响因素这些为可能的影响因素这些X X中既有连续型的中既有连续型的又有非连续型的;又有非连续型的; 3 3、故此它

30、们适用于、故此它们适用于GLMGLM分析方法。分析方法。一般线性模型(一般线性模型(General Linear Model)l在回归分析中,我们假设在回归分析中,我们假设X X对对Y Y的影响是线性的。的影响是线性的。l当考虑多个当考虑多个X X(此时(此时X X可以是连续型数据也可以是连续型数据也可以是非连续型数据可以是非连续型数据的)的)对对Y Y的影响的影响但但Y Y都都是连续型数据时,是连续型数据时,可以采用一般线性模型分析可以采用一般线性模型分析法。法。l在收集数据时,将在收集数据时,将X X与与Y Y一一对应,即:收集到一一对应,即:收集到每一个每一个X X和与其对应的和与其对应

31、的Y Y。一般线性模型(General Linear Model)一般线性模型(一般线性模型(General Linear Model)例例1 某化工产品的不纯度可能受到多种因素的影响。现收某化工产品的不纯度可能受到多种因素的影响。现收集到数据见(集到数据见(GLMGLM(练习(练习3 3) 1 1、不纯度、不纯度Y Y是连续型数据;是连续型数据; 2 2、有多个、有多个X X为可能的影响因素这些为可能的影响因素这些X X中既有连续型的中既有连续型的又有非连续型的;又有非连续型的; 3 3、故此它们适用于、故此它们适用于GLMGLM分析方法。分析方法。6 6-单样本单样本T-T-检验检验双样本

32、双样本T-T-检验检验F-F-检验检验方差分析方差分析一般线性模型一般线性模型一元线性回归一元线性回归多元线性回归多元线性回归一般线性模型一般线性模型卡方检验卡方检验二项逻辑回归二项逻辑回归二项逻辑回归二项逻辑回归连续连续连续连续非连续非连续非连续非连续YXsXu 识别影响识别影响 的波动源的波动源Yu 通过数据分析识别和确认关键通过数据分析识别和确认关键 及其影响程度及其影响程度sXu通过通过MINI-TAB MINI-TAB 软件的数据分析方法来实现软件的数据分析方法来实现6 6-sXu 确认因果分析列出所有可能的确认因果分析列出所有可能的u 用图形分析工具对潜在的关键用图形分析工具对潜在的关键 初步分析初步分析u 用统计分析工具验证潜在的关键用统计分析工具验证潜在的关键 和他们的和他们的 影影响程度响程度sXu 最终识别并排除关键的最终识别并排除关键的6 6-sX 分析阶段的分析阶段的重点重点: 通过数据分析确定关键的通过数据分析确定关键的 及其影响程度及其影响程度sXsX再再 见见 !谢谢谢谢! !合作愉快!合作愉快!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!