一元线性回归论文

上传人:z**** 文档编号:153137451 上传时间:2022-09-17 格式:DOCX 页数:30 大小:301.75KB
收藏 版权申诉 举报 下载
一元线性回归论文_第1页
第1页 / 共30页
一元线性回归论文_第2页
第2页 / 共30页
一元线性回归论文_第3页
第3页 / 共30页
资源描述:

《一元线性回归论文》由会员分享,可在线阅读,更多相关《一元线性回归论文(30页珍藏版)》请在装配图网上搜索。

1、一元线性回归分析论文专业:姓名:学号:摘要回归分析是数理统计中处理变量之间一种较为成熟、实用和有效的办法。它 可以简便有效地利用调查的统计资料,对经济现象进行事先预计和推断,为此引 出一元线性回归分析数学模型和解决问题的方法。本文回顾了描述变量相关关系 和回归分析方面的基本知识,系统阐述了一元线性回归模型的基本原理,并将所 学的知识与实际生产生活相结合,解决实际问题。目录第一章 回归分析概述 11.1 相关关系基本知识: 11.2 回归分析基本知识回顾:21.2.1 回归分析的定义21.2.2. 回归模型的分类21.2.3. 回归分析的步骤31.2.4. 回归分析的任务3第二章 一元线性回归的

2、基本理论 42.1 一元线性关系的判断42.2 一元线性回归模型的建立42.3 模型回归效果的显著性检验52.3.1线性假设的显著性检验(T检验)52.3.2线性回归的方差分析(F检验)62.4 利用回归方程进行预测 92.4. 一元线性回归模型的使用条件和特点112.4.1 一元线性回归模型的使用条件112.4.2.一元线性回归模型的特点12第三章 一元线性回归分析方法的实际应用 133.1典型实际问题133.2应用MATLAB与EXCEL软件对验数据进行分析143.2.1 应用 MATLAB 分析143.2.2应用Excel软件分析18第四章 总结 25第一章 回归分析概述随着科技的迅速发

3、展,数学的应用不仅在它的传统领域经济建设、 工程技术等方面发挥着越来越重要的作用,而且不断向一些新的领域渗透,形成 了许多交叉科学,如计量经济学、人口控制论、生物数学等。数学模型成为人们 认识和研究这些学科的一种重要的工具,如何利用所学知识,建立与实际生活背 景更贴切的数学模型来解决我们经济生活中存在的问题是摆在人们面前的重要 课题!本文回顾了描述变量相关关系和回归分析方面的基本知识,系统阐述了一 元线性回归模型的基本原理,并将其应用于实际生活中。 1.1相关关系基本知识:在生产实践和科学实验中,经常会遇到一些相互关联、相互制约的变量,它 们之间客观上存在着一定的关系,为了揭示其内在联系,往往

4、需要确定这些变量 的关系程度。变量之间的关系大致可分为两类,一类是确定性的关系,变量之间 按照确定的函数关系发生关联,也称函数关系,如物理学中速度与加速度之间的 关系;另一类是不确定性的关系,这种关系无法用一个数学公式来精确描述。当 一个变量(称因变量或可控变量)的取值确定后,若另一个变量(称因变量或依 变量)的取值虽无确定值,但以一确定的条件概率分布与之对应,这种变量间的 不确定性关系称为相关关系,如人的血压与年龄,身高与体重之间的关系,存在 相关关系的变量称为相关变量。统计学中研究相关关系的理论模型有相关模型和回归模型两种;相关模型指 的是变量间具有平行变化关系,相应的统计分析方法称为相关

5、分析,研究的是多个变量在数量关系上的密切程度和性质;回归模型指的是变量间具有因果变化关 系,相关的统计分析方法称为回归分析,研究的是一个随机变量与一个或多个可 控变量之间的变化关系。相关分析是回归分析的基础和前提,回归分析则是相关 分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体 形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度;相 关分析研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形 式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析可以推断 变量之间相互关系的具体形式,能够从一个变量的变化来推测另一个变量的变化 情况。1.

6、2回归分析基本知识回顾:1.2.1 回归分析的定义在研究某一社会经济现象的发展变化规律时,所研究的现象或对象称为被解 释变量,它是分析的对象;把引起这一现象变化的因素称为解释变量,它是引起 这一现象变化的原因,被解释变量反映了解释变量变化的结果。回归分析是研究 某一被解释变量(因变量)与另一个或多个解释变量(自变量)间的依存关系, 其目的在于根据已知的解释变量值或固定的解释变量值(重复抽样)来估计和预 测被解释变量的总体平均值。1.2.2.回归模型的分类(1)按模型中自变量的多少,分为一元回归模型和多元回归模型;(2)按模型中参数与被解释变量之间是否线性,分为线性回归模型和非线 性回归模型;(

7、3)按模型中方程数目的多少,分为单一方程模型和联立方程模型;1.2.3.回归分析的步骤(1)数据的收集与选取;(2)回归模型参数的估计、模型的确定检验与修正;(3)回归模型应用与推广。1.2.4.回归分析的任务找出相关变量间的回归方程,并利用其进行预测和控制。(1)依据一组实验数据,判断变量间是否存在相关关系,若有则建立相关 变量间的数学关系式(回归方程),并对所获得的回归方程的可信度作统计检验;(2)判断各变标考核变量(随机变量)影响的显著性,并做出统计选择;(3)利用最终获得的回归方程对生产和试验进行预测和控制。回归分析是一种传统意义上的应用性较强的科学方法之一,在各个领域都 得到了广泛的

8、应用,它不仅可以提取大量数据中的重要信息,掌握这些数据的特 点及规律,进而得出变量间相关关系的数学表达式,对这些关系进行分析;还可 以利用这些关系式,有一些变量去预测和控制另一个因变量的取值,进而知道这 种预测和控制所到达的程度,并分析得出结论。第二章 一元线性回归的基本理论2.1一元线性关系的判断一元线性回归模型的使用条件是两个变量之间存在线性关系,通过相关系数 的来判定两个变量之间存在线性相关。Mx2 - Qx )2i n ii =1i=1My2 -丄(My )2i n ii=1i=1|r| 1, |r|越大,线性相关越密切;当0.5 r 1为线性相关,可以用一元线性回归分析预测。2.2

9、一元线性回归模型的建立设随机变量y与变量x之间存在着直线相关关系,(x , y )可用模型表示为:iiy = P + P x + (i = 1,2,., n), P 与 P 为未知参数, (i = 1,2,.n)i 01 i i01i相互独立且服从N(0,b 2)的正态分布,求得P与P的估计值b和b,对0 1 0 1于x, E (y)的估计值b + bx,记为金,则方程y = b + bx称为y对x的一 0 1 0 1 元线性回归模型。y = b + bx尽可能地靠近散点01利用最小二乘法估计参数:若能使回归直线(x , y ),即应使总的离回归平方和:iiQ(b ,b ) = y (y )2

10、 =y (y b bx )201i ii 01 ii=1i =1达到最小,欲使二元函数Q(b ,b )最小,即01Q 一2工(y -b -bx )2 -0dbi 0 1 i0i -1= 一2工(y -b -bx )x -0Qbi 01 i i1i -1整理得:nb + b 工 x -01 iii -1i -1b工x + b工x 2 -工 0ii-1xy1 ii ii -1i -1其解 b ,0件称为卩0与01的最小二乘估计。令x-n Y学i-1y-丄工 y 进一步表示nii-1为: F值)=P 值2、F 检验统计量定义从方差分析的角度进行的回归模型整体性检验所采用的检验统计量是 F统计量。检验

11、统计量 F 反映平均回归平方和与平均剩余平方和的比较。且F服从自由度为1和n-2的F分布。即:FF (1, n-2)可以推导,F与可决系数r2有以下关系r2F = k(n - 2)利用检验统计量是F可以对回归方程进行显著性检验,即F检验。3、F 检验的步骤1 提出假设:原假设H0: p1=0备择假设斗:B产02)给定显著性水平a,查F分1布表获得临界值Fa(1,n-2),例如:在显著性水平a=0.05,n-2=8时,查F分布表,可以得到:)1,8)二5.323)据由下式可以利用样本数据计算检验统计量F的值4)进行比较,做出判断若F F(1,n - 2),差异显著,拒绝原假设,接受备择假设; a

12、若F F(l,n-2),差异不显著,接受原假设。a2.4 利用回归方程进行预测利用回归方程进行预测的方法有两种分别是: 1、点预测法:将自变量取值带入回归预测模型求出因变量的预测值。 2、置信区间预测法:估计一个范围,并确定该范围出现的概率。置信区间的大、小的影响的因素:a、因变量估计值;b、回归标准差;C、概率度t。相关图的绘制:相关图又称散点图、散布图,它是将相关表中的观测值在平 面直角坐标系中用坐标点描绘出来,以表明相关点的分布状况。通过相关图,可以 大致看出两个变量之间有无相关关系以及相关的形态、方向和密切程度。只有这 些点的分布大致散布在一条直线的周围,才可进行一元线性回归分析。模型

13、分析:一元线性回归分析预测法,是根据自变量x和因变量Y的相关 关系,建立x与Y的线性回归方程进行预测的方法。由于市场现象一般是受多种 因素的影响,而并不是仅仅受一个因素的影响。所以应用一元线性回归分析预测 法,必须对影响市场现象的多种因素做全面分析。只有当诸多的影响因素中,确 实存在一个对因变量影响作用明显高于其他因素的变量,才能将它作为自变量, 应用一元相关回归分析市场预测法进行预测。 一元线性回归分析法的预测模型为:Y = a + bxtt式中,X代表t期自变量的值;Y代表t期因变量的值;a、b代表一元线性 回归方程的参数。a、b参数由下列公式求得(用工 代表兰 ):i-lnnn工X Y

14、工X工Yb =i_iiin X2-( X )2T xs- x-?) =Sx y-XY-xyiii in这样定义 a、b 后,参数由下列公式求得:bX_将a、b代入一元线性回归方程Y二a + bx,就可以建立预测模型,那么,只要给定X值,即可求出预测值Y。 tt相关系数的计算:在利用回归模型进行预测时,需要用统汁方法对回归方程进行检验,判断预测模型的合理性和适用性。检验的方法主要有:相关系数检验4回归标准差检验、t检验、F检验等,在此只介绍相关系数检验。相关系数是描述两个变量之间的线性相关关系的密切程度的指标,用r表示:工(x - X)(y - y)s相关系数 r 的特征有: 相关系数取值范围为

15、:-1 r 0,称正线性相关,X上升,Y呈线性增加。ii当r 0,称负线性相关,X.上升,Y呈线性减少。|r|二0,X与Y无线性相关关系;|r|二1,完全确定的线性相关关系;0 |厂| 0.7,为高度线性相关;0.3 |厂| 0.7,为中度线性相关;|r| y=30 29.1 28.4 28.1 28.0 27.7 27.5 27.2 27.0 26.8 26.5 26.3 26.1 25.7 25.3 24.824.0 23.7 23.1 22.9 22.6 22.3 22.1 21.7 21.5 21.3 21.0 20.6 20.3 20.1; x=0 1 2 3 4 5 6 7 8 9

16、 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29;051015202530 plot(x,y,*) 生成图(1),可以看出x和y大体成线性关系。3029282726252423222120图1散点图(横轴:X纵轴Y)(2) 作一元回归分析,输入: n=leng th(y); X二ones(n,l),x; b,bint,r,rint,s=regress(y,X); b,bint,sb =29.5501-0.3329bint =29.3326 29.7676-0.3458 -0.3200s =1.0e+003 *0.0010

17、2.8019 0 0.0001这个结果可整理成表 1 的形式。回归系数回归系数估计值回归系数置信区间029.550129.3326,29.7676P1-0.3329-0.3458,-0.3200R 2 沁 1F 二 2801. 9p 0. 001表 1 MATLAB 回归分析结果表一元回归方程为:y = 29. 5501 - 0. 3329x从几个方面都可以检验模型是有效的:F检验P -接近于0; P的置信区1间不含零点;P a ;用 MATLAB命令finv(0.95,l,28)计算得到 FC,28)= 4. 1960 tl=19.5631-norminv(0.0975,0,l)*sqrt(

18、sum(r42)/16)t1 =20.0742 t2=19.5631+norminv(0.0975,0,1)*sqrt(sum(r.A2)/16)t2 =19.0520即时间间隔为30/h的刀具磨损速度测试中,刀具厚度的置信度为0.95的预 测区间为 U. 0520,20. 0742。也可以用命令: y=30 29.1 28.4 28.1 28.0 27.7 27.5 27.2 27.0 26.8 26.5 26.3 26.1 25.7 25.3 24.824.0 23.7 23.1 22.9 22.6 22.3 22.1 21.7 21.5 21.3 21.0 20.6 20.3 20.1;

19、 x=0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 2829; polytool(x,y,1,0.05)作出散点图及拟合曲线,并对x二30时的y进行预报,结果如图3所示。Degree3028 Values260.6521224222051015202530X Values图3散点图及拟合曲线如图3所示,红线表示为数据离合区间,蓝色“ + ”表示为数据散点分布, 绿色表示为拟合曲线。3.2.2应用Excel软件分析(1)下面用Excel “分析工具库”提供的“回归”工具,找出线性回归方程, 并检

20、验其显著性。1、具体步骤如下:1在【工具】菜单中选中【数据分析】,则会弹出【数据分析】对话框,然 后“分析工具”中选择“回归”选项,如图二所示。单击【确定】后,则弹出【回 归】对话框,如图5所示。2填写【回归】对话框。如图6所示,该对话框的内容较多,可以根据需 要,选择相关项目。在“X值输入区域”内输入队因变量数据区域的引用,该区域必须有单列数 据组成,如本题中组分B;在“Y只输入区域”输入对自变量数据区域的引用, 如本题中组分C。“标志” :如果输入区域的第一行中包含标志项,则选中此复选框,本题 中的输入区域包含标志项;如果在输入区域中没有标志项,则应清楚此复选框, Excel 将在输出表中

21、生成合适的数据标志。“置信度” :如果需要在汇总输出表中包含附件的置信度信息,则选中此 复选框,然后在右侧的编辑框中,输入所要使用的置信度Excel默认的置信度 为 95%,相当于显著性水平 a=0.05。“常数为零” :如果要强制回归线通过原点,则选中此复选框。“输出选项” :选择“输出区域”,在此输出对输出表左上角单元格的引用。3“残差” :如果需要以残差输出表形式查看残差,则选中此复选框。“标准残差” :如果需要在残差输出表中包含标准残差,则选中此复选框。“残差图” :如果需要生成一张图表,绘制每个自变量及其残差,则选中 此复选框。“线性拟合图” :如果需要为预测值和观察值生成和观测值生

22、车一个图表,则选中此复选框。“正态概率图” :如果需要绘制正态概率图,则选中此复选框。图5 Excel数据分析工具图5回归分析工具界面回归分析工具运行结果:Multiple R0.995041R Square0.990106Adjusted R Square 标准误差0.9897520.298135观测值30表2 回归统计表2中,“Multiple R是线性回归的系数R Square是拟合系数“Adjusted R Square” 调整后的拟合系数。dfSSMSFSignificance F回归分析1249.0449249.04492801.8981.29E-29残差282.4887620.0

23、88884总计29251.5337表3方差分析Coefficients标准误差t StatP-valueLower95%Upper95%下限95.0%上限95.0%Intercept29.550110.106197278.25759.73E-5029.3325729.7676429.3325729.76764XVariable1-0.332880.006289-52.9331.29E-29-0.34576-0.32-0.34576-0.32表 4 回归分析结果 1RESIDUALOUTPUTPROBABILITY OUTPUT观测 标准残预测Y残差差百分比排位Y129.550110.44989

24、21.5357341.66666720.1229.21723-0.11723-0.40016520.3328.88435-0.48435-1.653348.33333320.6428.55146-0.45146-1.541111.6666721528.21858-0.21858-0.746151521.3627.8857-0.1857-0.6339118.3333321.5727.55282-0.05282-0.1803121.6666721.7827.21994-0.01994-0.068072522.1926.887060.112940.38552828.3333322.31026.554

25、180.2458210.83912531.6666722.61126.22130.2787020.9513663522.91225.888420.4115831.40496338.3333323.11325.555540.5444641.8585641.6666723.71425.222650.4773451.62944645241524.889770.4102261.40033148.3333324.81624.556890.2431070.8298651.6666725.31724.22401-0.22401-0.764685525.71823.89113-0.19113-0.652445

26、8.3333326.11923.55825-0.45825-1.5642661.6666726.32023.22537-0.32537-1.110676526.52122.89249-0.29249-0.9984268.3333326.82222.55961-0.25961-0.8861871.66667272322.22673-0.12673-0.432597527.22421.89385-0.19385-0.661778.3333327.52521.56096-0.06096-0.208181.6666727.72621.228080.0719170.24549385282720.8952

27、0.1047980.35773488.3333328.12820.562320.0376790.12861991.6666728.42920.229440.070560.240869529.13019.896560.2034410.69445798.3333330表5回归分析结果2残差与标准残差观测值预测Y残差129.550110.449892229.21723-0.11723328.88435-0.48435428.55146-0.45146528.21858-0.21858627.8857-0.1857727.55282-0.05282827.21994-0.01994926.887060

28、.112941026.554180.2458211126.22130.2787021225.888420.4115831325.555540.5444641425.222650.4773451524.889770.4102261624.556890.2431071724.22401-0.224011823.89113-0.191131923.55825-0.458252023.22537-0.325372122.89249-0.292492222.55961-0.259612322.22673-0.126732421.89385-0.193852521.56096-0.060962621.22

29、8080.0719172720.89520.1047982820.562320.0376792920.229440.070563019.896560.203441表 6 回归分析结果 3度 厚 具 道Y40用EXCEL作出散点图200+ Y预测Y102030X消磨时间40图 6EXCEL 处理数据得出的散点图X Variable 1 Residual Plot图 7EXCEL 处理数据得出的残差分布图由表3所知,若保留四位有效数字,该回归方程的截距是29.5501,斜率为-0.3329,所以回归方程的表达式为:y二29.5501 - 0.3329X ;根据回归统计结 果,知决定系数r=0.98

30、98,即相关系数r=0.9231,说明自变量与因变量之间有较 高的相关性;根据方差分析的结果,F=2801.9,有效的F0.01,所以建立的回 归方程非常显著。在表五中,除了列出了回归系数,还有标准误差等项目。其中“标准误差” 表示的事对应回归系数的标准误差,其中偏回归系数的标准误差。“t Stat”就 是t检验时的统计量t;如果多元线性回归,则可直接根据“t Stat”的大小, 判断因素的主次顺序。“P-value”表示t检验偏回归系数不显著的概率,如果 P-value0.01,则可认为该系数对应的变量对试验结果影响非常显著(*),如 果0.01 P-value 0.05,则可认为该系数对应

31、的变量对试验结果影响显著(*); 对于常数项,P-value则表示常数项为零的几率。由表 3所知,若保留四位有效数字,该回归方程的截距是 29.5501,斜率为 -0.3329,所以所回归方程的表达式为:y = 29.5501 - 0.3329x ;根据回归统计 结果,知决定系数x二0.9898即相关系数r二0. 9231,说明自变量与因变量之 间有有着线性关系。第四章 总结回归分析是描述数据处理方法的一门科学,研究变量与变量之间的依赖关系 的方法, 它试图通过统计资料,来判断某些变量之间是否存在相关关系, 相关的 密切程度, 或近似地确定它们之间的数量关系,还可用来达到预测和控制的目 的,这对我们的生产和生活具有很大的现实意义。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!