一元线性回归模型

上传人:仙*** 文档编号:168704981 上传时间:2022-11-11 格式:PPT 页数:50 大小:1.71MB
收藏 版权申诉 举报 下载
一元线性回归模型_第1页
第1页 / 共50页
一元线性回归模型_第2页
第2页 / 共50页
一元线性回归模型_第3页
第3页 / 共50页
资源描述:

《一元线性回归模型》由会员分享,可在线阅读,更多相关《一元线性回归模型(50页珍藏版)》请在装配图网上搜索。

1、第第2章章 一元线性回归模型一元线性回归模型 模型的建立及其假定条件模型的建立及其假定条件最小二乘估计(最小二乘估计(OLS)最小二乘估计量的特性最小二乘估计量的特性参数估计量的分布参数估计量的分布 的估计的估计 拟合优度的测量拟合优度的测量回归参数的显著性检验与置信区间回归参数的显著性检验与置信区间yF 的点预测与区间预测的点预测与区间预测案例分析案例分析EViews操作操作1.模型的建立及假定条件模型的建立及假定条件 0+1 xtut(随机误差项随机误差项)粮食产量粮食产量 yt (被解释变量被解释变量)种植面积种植面积xt(解释变量解释变量)t=1,2,T.T=200 0 和和 1称为参

2、数称为参数yt=0+1 xt+ut 一元线性回归模型:一元线性回归模型:yt=0+1 xt+ut 回归模型的随机误差项中一般包括如下几项内容,(回归模型的随机误差项中一般包括如下几项内容,(1)非重要解释变量的省略,(非重要解释变量的省略,(2)数学模型形式欠妥,)数学模型形式欠妥,(3)归并误差(粮食的归并)()归并误差(粮食的归并)(4)测量误差等。)测量误差等。回归模型存在两个特点。回归模型存在两个特点。(1)回归函数(这里是直线)不能百分之百地再现所研)回归函数(这里是直线)不能百分之百地再现所研究的经济过程。究的经济过程。(2)也正是由于这些假定与抽象,才使我们能够透过复)也正是由于

3、这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。杂的经济现象,深刻认识到该经济过程的本质。1.模型的建立及假定条件模型的建立及假定条件 模型解释变量和误差项模型解释变量和误差项ut(t=1,2,T)的的假定条件假定条件如下如下:(1)ut 是随机变量,是随机变量,ut 的取值服从概率分布。的取值服从概率分布。(2)E(ut)=0。(3)ut 具有同方差性。具有同方差性。D(ut)=Eut-E(ut)2=E(ut)2=2。(4)ut 非自相关。非自相关。Cov(ui,uj)=E(ui-E(ui)(uj-E(uj)=E(uiuj)=0,(i j)。(5)ut 为正态分布

4、。为正态分布。1.模型的建立及假定条件模型的建立及假定条件以上以上假定条件假定条件可作如下表达。可作如下表达。ut i.i.d.N(0,2)t=1,2,T (6)xt是非随机的,即是非随机的,即xt的取值是确定的。的取值是确定的。一元线性回归模型:一元线性回归模型:yt=0+1 xt+ut在假定(在假定(1)()(2)()(6)成立条件下有)成立条件下有 E(yt)=E(0+1 xt+ut)=0+1 xt1.模型的建立及假定条件模型的建立及假定条件2.最小二乘估计最小二乘估计E(yt)=0+1 xt粮食产量粮食产量 yt种植面积种植面积xtyt=0+1 xt+ut 真实的统计模型真实的统计模型

5、真实的回归直线真实的回归直线 通常真实的回归直线通常真实的回归直线 是观测不到的,即参是观测不到的,即参数数 和和 是未知的。是未知的。01()ttE yx01我们需要对它进行估计,即参数估计。我们需要对它进行估计,即参数估计。,即参数估计量。,即参数估计量。2.最小二乘估计最小二乘估计估计的统计模型估计的统计模型估计的回归直线估计的回归直线01txtuty ty01ttttyuxu+如何确定红色直线的位置?如何确定红色直线的位置?u使残差之和最小?使残差之和最小?互相抵消,不能用于互相抵消,不能用于实际计算。实际计算。u使使残差绝对值之和最小残差绝对值之和最小?绝对值的计算比较麻绝对值的计算

6、比较麻烦。烦。使残差平方和最小!使残差平方和最小!称为最小二乘法称为最小二乘法(Ordinary Least Square,OLS)01()ttE yx直线在点中间直线在点中间!正规方程一正规方程一正规方程二正规方程二0tu0ttx u,即点,即点 在回归直线上。在回归直线上。(,)x y两个参数估计量都是两个参数估计量都是随机变量随机变量!(对x和y重复抽样进行计算,估计量值不同)(C F Gauss,1777-1855)C F Gauss 1809年提出年提出OLS估计方法估计方法。谁提出的谁提出的OLS估计方法?估计方法?思考:参数估计量是随机变量,服从一定分布。思考:参数估计量是随机变

7、量,服从一定分布。p除除OLS估计量外,还有没有其他的估计量?估计量外,还有没有其他的估计量?p如何评价你的随机变量?如何评价你的随机变量?(3)最小方差性)最小方差性:OLS得到的得到的 0,1是所有线性无偏估计量中方差最小的。是所有线性无偏估计量中方差最小的。3.最小二乘估计量的特性:最小二乘估计量的特性:高斯高斯-马尔科夫定理马尔科夫定理满足上述假设条件的满足上述假设条件的OLS估计量是最佳无偏线性估计量估计量是最佳无偏线性估计量(BLUE)1010111()0()ttttttttttttttttk ykxukk xk uk xxk uk u1111()()()ttttEEk uk E

8、u4参数估计量参数估计量 的分布的分布 00()E2202var()()ttxTxx22002,()ttxNTxx同样可以证明同样可以证明 的分布ut N(0,2)yt服从正态分布服从正态分布 服从正态分布服从正态分布yt=0+1 xt+ut 1ttk y5 的估计的估计(或称为样本方差或称为样本方差)1()S称为样本标准差用用残差残差的方差来估计的方差来估计又称为又称为误差均方误差均方,是,是随机变量随机变量!6拟合优度的测量拟合优度的测量 拟合优度是指回归直线对观测值的拟合程度。拟合优度是指回归直线对观测值的拟合程度。TSS =ESS +RSS总体平方和回归平方和残差平方和总体平方和回归平

9、方和残差平方和线性关系是否恰当?y的变差的变差被被x所解释的变差所解释的变差未被未被x所解释的变差所解释的变差()()()ttttttyyyyyyyyu0101111()()()()000ttttttttttyyyyuxxuxxu xxu证明证明其中其中 2222()()()()()2()()ttttttttttTSSyyyyyyyyyyyyyy度量拟合优度的统计量:可决系数(确定系数)度量拟合优度的统计量:可决系数(确定系数)R2的取值范围是的取值范围是 0,1。对于一组数据,对于一组数据,TSS是不变的,所以是不变的,所以RSS(),ESS()。)。RSS:指残差平方和(:指残差平方和(s

10、um of squared residuals)ESS:指回归平方和(:指回归平方和(explained sum of squares)TSSRSSyyyyRtt222)()(1ESSRSSTSSTSS 7回归参数估计量的显著性检验回归参数估计量的显著性检验2222 的分布11212(,)()tNxx先假设 再构造统计量试图推翻,同样的方法也可以应用于检验 等于其他值的原假设,见书53页1010或8回归参数的置信区间回归参数的置信区间222(1-)%的置信区间是的置信区间是222 未知,构造t 统计量求解1例题例题2.1 人均鲜蛋需求量y与人均可支配收入x关系 OLS估计结果:估计结果:10.

11、76620.0051ttyx样本容量样本容量 1988年年-1998年年 (file:li-2-1)01ttyxtuCoefficient:参数估计量2448.11157.1229508.13967.1)(20Var00000144.00012.0)(21Var,1157.1(file:li-2-1)参数估计量的样本标准差参数估计量的样本标准差回归函数的标准误差回归函数的标准误差01()()SS和01()()SS运用和计算样本方差例题例题2.1 人均鲜蛋需求量y与人均可支配收入x关系 估计量标准差估计量标准差:注意注意RSS与与S.E.的关系的关系可决系数可决系数:6709.0108450.1

12、2033.11108450.1)111(.)111(.22222DSSSEDSSSTSSESSTSSTSSRR(file:li-2-1)22222.(1).(11 1).(1).(11 1)ESSTSSRSSS DTRSSS DRSSRTSSTSSS DTS DS.D.dependent var:被解释变量标准差被解释变量标准差22().(1)1tyyS DSSTS DTT例题例题2.1 人均鲜蛋需求量y与人均可支配收入x关系 显著性检验显著性检验:H0:1=0;H1:1 0。在。在H0成立条件下,成立条件下,25.40012.00051.0)(1)(1111sstH0:0=0;H1:0 0。

13、在。在H0成立条件下,成立条件下,7082.73967.17661.10)(0)(0000sstProb=P|t-Statistic|临界值临界值 即接受原假设的概率。即接受原假设的概率。检验结果:检验结果:回归参数显著不为零。回归参数显著不为零。例题例题2.1 人均鲜蛋需求量y与人均可支配收入x关系 1 1的置信区间:的置信区间:0 0的置信区间:的置信区间:0078.00024.00012.026.20051.0)2()(11Tts9227.136097.73967.126.27662.10)2()(00Tts(file:li-2-1)22例题例题2.1 人均鲜蛋需求量y与人均可支配收入x

14、关系 OLS回归模型的标准格式:回归模型的标准格式:10.76620.0051ttyx(7.7)(4.3)R2=0.67,T=11,(,(1988 1998)(file:li-2-1)参数显著性检验的t值-3-2-1012141516171819208889909192939495969798ResidualActualFitted真实值真实值拟合值拟合值残差残差S.E.-S.E.分析残差的正分析残差的正态分布性态分布性(file:li-2-1)分析残差分析残差ty Actual表示yt的实际观测值,Fitted表示yt的拟合值,Residual表示残差。残差图中的两条虚线与中心线的距离表示残

15、差的一个标准差,即s.e.。通过残差图可以看到,大部分残差值都落在了正、负一个标准差之内。方程估计窗口中点击方程估计窗口中点击veiwactual,fitted,residual9yF 的点预测与区间预测的点预测与区间预测22221()()(1)()FFFtxxSyyTxx 是一个随机变量随机变量,且是无偏预测量,即()(2)FFFFyyyytt TS()FFE yyFy假定样本外也服从回归直线。假定样本外也服从回归直线。称为称为预测误差预测误差,其期望为,其期望为0,方差,方差FFyy2222利用回归模型预测时,解释变量的值最好不要离开样本范围太远。原因是:利用回归模型预测时,解释变量的值最

16、好不要离开样本范围太远。原因是:根据预测公式离样本平均值越远,预测误差越大。根据预测公式离样本平均值越远,预测误差越大。020000400006000080000100000120000020000 40000 60000 80000 100000140000M1M1FGDP21 1tT2221()1()FtxxtTxx0Ftxxx01ttyx22/2/2221()1()11()()FFFFFttxxxxytyytTxxTxxty01FFyxY1999的点估计值的点估计值:Y1999=10.77+0.005069 1863=20.21Y2000的点估计值的点估计值:Y2000=10.77+0.

17、005069 1983=20.82(file:li-2-1)2Y1999的置信区间的置信区间:20.2089 2.26 1.4417 16.9507,23.4671Y2000的置信区间的置信区间:20.8171 2.26 1.5297 17.3600,24.27422例题例题2.1 人均鲜蛋需求量y与人均可支配收入x关系 补充案例补充案例1:用回归模型预测木材剩余物用回归模型预测木材剩余物(file:b1c3file:b1c3)伊春林区位于黑龙江省东北部,有森林面积伊春林区位于黑龙江省东北部,有森林面积219万万公顷,木材蓄积量为公顷,木材蓄积量为2.3亿亿m3。森林覆盖率为。森林覆盖率为62

18、.5%,是我国主要的木材工业基地之一。,是我国主要的木材工业基地之一。1999年伊春林区木材采伐量为年伊春林区木材采伐量为532万万m3。按此速度。按此速度44年之后,年之后,1999年的蓄积量将被采伐一空。年的蓄积量将被采伐一空。为缓解森林资源危机,并解决部分职工就业问题,为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分除了做好木材的深加工外,还要充分利用木材剩利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。因余物生产林业产品,如纸浆、纸袋、纸板等。因此预测林区的年木材剩余物是安排木材剩余物加此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。工生产

19、的一个关键环节。1999年年16个林业局个林业局黑龙江省伊春林区 观测点近似服从线性关系。观测点近似服从线性关系。建立一元线性回归模型如下:建立一元线性回归模型如下:yt=0+1 xt+ut年剩余物年剩余物yt和年木材采伐量和年木材采伐量xt散点图散点图分析分析EViews输出结果。注意:输出结果。注意:S.D.和和s.e.的区别。的区别。s.e.和和SSR的关系。的关系。=-0.7629+0.4043 xt (-0.6)(12.1)R2=0.91,T=16上述模型的上述模型的经济解释经济解释是,对于是,对于伊春林区各林业局平均每采伐伊春林区各林业局平均每采伐1 m3木材,木材,将平均产生将平

20、均产生0.4 m3的剩余物。的剩余物。ty 0481216177.311.63.0YF2()FFSyy()FFS yy()FFS yy假设已知xF=20FFF0.05/2假设已知假设已知10.EViews操作操作 怎样建立怎样建立EViews新工作文件。新工作文件。file new workfile选择数据类型选择数据类型unstructured(undated)表示横截面数据;表示横截面数据;dated表示时间序列数据。启始期表示时间序列数据。启始期(Start date);终止期;终止期(End date)。怎样用怎样用EViews通过键盘输入,复制、粘贴功能输入数据。通过键盘输入,复制、

21、粘贴功能输入数据。object new object series注意注意:(:(1)变量命名时,字符不得超过)变量命名时,字符不得超过16个。个。(2)给变量命名时,避免使用下列名字:)给变量命名时,避免使用下列名字:ABS,ACOS,AR,ASIN,C,CON,CNORM,COEF,COS,D,DLOG,DNORM,ELSE,ENDIF,EXP,LOG,LOGIT,LPT1,LPT2,MA,NA,NRND,PDL,RESID,RND,SAR,SIN,SMA,SQR,THEN。画散点图:画散点图:quick graph scatter x y怎样用怎样用EViews预测预测 以补充案例以补充

22、案例1为例,给定为例,给定xt=20,求,求yF=?EViews预测步骤如下。预测步骤如下。(1)点击)点击Procs键选键选Change workfile range功能。在弹出的对话框功能。在弹出的对话框的的End data选择框处改为选择框处改为17。点击。点击OK键。键。(2)双击工作文件的)双击工作文件的Sample:1 17区域,在弹出的对话框的区域,在弹出的对话框的Sample range pairs选择框处把选择框处把16改为改为1 17。(3)双击工作文件窗口中的)双击工作文件窗口中的x序列,打开序列,打开x数据窗口。点击数据窗口。点击Edit+/-键,使键,使x数据窗口处于

23、可编辑状态。在数据窗口处于可编辑状态。在t=17的的x的观测值位置输的观测值位置输入入20。相当于给定。相当于给定x=20。(4)打开估计式)打开估计式eq01窗口,点击窗口,点击Forecast键。键。yf表示表示yt的预测值,的预测值,若在若在S.E.选择框处填入选择框处填入yfse则表示输出则表示输出yt的预测标准差,点击的预测标准差,点击OK键,工作文件窗口中已经出现一个键,工作文件窗口中已经出现一个yf序列。双击序列。双击yf序列,可序列,可以看到。以看到。y17=7.322668。OLS估计的操作步骤。估计的操作步骤。在已建立在已建立Eviews数据文件的基础上,进行数据文件的基础

24、上,进行OLS估计的操作步骤如估计的操作步骤如下:打开工作文件,从主菜单上点击下:打开工作文件,从主菜单上点击Quick键,选键,选Estimate Equation 功能。在出现的对话框中输入功能。在出现的对话框中输入y c x。点击。点击Ok键。键。11相关理论与相关系数相关理论与相关系数相关(相关(correlation):指两个或两个以上变量间相互关系的:指两个或两个以上变量间相互关系的程度或强度。程度或强度。分类:按强度分分类:按强度分 完全相关完全相关:变量间存在函数关系。:变量间存在函数关系。高度相关高度相关(强相关):变量间近似存在函数关系。(强相关):变量间近似存在函数关系。

25、弱相关弱相关:变量间有关系但不明显。:变量间有关系但不明显。零相关零相关:变量间不存在任何关系。:变量间不存在任何关系。按变量个数分按变量个数分简单相关:指两个变量间相关。简单相关:指两个变量间相关。按形式分:线性相关按形式分:线性相关,非线性相关非线性相关 按符号分:正相关按符号分:正相关,负相关负相关,零相关零相关复相关(多重相关和偏相关):复相关(多重相关和偏相关):指指3个或个或3个以上变量间的相关。个以上变量间的相关。11相关系数相关系数 非线性相关非线性相关 负相关负相关 零相关零相关 完全相关完全相关 高度相关、线性相关、正相关高度相关、线性相关、正相关 弱相关弱相关 11.2

26、简单简单线性线性相关的度量相关的度量 简单简单线性线性相关系数,简称相关系数(相关系数,简称相关系数(correlation coefficient)。度量两个变量间的度量两个变量间的线性线性相关强度,用相关强度,用 表示。表示。的随机变量表达式是的随机变量表达式是 11.3 相关系数的取值范围相关系数的取值范围 图图1 正相关正相关 图图2 负相关负相关 ttyakx图图3 r=0.92 图图4 r=0.99 散点图与相关系数散点图与相关系数 值的对应关系值的对应关系11.4 线性相关系数的局限性线性相关系数的局限性(1)只适用于考察变量间的线性相关关系。变量无关只适用于考察变量间的线性相关

27、关系。变量无关变量独立变量独立(线性无关线性无关)。(2)相关系数的计算是一个数学过程相关系数的计算是一个数学过程,但不能揭示变量间关系的实质。但不能揭示变量间关系的实质。(3)一般说二变量相关时,可能属于如下一种关系。一般说二变量相关时,可能属于如下一种关系。单向因果关系单向因果关系。如施肥量与农作物产量;对金属的加热时间与温度值。如施肥量与农作物产量;对金属的加热时间与温度值。双向因果关系双向因果关系。如工业生产与农业生产;商品供给量与商品价格。如工业生产与农业生产;商品供给量与商品价格。另有隐含因素影响二变量变化另有隐含因素影响二变量变化。虚假相关虚假相关。(1997-2001,file

28、:5correlation1)11.5 简单相关系数与拟和优度简单相关系数与拟和优度222212222222222()()()()()()()()()()()()()tttttttttttttyyxxRyyyyxxyyxxxxyyxxyyrxxyy拟和优度拟和优度R2简单相关系数的平方简单相关系数的平方r2 11.6 简单相关系数的检验简单相关系数的检验2相关系数的相关系数的EViews操作:建立操作:建立new objectgroup,输入多个,输入多个变量名称,建立变量名称,建立group,在在group窗口中选窗口中选View/Correlation2由于观测值是可以重复抽样的,因此由观测值计算得到的参数估计量,各统由于观测值是可以重复抽样的,因此由观测值计算得到的参数估计量,各统计量,相关系数,甚至残差,残差的方差计量,相关系数,甚至残差,残差的方差(误差均方误差均方),拟和值,预测值都是随,拟和值,预测值都是随机变量。每一次抽样得到该随机变量的一个值。机变量。每一次抽样得到该随机变量的一个值。恩斯特恩斯特恩格爾恩格爾(Ernst Engel,1821年年3月月21日日-1896年年12月月8日日),19世紀德世紀德國著名統計學家和經濟學家,以恩格國著名統計學家和經濟學家,以恩格爾曲線和恩格爾定律聞名於世。爾曲線和恩格爾定律聞名於世。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!