回归分析基本方法:最小二乘法.ppt

上传人:w****2 文档编号:15628357 上传时间:2020-08-26 格式:PPT 页数:45 大小:857.50KB
收藏 版权申诉 举报 下载
回归分析基本方法:最小二乘法.ppt_第1页
第1页 / 共45页
回归分析基本方法:最小二乘法.ppt_第2页
第2页 / 共45页
回归分析基本方法:最小二乘法.ppt_第3页
第3页 / 共45页
资源描述:

《回归分析基本方法:最小二乘法.ppt》由会员分享,可在线阅读,更多相关《回归分析基本方法:最小二乘法.ppt(45页珍藏版)》请在装配图网上搜索。

1、假设检验的基本思想 基于小概率原理的反证法,二、假设检验的步骤,1、提出假设,包括原假设和备择假设 2、构造相应的检验统计量,确定其分布形式;根据样本数据计算统计量的值; 3、确定显著性水平和临界值 ; 4、作出结论。(根据所计算的统计量的值与临界值比较确定是否拒绝原假设),原假设 The Null Hypothesis,1. 陈述需要检验的假设 例如: H0: = 45 2. 原假设用 H0 表示 3. 总是包含等号“=” (比如=, , ) 4. 检验以“假定原假设为真”开始,平均每天上网玩游戏时间不是5小时。,如何设定假设检验?,H0: = 5 H1: 5,例 题 1,据报导,美国全职教

2、授年薪的数学期望值为68000美元,标准差为5000美元。一个由36名大学全职教授组成的样本表明,平均薪水为72000美元,检验报导的可信性。(显著性水平为0.02),H0,临界值,临界值, /2, /2,样本统计量,拒绝域,拒绝域,非拒绝域,接受域与拒绝域,抽样分布,1 - ,置信度,(1)H0:=68000 H1;68000 (2)检验统计量服从Z分布 检验统计量:,(3)=0.02,查正态分布表得:Z=2.04, 接受域为(2.04,2.04) 结论:拒绝假定。,质检员认为在整个工作流程中平均装盒量符合标准:没有超过368克。随机抽取25盒为样本,均值X = 372.5克,标准差s =

3、15 克。试在 = 0.05的条件下进行检验。 给出你的结论。,368 克.,例 题 2,t,0,拒绝H,0,t,0,拒绝H,0,接受域与拒绝域,H0:0 H1: 0,H0:0 H1: 0,必须显著低于才会拒绝,小的数值与H0不矛盾.,因此不会拒绝 H0,左侧检验,右侧检验,(1)H0:368 H1;368 (2)检验统计量服从t分布 检验统计量:,(3)=0.05,查t分布表得:t=2.064, 接受域为( ,2.064) 结论:接受原假定。,假设检验中的两类错误检验决策错误,第一类错误 弃真错误, 后果往往较为严重 出现第一类错误的概率为 , 等于显著性水平 第二类错误 存伪错误, 出现第

4、二类错误的概率为 ,检验决策结果,实际情况,实际情况,H0为真,H0为假,决策,H,0,为真,H,0,为假,不拒绝,正确,错误,不拒绝,H,0,置信水平 1-,第二类 错误 ,拒绝,错误,正确,拒绝,H,0,第一类 错误 ,检验能 力1 - ,第三章 回归分析的基本方法:最小二乘法,本章重点,经济学理论模型 最小二乘法 实例应用,2020/8/26,14,中山大学南方学院经济系,本章分析思路,建立经济学的理论模型 运用最小二乘法进行参数估计 实例运用,2020/8/26,中山大学南方学院经济系,15,回归分析,研究步骤: 首先,要确定所研究的问题(因变量),并根据经济理论,找出与该问题相关的、

5、有影响力的经济因素(自变量),并建立因变量与自变量的关系式(经济模型)。,2020/8/26,中山大学南方学院经济系,16,其次,按照科学的方法收集相应变量的实际数据。 最后,对所研究的问题作出结论。,2020/8/26,中山大学南方学院经济系,17,第一节 理论模型的建立,简单回归模型 是指两个变量的线性模型,其中一个是因变量,一个是自变量。也称为“二元线性方程”。 用数学公式表示就是:,2020/8/26,中山大学南方学院经济系,18,建立x解释y的模型时,面临三个问题: (1)既然两个变量之间没有一个确切的关系,应该如何考虑其他影响Y的因素? (2)Y和X的函数关系是怎样的? (3)怎样

6、知道是否准确测定出了y和x之间的关系(因果性效应)?,2020/8/26,中山大学南方学院经济系,19,20,计量经济学分析的应用: y和x:某一个总体的两个变量 感兴趣:用x来解释y,或者说是研究y如何随x而变化 如: (Y)大豆的产出与(X)化肥的用量; (Y)工资收入与(X)受教育的年数; (Y)社区的犯罪率与(X)警察的数量。,在自己建立经济模型的过程中,如何取舍解释变量,一定要问个为什么。计量经济学家首先就是要摆事实、讲道理,这是作为计量经济学家必备的素质。 1、消费与收入之间的关系; 2、产品的销量与产品价格的关系; 3、GDP与投资、经济运行的关系。,2020/8/26,中山大学

7、南方学院经济系,21,22,一元回归的术语,自变量 (independent variable) 解释变量 (explanatory variable) 控制变量 (control variable) 预测变量 (predictor variable) 回归元 (regressor),因变量 (dependent variable) 被解释变量 (explained variable) 响应变量 (response variable) 被预测变量 (predicted variable) 回归子 (regressand),23,一元回归模型的定义,变量:随机误差项或随机扰动项 表示:除X之外其

8、他影响Y的因素,24,随机误差项的产生,一、理论的不确定性 (现象的内在随机性) 二、模型的简化 核心变量与非核心变量 忽略影响较小的因素 三、数据测量、收集的误差 四、模型函数形式设定错误,25,模型表述了Y和X之间的线性关系。 简单线性回归模型(Simple linear regression model) 又称做两变量或双变量线性回归模型 (The two variable regression model) :y和x关系式中的斜率参数(slope parameter) :截距参数(intercept parameter),26,例1 大豆产出和施肥量,农业研究者对(其他因素不变时)化肥

9、用量如何影响大豆产出量感兴趣。 随机误差项包括了: 土壤质量、降雨量等因素 影响的效果由给出 系数度量了在其他条件不变的情况下,施肥量对产出量的影响: yield= fertilizer,假使大豆的产出由以下模型所决定:,27,例2 简单的工资方程,表示一个人的工资水平与他的受教育程度及其他非观测因素的关系:,Wage:工资水平 Educ:受教育的年数 :(在其他条件不变的情况下)每增加一年教育所获得的工资增长。 其他非观测因素 线性性显示,不管X的初始值为多少,它的任何一单位变化对Y的影响都是相同的。,28,计量经济分析中的因果性效应与其他条件不变,其他条件不变:包含在随机误差项中的其他所有

10、相关因素均保持固定不变。 因果性效应:其他条件不变情况下,一个变量对另一个变量产生的影响。,第二节 实际数据的收集,当我们建立了经济理论上的关系式后,接下来就要从实际中收集数据。 Y和X是两个变量,我们要收集有关Y和X的数据,就要对N个研究对象进行观察,从而收集到N组数据,这每一组数据叫做一个“样本”,每个样本有一个对应的Y与X的值。,2020/8/26,中山大学南方学院经济系,29,于是,我们的回归模型就可以表示为: 我们用所得到的数据,采用回归分析的方法来对模型中的参数进行估计。这样我们就可以得到参数的估计值。被普遍采用的方法是“最小二乘法”。,2020/8/26,中山大学南方学院经济系,

11、30,第三节 最小二乘法,普通最小二乘估计量 (ordinary least squares) OLS估计量,2020/8/26,中山大学南方学院经济系,31,32,(1)OLS残差的平方和最小。 数学表述为:,OLS估计量的代数性质,OLS估计值是以使残差和为零的参数估计值来选择的。,即OLS的一阶条件,我们试图找到这样一条直线,它到每一实际落点的距离的总和为最小。 由于实际落点到直线的距离有正也有负值,即误差有正值和负值,我们用误差项的平方值来测定其绝对距离。 所以我们可以通过全微分来求极值。,2020/8/26,中山大学南方学院经济系,33,我们得出: 设一阶导数为零,可得:,2020/

12、8/26,中山大学南方学院经济系,34,2020/8/26,中山大学南方学院经济系,35,然后我们再求二阶偏导: 由于二阶偏导大于零,所以我们确信这种所求的结果是最小值。这就是最小二乘法。,2020/8/26,中山大学南方学院经济系,36,一元线性回归模型的假设条件,2020/8/26,中山大学南方学院经济系,37,1. X与Y之间的关系是线性的。 2. X是非随机的变量,它的值是确定的。 3. 误差项的期望为0:E(i ) = 0。 4. 对于所有观测值,误差项具有相同的方差,即E(2) = 2同方差假定 5. 随机变量i 之间统计上是独立的,因此对所有的ij,E(i j) = 0无序列相关

13、假定 6. 误差项服从正态分布。 假设15:古典线性回归模型的定义,第四节 最小二乘法实用实例,计量经济的回归分析主要是根据经济理论的数学模型和实际的经济数据来计算出符合实际的、可应用经济分析的参数方程。 例如:我们估算某个地区的消费函数。根据经济理论,人们的消费额取决于他们的收入,也就是说消费与收入有线性关系,消费是因变量,收入是自变量。收入越多消费也越多,收入越少消费也越少。,2020/8/26,中山大学南方学院经济系,38,用数学模型表示如下: 这里,C表示因变量消费额,Y表示可支配收入。按照经济理论,参数系数应该大于零,或者说消费额与可支配收入的正相关的关系。,2020/8/26,中山

14、大学南方学院经济系,39,我们把收集到的数据做成一个散点图。并用回归方法估计出来的回归结果如下(表3-2): C=131.8368+0.8663*Y 这个分析的结果告诉我们,当收入等于零时,此人应该靠借大约132元来度日;人均的消费是收入的86.6,也就是说,平均每挣一百元,应该花掉八十六元六角三分钱。,2020/8/26,中山大学南方学院经济系,40,这样,我们先从理论上的经济模型入手,再有采集的实际经济数据,然后用计量经济学的回归分析方法估计出适合于实际数据的数学模型。当然,我们还要对这个估计出来的数学模型进行统计测试,检验其估计参数的合理性和有效性。 当其估计参数被测试为合理并且有效时,

15、我们就可以说我们的经济理论被实践证明是正确的。这样,我们也就可以用这个模型来进行经济预测。,2020/8/26,中山大学南方学院经济系,41,以上的例题,我们用的是一个横截面的数据来进行回归分析的,同时我们也可以用时间序列数据来进行分析,分析的方法和步骤也是一样的。 如我们分析不同年份的消费与可支配收入的关系。,2020/8/26,中山大学南方学院经济系,42,第五节 最小二乘法,在实际经济研究过程中,我们所面对的理论模型往往有几个或者很多自变量。那么,简单的模型就不够用了。下面我们来简单讨论一下多变量的通用模型。 当数据中有一个因变量和K个自变量时,那么我们的回归分析模型就应该是:,2020/8/26,中山大学南方学院经济系,43,这里,i=1,2,n.是估计参数,也就是模型的系数。E是模型的误差项。如果我们用矩阵的方式来表示就是: YXe 如果我们用实际数据来估计一个线性模型YXe,是这个模型中的真实的参数值。,2020/8/26,中山大学南方学院经济系,44,最佳估计值,当估计值满足以下三个条件的时候,我们求出的估计值是最佳的估计值。 (1)“线性的”是指YXe这个线性模型; (2)“无偏的”是指E()=。 (3)“最好的”是指估计参数的方差会是最小的。 只有当这些条件都满足了,我们的估计参数才是最优的。,2020/8/26,中山大学南方学院经济系,45,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!