中级经济师考试 经济基础知识 个人学习笔记精编第四部分统计

上传人:沈*** 文档编号:41484559 上传时间:2021-11-20 格式:DOC 页数:5 大小:416.50KB
收藏 版权申诉 举报 下载
中级经济师考试 经济基础知识 个人学习笔记精编第四部分统计_第1页
第1页 / 共5页
中级经济师考试 经济基础知识 个人学习笔记精编第四部分统计_第2页
第2页 / 共5页
中级经济师考试 经济基础知识 个人学习笔记精编第四部分统计_第3页
第3页 / 共5页
资源描述:

《中级经济师考试 经济基础知识 个人学习笔记精编第四部分统计》由会员分享,可在线阅读,更多相关《中级经济师考试 经济基础知识 个人学习笔记精编第四部分统计(5页珍藏版)》请在装配图网上搜索。

1、第四部分 统计第二十二章 统计与统计数据考点一:统计学的两大分支及各自的内容统计学的两大分支(描述统计和推断统计)类型主要考点描述统计研究数据收集、整理和描述的统计方法。其内容包括:1.如何取得所需要的数据;2.如何用图表或数学方法对数据进行整理和展示;3.如何描述数据的一般特征。推断统计研究如何利用样本数据推断总体特征的统计方法。其内容包括:1.参数估计:利用样本信息推断总体特征;2.假设检验:利用样本信息判断对总体假设是否成立。考点二:变量及数据1.变量:变量是研究对象的属性或特征,它是相对于常数而言的。常数只有一个固定取值,变量可以有两个或更多个可能的取值。分类定量变量(数量变量)变量的

2、取值是数量。如企业销售额、注册员工数。定性变量分类变量变量的取值是类别。如企业所属行业、员工性别。顺序变量变量的取值是类别且有顺序。如员工受教育水平。2.数据:数据是对变量进行测量、观测的结果。数据可以是数值、文字或者图像等形式。定量数据(数值型数据)是对定量变量的观测结果,其取值表现为具体的数值。如企业的销售额是1000万元。分类数据分类变量的观测结果,表现为类别,一般用文字来表述,也可用数字描述。如,用1表示男性,2表示女性。顺序数据顺序变量的观测结果,表现为类别,一般用文字描述,也可用数字描述。如用1表示硕士及以上,2表示本科,3表示大专及以下。考点三:数据的来源分类类别内容按收集方法观

3、测数据通过直接调查或测量而收集的数据。观测数据是在没有对事物施加任何人为控制因素的条件下得到的。几乎所有与社会经济现象有关的统计数据都是观测数据,如GDP、CPI、房价等。实验数据通过在实验中控制实验对象以及其所处的实验环境收集到的数据。如,一种新产品使用寿命的数据,一种新药疗效的数据。自然科学领域的数据大多都是实验数据。按来源一手数据来源于直接的调查和科学实验的数据,对使用者来说这是数据的直接来源。其来源主要有:调查或观察;实验。二手数据来源于别人的调查或实验的数据。对使用者来说这是数据的间接来源。考点四:统计调查1.统计调查的种类种类具体内容按调查对象的范围不同全面调查全面统计报表和普查。

4、非全面调查非全面统计报表、抽样调查、重点调查和典型调查。按调查登记的时间是否连续连续调查如工厂的产品生产、原材料的投入、能源的消耗、人口的出生、死亡等。不连续调查如生产设备拥有量、耕地面积等。2.统计调查方式在我国常用的统计调查方式有统计报表、普查、抽样调查、重点调查和典型调查。调查方式含义主要考点普查为某一特定目的而专门组织的一次性全面调查,主要用于收集处于某一时点状态上的社会经济现象的基本全貌。1.普查通常是一次性的或者周期性的。2.一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。3.数据一般比较准确。4.使用范围比较窄。抽样调查从调查对象的总体中随机抽取

5、一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的一种非全面调查。1.经济性(最显著的优点)2.时效性强3.适应面广4.准确性高重点调查从调查对象的总体中选择少数重点单位进行调查。所选择的重点单位就调查的标志值来说在总体中占绝大比重。(1)为了及时了解全国城市零售物价的变动趋势,就可以对全国的35个大中型城市的零售物价的变化进行调查就是重点调查。(2)要及时了解全国工业企业的增加值和资产总额情况,只需对全国大中型工业企业进行重点调查即可。(3)国家统计局的全国5000家工业企业联网直报制度属于重点调查。典型调查选择若干具有典型意义的或有代表性的单位进行的调查。作用:弥补全面调查的不

6、足;在一定条件下可以验证全面调查数据的真实性。第二十三章 描述统计考点一:集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。测度值计算备注均值数据组中所有数值的总和除以该组数值的个数(1)它是集中趋势中最主要的测度值。(2)均值主要适用于数值型数据,但不适用于分类数据和顺序数据。(3)均值易受极端值的影响。(4)能够充分利用数据的全部信息。中位数一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值。(1)适用于顺序数据,也适用于数值型数据,但不适用于分类数据。(2)不受极端值的影响,抗干扰性强。(3)没有充分利用数据的全部信息,

7、稳定性差于均值,但优于众数。众数一组数据中出现次数最多的变量值。(1)适于描述分类数据和顺序数据。(2)不受极端值的影响。(3)没有充分利用数据的全部信息,缺乏稳定性,而且可能不唯一。(有些情况下可能出现双众数、多众数或者没有众数,难以描述数据的集中趋势)指标适用数据类型是否受极端值影响众数分类数据、顺序数据不受中位数顺序数据、数值型数据不受均值数值型数据受考点二:离散程度的测度值方差数据组中各数值与其均值离差平方的平均数。方差越小,说明数据值与均值的平均距离越小,均值的代表性越好。标准差方差的平方根。不仅能度量数值与均值的平均距离,还与原始数值具有相同的计量单位。标准差越小,说明数据值与均值

8、的平均距离越小,均值的代表性越好。离散系数(变异系数,标准差系数)标准差与均值的比值。离散系数消除了测度单位和观测值水平不同的影响,因而可以直接用来比较变量的离散程度。考点三:分布形态的测度分布形态的测度指标包括偏态系数和标准分数。一、偏态系数项目主要内容偏态系数测度数据分布偏度的统计量,取决于离差三次方的平均数与标准差三次方的比值。偏态系数的取值等于0数据的分布是对称的。偏态系数0分布为右偏。1.取值在0和0.5之间,轻度右偏2.取值在0.5和1之间,中度右偏3.取值大于1,严重右偏偏态系数0分布为左偏。1.取值在0和-0.5之间,轻度左偏2.取值在-0.5和-1之间,中度左偏3.取值小于-

9、1,严重左偏偏态系数的绝对值越大数据分布的偏斜程度越大。二、标准分数(也称为“Z”分数)项目主要内容适用在统计上,均值和标准差不同时,来自不同分布的变量值不可比,但是每个数值在变量分布中相对于均值的相对位置是可比的,因此可以通过计算标准分数来比较不同变量的取值。标准分数给出了数值距离均值的相对位置。计算(原始分数Xi-平均分数X)标准差s实际应用当数据服从对称的钟形分布时,可以运用经验法则来判断与均值的距离在特定倍数标准差之内的数据项所占比例。约有68%的数据与平均数的距离在1个标准差之内,标准分数在【-1,1】范围内;约有95%的数据与平均数的距离在2个标准差之内;标准分数在【-2,2】范围

10、内;约有99%的数据与平均数的距离在3个标准差之内;标准分数在【-3,3】范围内。考点四:变量间的相关分析一、相关关系的类别分类标准类别内含相关的程度完全相关一个变量的取值变化完全由另一个变量的取值变化所确定。称这两个变量完全相关。不完全相关大部分相关现象均属于不完全相关。不相关两个变量的取值变化彼此互不影响。相关的方向正相关一个变量的取值由小变大,另一个变量的取值也相应的由小变大。(两个变量同方向变化)。负相关一个变量的取值由小变大,另一个变量的取值由大变小(两个变量反方向变化)。相关的形式线性相关pearson相关系数只适用线性相关关系。非线性相关两个相关变量之间的关系近似于某种曲线方程的

11、关系。【注】两变量之间的关系可以用散点图来展示。二、相关系数的取值相关系数是度量两个变量之间相关关系的统计量。最常用的相关系数是pearson(皮尔逊)相关系数。相关系数的取值范围在【-1,1】之间。r的取值两变量之间的关系0r+1正线性相关-1r0负线性相关r=1完全正线性相关r=-1完全负线性相关r=0不存在线性相关关系,但并不能说明两变量之间没有任何关系,它们之间可能存在非线性相关关系。|r|的取值两变量之间的相关程度|r|0.8高度相关0.5|r|0.8中度相关0.3|r|0.5低度相关|r|0.3相关程度极弱,可视为无线性相关关系第二十四章 抽样调查考点一:抽样调查的基本概念【例】在

12、研究某城市居民的家庭消费支出时,在全部50万户家庭中随机抽取3000户进行入户调查,这项抽样调查中的样本单位是指该城市中( )。A.抽取出来的3000户家庭 B.50万户家庭 C.每一户家庭 D.抽取出来的每一户家庭【答案】D概念含义本题中总体调查对象的全体50万户家庭总体单元组成总体的各个个体每一户家庭样本总体的一部分,由从总体中按一定原则或程序抽出的部分个体所组成。样本也是一个集合。抽取出来的3000户家庭样本单位每个被抽中进入样本的单位称为入样单位。抽取出来的每一户家庭样本量样本中包含的入样单位的个数称为样本量。3000户抽样框供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。常见的

13、抽样框有名录框,如企业名录、电话簿、人员名册。全部50万户家庭消费信息的载体总体参数即总体指标值,它是未知的常数,是根据总体中所有单位的数值计算的,是通过调查想要了解的,不受样本的抽选结果影响。常用的总体参数有总体总量、总体均值、总体比例、总体方差。50万户家庭的平均消费支出样本统计量(估计量)是根据样本中各单位的数值计算的,是对总体参数的估计,也称估计量。它是一个随机变量,取决于样本设计和正好被选入样本的单元特定组合。常用的样本统计量有样本均值、样本比例、样本方差。抽取出来的3000户家庭的平均消费支出考点二:概率抽样与非概率抽样抽样方法特点具体方式概率抽样1.按一定概率以随机原则抽取样本。

14、2.总体中每个单元被抽中的概率是已知的或者是可以计算出来。3.当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率。若每个单位被抽中的概率相等,则称为等概率抽样;否则称为非等概率抽样。1.简单随机抽样2.分层抽样3.系统抽样4.整群抽样5.多阶段抽样非概率抽样抽取样本时并不是依据随机原则。调查者根据自己的方便或主观判断抽取样本。1.判断抽样2.方便抽样3.自愿样本4.配额抽样考点三:抽样调查的一般步骤1.确定调查问题2.调查方案设计3.实施调查过程4.数据处理分析5.撰写调查报告考点四:抽样调查中的误差误差形成原因抽样误差由抽样的随机性造成的,用样本统计量估计总体参数时出现的误差。

15、非抽样误差除抽样误差外,由其他原因引起的样本统计量与总体真值之间的差异。(1)抽样框误差:样本框不完善造成的(2)无回答误差:调查人员没能够从被调查者那里得到所需要的数据。无回答分为:由于随机因素造成的。如被调查者恰巧不在家。由于非随机因素造成的:如被调查者不愿告诉实情而拒绝回答。(3)计量误差:由于调查所获得的数据与其真值之间不一致造成的误差。这种误差可能是由调查人员、问卷设计、受访者等原因造成的。考点五:几种基本概率抽样方法的判定方法关注的知识点简单随机抽样1.最基本的随机抽样方法,每个单位的入样概率相同。【例】某校高三年级学生共l000人参加考试,将1000份试卷编好号码后,从中随机抽取

16、30份计算平均成绩,此种抽样方法为(A)。A.简单随机抽样 B.系统抽样 C.分层抽样 D.整群抽样2.不放回简单随机抽样每个单位最多只能被抽中一次,比放回抽样有更低的抽样误差。3.适用条件:(1)抽样框中没有更多可以利用的辅助信息(2)调查对象分布的范围不广阔(3)个体之间的差异不是很大。分层抽样1.理解概念:先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本。【例】在调查某部门平均工资时,先将该部门员工分为经理和普通职员两类,再采用随机原则分别在经理和普通职员中抽取样本,这种抽样方法属于(C)。A.简单随机抽样 B.整群抽样 C.分层抽样 D.等距抽样2.适用条件:抽样

17、框中有足够的辅助信息,能够将总体单位按某种标准划分到各层之中,实现在同一层内,各单位之间的差异尽可能小,不同层之间各单位的差异尽可能大。系统抽样1.理解概念:将总体中的所有单元按一定顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。【例】调查一个居委会4000户家庭人均收入,编号1-4000,要抽取40户,在1-100号中随机确定15号,抽取的样本为15;15+100;15+200;15+300;15+3900,这种抽样方法属于(系统抽样)。2.优点:对抽样框的要求比较简单,它只要求总体单位按一定顺序排列,系统抽样的估计效果与总体排列顺序有关。整群抽样1.理解概

18、念:将总体中所有的基本单位按照一定规则划分为互不重叠的群,抽样时直接抽取群,对抽中的群调查其全部的基本单位,对没有抽中的群则不进行调查。【例题:单选题】在调查某城市小学教师亚健康状况时,从该城市的200所小学中随机抽取40所,每个被抽取小学中的所有教师都参与调查,这样抽样方法属于(B)。A.简单随机抽样 B.整群抽样 C.分层抽样 D.等距抽样2.适用:如果群内各单位之间存在较大差异,群与群的结果相似,整群抽样会降低估计误差。多阶段抽样经过二个及二个以上抽样阶段,在大范围的抽样调查中,采用多阶段抽样是必要的。【例】某城市为调查居民对市政建设的满意度,先从该市所有居委会中随机抽取20个居委会,再

19、从每个被抽中的居委会中随机抽取30个居民家庭进行入户调查,该项调查采用的抽样方式是( )。A.分层抽样 B.整群抽样 C.系统抽样 D.多阶段抽样【答案】D【解析】通过本题掌握各种抽样方法的特点。通过题干可知,第一阶段采用整群抽样,第二阶段采用了简单随机抽样。所以本题所采用的抽样方法是多阶段抽样。考点六:估计量的性质关于估计量的性质如下表所示:性质内含一致性随着样本量的增大,估计量的值如果稳定于总体参数的真值。无偏性对于不放回简单随机抽样,所有可能的样本均值取值的平均值总等于总体均值。有效性在同一抽样方案下,对某一总体参数,如果有两个无偏估计量1、2,如果1的可能样本取值较2更密集在总体参数真

20、值附近,则认为1比2更有效考点七:抽样误差的估计1.抽样误差无法避免,但是可计算的。在不放回简单随机抽样方法中,将样本均值作为总体均值的估计量。则估计量的方差为:样本估计量的方差=2.抽样误差的影响因素(1)抽样误差与总体分布有关,总体单位值之间差异越大,即总体方差越大,抽样误差越大。(2)抽样误差与样本量n有关,其他条件相同,样本量越大,抽样误差越小。(3)抽样误差与抽样方式和估计量的选择也有关。例如分层抽样的估计量方差一般小于简单随机抽样。(4)利用有效辅助信息的估计量也可以有效的减小抽样误差。考点八:样本量的影响因素影响因素如何影响调查的精度要求的调查精度越高,所需要的样本量就越大。总体

21、的离散程度在其他条件相同情况下,总体的离散程度越大,所需要的样本量也越大。总体的规模对于大规模的总体,总体规模对样本量的需求则几乎没有影响,但对于小规模的总体,总体规模越大,为保证相同估计精度,样本量也要随之增大(但不是同比例的)。无回答情况无回答减少了有效样本量,在无回答率较高的调查项目中,样本量要大一些,以减少无回答带来的影响。经费的制约样本量是调查经费与调查精度之间的某种折中和平衡。其他调查的限定时间,实施调查的人力资源等。第二十五章 回归分析考点一:回归分析与相关分析的关系回归分析就是根据相关关系的具体形态,选择一个合适的数学模型,来近似的表达变量间的平均变化关系。回归分析与相关分析的

22、关系:联系(1)它们具有共同的研究对象。(2)在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有高度相关时,进行回归分析寻求其相关的具体形式才是有意义的。区别相关分析与回归分析在研究目的和方法上具有明显的区别。(1)相关分析研究变量之间相关的方向和相关的程度。(2)回归分析是研究变量之间相关关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定相关的数学方程式,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提供了一个重要方法。考点二:一元线性回归模型一、,因变量Y是自变量

23、X的线性函数(0+1X)加上误差项;1.0+1X反映了由于自变量X的变化而引起的因变量y的线性变化。2.误差项是个随机变量,表示除线性关系之外的随机因素对Y的影响,它是不能由X和Y的线性关系所解释的Y的变异性。二、一元线性回归方程描述因变量Y的期望值E(Y)如何依赖自变量X的方程称为回归方程。一元线性回归方程的形式:一元线性回归方程的图示是一条直线,0是回归直线的截距,1是回归直线的斜率,表示X每变动一个单位时,E(Y)的变动量。回归分析的一个重要应用就是预测,即利用估计的回归模型预估因变量数值。考点三:最小二乘法在现实中,模型的参数都是未知的,需要利用样本数据去估计,采用的估计方法是最小二乘

24、法。最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计的方法。考点四:决定系数决定系数,也称为R2,可以测度回归直线对样本数据的拟合程度。决定系数的取值在0到1之间,大体说明了回归模型所能解释的因变量变化占因变量总变化的比例。决定系数越接近1,回归直线的拟合效果越好。R2=1,说明回归直线可以解释因变量的所有变化。R2=0,说明回归直线无法解释因变量的变化,因变量的变化与自变量无关。第二十六章 时间序列考点一:时间序列的分类时间序列含义:时间序列也称动态数列,是将某一统计指标在各个不同时间上的数值按时间先后顺序编制形成的序列。绝对数时间序列时期序列反映现象在一定时期内发展的结果

25、(产量、耗用量、销售额、财政收入等)时点序列反映现象在一定时点上的瞬间水平(期末职工人数、库存)相对数时间序列统计指标值是相对数平均数时间序列统计指标值是平均数考点二:增长量与平均增长量项目计算关系增长量报告期水平基期水平逐期增长量报告期水平报告期前一期水平同一时间序列中,累计增长量等于相应时期逐期增长量之和。累计增长量报告期水平最初水平平均增长量逐期增长量的合计/逐期增长量个数=累计增长量/(最末时间-最初时间)时间序列中逐期增长量的序时平均数。考点三:平均发展水平平均发展水平也称序时平均数或动态平均数,是对时间序列中各时期发展水平计算的平均数,它可以概括性描述现象在一段时期内所达到的一般水

26、平。序列具体类别平均数的计算时期序列简单算术平均数时点序列连续时点(逐日登记)1.简单算术平均数(逐日登记逐日排列)2.加权算术平均数(指标值变动才登记)间隔时间相等的间断时点两次平均:均为简单算术平均间隔时间不相等的间断时点两次平均:第一次简单算术平均;第二次加权算术平均考点四:发展速度与增长速度项目计算关系发展速度与增长速度发展速度=1+增长速度定基发展速度1.定基发展速度等于相应时期内各环比发展速度的连乘积【定基积】2.两个相邻时期定基发展速度的比率等于相应时期的环比发展速度【环比比】环比发展速度平均发展速度1.平均发展速度是一定时期内各期环比发展速度的序时平均数。2.目前计算平均发展速

27、度通常采用几何平均法。3.公式中的n为环比发展速度的个数。应该用时间序列中的最末时间减去最初时间考点五:速度的分析应注意的问题(1)当时间序列中的指标值出现0或负数时,不宜计算速度。(2)速度指标的数值与基数的大小有密切关系。在环比增长速度时间序列中,各期的基数不同,因此,运用这一指标反映现象增长的快慢时,往往要结合“增长1%的绝对值”分析,这一指标反映同样的增长速度,在不同时间条件下所包含的绝对水平。增长1%的绝对值=报告期前一期发展水平*1%考点六:平滑预测法平滑预测法平滑法的目的是“消除”时间序列的不规则成分所引起的随机波动。平滑法适用于平稳时间序列的预测,即没有明显的趋势、循环和季节波动的时间序列。1.移动平均法最近K期数据值的平均数作为下一期的预测值。2.指数平滑法预测值Ft+1平滑系数第t期实际观察值()第t期预测值为平滑系数,取值范围:0。指数平滑法的特点是,观测值离预测时期越久远,其权重也变得越小,呈现出指数下降的特点。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!