统计学名词解释汇总

上传人:回**** 文档编号:202896886 上传时间:2023-04-23 格式:DOC 页数:17 大小:31.50KB
收藏 版权申诉 举报 下载
统计学名词解释汇总_第1页
第1页 / 共17页
统计学名词解释汇总_第2页
第2页 / 共17页
统计学名词解释汇总_第3页
第3页 / 共17页
资源描述:

《统计学名词解释汇总》由会员分享,可在线阅读,更多相关《统计学名词解释汇总(17页珍藏版)》请在装配图网上搜索。

1、1什么是记录学?记录措施可分为哪两大类?记录学是收集、解决、分析、解释数据并从数据中得出结论的科学。措施有描述记录和推断记录两类记录数据可分为哪几种类型?不同类型数据各有什么特点?按采用计量尺度,分类、顺序、数值型数据;按记录数据收集措施,观测、实验数据;按被描述对象与时间关系,截面、时间序列数据记录数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的成果,数据体现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。(定量数据)数值型数据:按数字尺度测量的观测值,其成果体现为具

2、体的数值。记录数据;按记录数据都收集措施分;观测数据:是通过调查或观测而收集到的数据,此类数据是在没有对事物人为控制的条件下得到的。实验数据:在实验中控制实验对象而收集到的数据。记录数据;按被描述的现象与实践的关系分;截面数据:在相似或相似的时间点收集到的数据,也叫静态数据。时间序列数据:准时间顺序收集到的,用于描述现象随时间变化的状况,也叫动态数据。举例阐明总体、样本、参数、记录量、变量这几种概念:对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和原则差尚有合格率等描述特性的数值就是参数,这一百个灯泡的寿命的平均值

3、和原则差尚有合格率等描述特性的数值就是记录量,变量就是阐明现象某种特性的概念,例如说灯泡的寿命。4什么是有限总体和无限总体?举例阐明有限总体指总体的范畴可以明确拟定,并且元素的数目是有限可数的,如若干个公司构成的总体,一批待检查的灯泡。无限总体指总体涉及的元素是无限不可数的,如科学实验中每个实验数据可看做是一种总体的一种元素,而实验可无限进行下去,因此由实验数据构成的总体是无限总体5变量可分为哪几类?变量可以分为分类变量,顺序变量,数值型变量。变量也可以分为随机变量和非随机变量。经验变量和理论变量。6举例阐明离散型变量和持续型变量离散型变量,只能取有限个值,取值以整数位断开,例如“公司数”持续

4、型变量,取之持续不断,不能一一列举,例如“温度”。1数据的预解决涉及哪些内容?数据审核(完整性和精确性;合用性和实效性),数据筛选和数据排序。2直方图和条形图有什么区别?条形图使用图形的长度表达各类别频数的多少,其宽度固定,直方图用面积表达各组频数,矩形的高度表达每一组的频数或频率,宽度表达组距,直方图各矩形持续排列,条形图分开排列,条形图重要展示分类数据,直方图重要展示数值型数据。3饼图和环形图有什么不同?饼图只能显示一种样本或总体各部分所占比例,环形图可以同步绘制多种样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一种环。4茎叶图和直方图相比有什么长处?茎叶图既能给

5、出数据的分布状况,又能给出每一种原始数据,即保存了原始数据的信息。在应用方面,直方图一般合用于大批量数据,茎叶图合用于小批量数据。5使用图标应注意哪些问题?合理安排登记表构造表头一般涉及表号,总标题和表中数据的单位等内容表中的上下两条横线一般用粗线,中间的其她用细线在使用登记表时,必要时可在下方加注释,注明数据来源。.一组数据的分布特性可以从哪几方面进行测度。一是分布的集中趋势,反映数据向其中心靠拢或汇集的限度;二是分布的离散限度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜限度和峰度。2简述四分位数的计算措施:一方面对数据进行排序,然后拟定四分位数所在的位置,该位置上的数值

6、就是四分位数。(设2%的四分位数为25%,75%四分位数为75%,根据四分位数定义有:25%位置=n/,Q75%位置=3n4。3.对于比率数据为什么采用几何平均。在实际应用中,对于比率数据的平均采用几何平均要比算数平均更合理。从公式中也可看出,G就是平均增长率。4.简述众数、中位数、和平均数的特点和应用场合。众数是一组数据分布的峰值,不受极端值的影响,缺陷是具有不唯一性。众数重要作为分类数据的集中趋势测度值。中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数以及其她分位数重要适合于作为顺序数据的集中趋势测度值。均值是就数值型数据计算的,具有优良的数学性质,缺陷是易受数据极端值的影

7、响。均值重要适合于作为数值型数据的集中趋势测度值。5. 为什么要计算离散系数。第一,极差、平均差、方差和原则差等都是反映数据分散限度的绝对值,其数值的大小取决于原变量值自身水平高下的影响。第二,它们与原变量值的计量单位相似,采用不同计量单位计量的变量值,其离散限度的测度值也就不同。因此,为消除变量值水平高下和计量单位不同对离散限度的测度值的影响,需要计算离散系数。6.简述异众比率、四分位差、方差或原则差的合用场合对于顺序数据,但重要使用四分位差来测量其离散限度;对于数值型数据,虽然可以计算异众比率和四分位差,但重要使用方差或原则差来测量其离散限度。7. 原则分数有哪些用途?原则分数给出了一组数

8、据中各数值的相对位置。在对多种具有不同量纲的变量进行解决时,常需要对各变量进行原则化解决。它还可以用来判断一组数据与否有离群数据。1.抽样推断的含义:是在根据随机原则从总体中抽取部分实际数据的基本上,运用数理记录措施,对总体某一现象的数量性作出具有一定可靠限度的估计判断。2.简朴随机抽样:含义:从具有N个元素的总体中,抽取n个元素作为样本,使得每一种容量为的样本均有相似的机会被抽中,这样的方式称为简朴随机抽样。特点:简朴随机抽样是其她抽样措施的基本。有两种抽取元素的方式:反复臭氧和不反复抽样。分层抽样:含义:在抽样之前先将总体的元素划分为若干层,然后从各个层中抽取一定数量的元素构成一种样本,这

9、样的样本抽样方式称为分层抽样,也成分类抽样。特点:除了可以对总体进行评估外,还可以对各层的子总体进行评估。可以按自然区域或行政区域进行分层,使抽样的组织和实行都比较以便。分层抽样的样本分布在各个层内,从而使样本在总体中的分布比较均匀。可以提高估计的精度。系统抽样:含义:先将总体个元素按照某种顺序排列,并按某种规则拟定一种随机起点,然后,每隔一定的间隔抽取一种元素,直至抽取n个元素形成一种样本。特点:简朴易行在总体中的分布一般也比较均匀,由此估计的误差一般要不不小于简朴随机抽样。整群抽样: 含义:先将总体划提成若干群,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所涉及的所有元素进行观测

10、。特点:不需要有总体元素的具体名单而只要有群的名单就可以进行抽样。整群抽样时群内各元素比较集中,对样本进行调查比较以便,节省费用。在群内各元素存在差别时,整群抽样可以提供较好的成果,抱负的状况是每一群都是整个总体的一种缩影。3.反复抽样:从总体中抽取一种元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止。不反复抽样:一种元素被抽中后不再放回总体,然后再从所剩余的元素中抽取第二个元素,直到抽取n个元素为止。.抽样分布:反复选用容量为n的样本时,由每一种样本算出的记录量数值的相对频数分布或概率分布,称为样本记录量的抽样分布。5样本记录量的分布与总体分布的关系?由于现实中我们不也许

11、将所有的样本都抽出来,因此,记录量的抽样分布事实上是一种理论分布,但它与总体分布存在着密切的关系,以均值x的抽样分布为例,其抽样分布与原有总体的分布有关,如果原有总体是正态分布,那么,无论样本容量的大小,样本均值也服从正态分布。其分布的数学盼望为总体均值,方差为总体方差的1/n,即0。如果原有总体的分布不是正态分布,就要看样本容量的大小了,当为大样本时(n30),根据记录上的中心极限定理可知,当样本容量增大时,不管本来的总体与否服从正态分布,样本均值的抽样分布都将趋于服从正态分布。其分布的数学盼望为总体均值,方差为总体方差的1/n。 6. Z/的含义:是估计误差。Z/的值和样本量n共同拟定了估

12、计误差的大小,一旦拟定了置信水平1-,Z2的值就拟定了。对于给定的Z2的值和总体原则差。可以拟定任一容许的估计误差所需要的样本量。7.样本均值抽样分布的两个重要特性值:与总体参数的关系:1.理解原假设与备择假设的含义:原假设:一般将研究者想收集证据予以反对的假设称为原假设或零假设,用H0表达;备择假设:一般将研究者想收集证据予以支持的假设称为备择假设或研究假设,用H表达。2.记录检查量:根据样本观测成果计算得到的,并据以对原假设和备择假设作出决策的某个样本记录量,称为检查记录量。原则化检查记录量:是将记录检查量原则化,原则化的记录检查量=(点估计量-假设值)点估计量的抽样原则差。3第类错误:当

13、原假设为真时回绝原假设,所犯的错误称为类错误。犯第类错误的概率一般记为。第类错误:当原假设为假时没有回绝原假设,所犯的错误称为第类错误,又称取伪错误。犯第类错误的概率一般记为。它们发生概率之间的关系:在样本量不变的状况下,要减小就会使增大,而要增大就会使减小,这两类错误此消彼长。4明显性水平:假设检查中犯的第类错误的概率,称为明显性水平,记为。它对于假设检查决策的意义:明显性水平是人们事先制定的犯第类错误的概率的最大容许值,在实际应用中,明显性水平往往是人们事先给出的一种值。5.P值:在原假设为真的条件下,检查记录量的观测值不小于或等于其计算值的概率,称为P值,也称为观测到的明显性水平。运用值

14、决策的准则:如果P值,回绝H0;如果P值,不回绝H0.单侧检查与双侧检查的区别:单侧检查中,P值位于抽样分布的一侧,而双侧检查P值位于分布的两侧,每一侧的值为1/27.大样本情形下总体均值左侧检查的回绝域:ZZ;双侧检查的回绝域:|Z|Z/2。小样本情形下总体均值检查应当构造的检查记录量t 应用前提:服从正态分布9.小样本情形下总体均值左侧检查回绝域:tt(n-);右侧检查回绝域: tt(n-1);双侧检查的回绝域:|/2(n-1)1.假设检查的一般环节:根据题意建立原假设H0与备择假设判断样本大小并计算检查记录量根据明显水平进行判断原假设与否成立。1、有关关系:变量之间存在的不拟定的数量关系

15、。有关关系的特点:一种变量的取值不能由另一种变量唯一拟定,当变量x取某个值时,变量的取值也许有几种2、有关系数的取值和意义:取值范畴:1r1。若01,、y之间存在正线性有关关系;1r0,负线性有关关系;若r=+1,x、y之间为完全正有关关系;=1,为完全负线性有关关系。当r1时,y的取值完全依赖于x,两者之间即为函数关系;当=0时,阐明的取值和x无关,即两者之间不存在线性关系(并不阐明变量之间没有任何关系)。若|r1,阐明变量之间线性关系越密切,|r|,越不密切。|0.8,高度有关;.5|0.8,中度有关;0.|t/2,回绝H,回归系数等于0的也许性不不小于,表白自变量x对因变量的影响是明显的

16、(两个变量之间存在着明显的线性关系);若|/2,则不能回绝H0,表白x对y的影响是不明显的,两者之间不存在线性关系。10.置信区间估计:对的一种给定值x0,求出y的平均值的区间估计。预测区间估计:对的一种给定值0,求出的一种个别值的区间估计。区别:1简述时间序列的各构成要素构成要素分为四种,即趋势(T)、季节性r季节变动(S)、周期性或循环波动()、随机性或不规则波动(I).趋势是指时间序列在长时期内呈现出来的某种持续向上或持续下降的变动。它是由某种固定性的因素作用于序列而形成的。可以是线性,也可以是非线性。季节变动是指时间序列在一年内反复浮现的周期性波动。循环波动或周期性波动是指时间序列中呈

17、现出来的环绕长期趋势的一种波浪形或振荡式变动。不同于趋势变动,季节变动有比较固定的规律,周期为一年,而循环波动则无固定的规律,变动周期多为一年以上,且周期长短不一。周期性一般是由于经济环境的变化而引起的。随机性或不规则波动是由于某些偶尔性的因素产生的。 2运用增长率分析时间序列时应注意哪些问题(1)当时间序列中的观测值浮现0或负数时,不适宜计算增长率;(2)不能单纯就增长率论增长率,要注意增长率与绝对水平的综合分析;大的增长率背后,其隐含的绝对值也许很小,小的增长率背后其隐含的绝对值也许很大。3简述平稳序列和非平稳序列的含义平稳序列:基本上不存在趋势的序列。各观测值基本上在某个固定的水平上波动

18、,虽然在不同的时间段波动的限度不同,但并不存在某种规律,而其波动可以当作是随机的。非平稳序列:涉及趋势性、季节性或周期性的序列。它也许只具有其中的一种成分,也也许是几种成分的组合。4指数平滑法的基本含义:是加权平均的一种特殊形式对过去的观测值加权平均进行预测的一种措施观测值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑有一次指数平滑、二次指数平滑、三次指数平滑等 该措施使用第1期的预测值等于期的实际观测值与第期预测值的加权平均值一次指数平滑法也可用于对时间序列进行修匀,以消除随机波动,找出序列的变化趋势 5分解预测的基本环节:拟定并分离季节成分。计算季节指数,以拟定期间序列中的季节成分

19、。然后将季节成分从时间序列中分离出去,即用每一种时间序列观测值除以相应的季节指数,以消除季节成分建立预测模型并进行预测。对消除季节成分的时间序列建立线性预测模型,并根据这一模型进行预测计算出最后的预测值。用预测值乘以相应的季节指数,得到最后的观测值。1指数的含义:测定多种项目在不同场合下综合变动的相对数,称为指数。2加权综合指数和加权平均指数有何区别与联系加权综合指数:通过加权来测定一组项目的综合变动,有加权数量指数和加权质量指数。使用条件:必须掌握全面数据(数量指数,测定一组项目的数量变动,如产品产量指数,商品销售量指数等)(质量指数,测定一组项目的质量变动,如价格指数、产品成本指数等)拉式

20、公式:将权数的各变量值固定在基期。帕式公式:把作为权数的变量值固定在报告期。 加权平均指数:以某一时期的总量为权数对个体指数加权平均。使用条件:可以是全面数据、不完全数据。因权数所属时期的不同,有不同的计算形式。有:算术平均形式、调和平均形3阐明消费者价格指数、生产者价格指数、股票价格指数的含义消费者价格指数C:是反映一定期期内消费者所购买的生活消费品价格和服务项目价格的变动趋势和限度相对数。生产者价格指数PI:是测量在初级市场上发售的货品的价格变动的一种价格指数。股票价格指数:是反映某一股票市场上多种股票价格变动趋势的一种相对数,其单位一般用“点”表达4消费者价格指数有哪些作用用于反映通货膨胀状况。通货膨胀的严重限度是用通货膨胀率来反映的,它阐明了一定期期内商品价格持续上升的幅度用于反映货币购买力的变动趋势。货币购买力是指单位货币可以购买到的消费品和服务的数量。消费者价格指数上涨货币购买力则下降,反之则上升用于反映对职工实际工资的影响。消费者价格指数的提高觉得这实际工资的减少,消费者价格指数下降则意味着实际工资的提高用于缩减经济序列。通过缩减经济序列可以消除价格变动的影响,其措施是将经济序列除以消费者价格指数。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!