统计学相关概念

上传人:无*** 文档编号:75509352 上传时间:2022-04-15 格式:DOCX 页数:22 大小:221.48KB
收藏 版权申诉 举报 下载
统计学相关概念_第1页
第1页 / 共22页
统计学相关概念_第2页
第2页 / 共22页
统计学相关概念_第3页
第3页 / 共22页
资源描述:

《统计学相关概念》由会员分享,可在线阅读,更多相关《统计学相关概念(22页珍藏版)》请在装配图网上搜索。

1、第1章绪论1、统计学 是以现象的数量特征为研究对象,利用自身特有方法,发现现象应有规律的一门方法论科学。2、总体和总体单位(1)总体:指具有相同性质的一组个体组成的集合。即根据一定目的确定的所要研究 事物的全体。(2)总体单位:简称单位,是组成总体的各个个体。它是构成总体的基础。3、样本和样本单位样本:从总体中获得的一个群或组。从总体中抽取出来,作为代表这一总体的部分单位 组成的集合体。4、标志和标志表现(1)标志:用来描述总体单位的属性、特征的概念和数值。(2)标志表现:各单位的属性或特征的具体表现(3)标志的分类:按表现形式分:品质标志数量标志按有无差异分:不变标志可变标志(可变的数量标志

2、称为变量)5、指标:是用于说明统计总体或样本数量特征的名称和数值的总和。6、统计调查方法(1)普查(2)重点调查(3)典型调查(4)抽样调查7、统计分组(1)统计分组的原则:穷尽原则互斥原则(2)统计分组分类品质标志分组:属性分布数列统计分组单项数列I数量标志分组:变量分布数列 等距数列组距数列,I异距数列(3)统计分组形成次数分布数列,次数分布数列有两个组成要素:组别频数(频率累计频数(向上累计、向下累计)(4)几个基本概念组距上限下限组中值次数密度(指本组的次数与本组组距之比,异距数列中用到)第2章描述统计1、集中趋势(1)集中趋势是指一组数据向分布的中心集中的现象。描述集中趋势的实质是找

3、出数 据的集中点或中心值。(2)数据分布集中趋势的测度指标称为平均指标。算术平均数又调和平均数H卜数值平均数(特点:受极端值影响)常见的平均指标几何平均数G中位数Me,位置平均数(特点:不受极端值影响)L众数M o -(3)计算公式XXf算术平均数X : X 、X nf(X、H、G都有简单和加权两种算法,分别适用于未分组和已分组的数据)、二者的实质一样的,已知条件不同,导致的算法不同而已其中二者的关系:m Xf调和平均数H : h-n-、X 1m(调和平均数因变量值在分母上,因此又称倒数平均数,要求变量值不能为0)几何平均数G : G n X、G f X f(几何平均数因算法为变量值的连乘积,

4、故如果有一变量值为 0,则计算结果为0)(常见的应用几何平均数的例子:连续作业的流水线、 存贷款的复利算法、 产值等的连续增长)中位数M e :总体各变量值按大小顺序排列,处于中点位置的变量值就是中位数。单项式数列:中位数位置位数位置i中位数计算公式 Me2 fmSm1i (下限公式)众数Mo :总体中出现次数最多的数。,单项式数列:直接确定众数 组距数列:先确定众数位置,然后计算众数Mo L 1一 i (下限公式)12(4)中位数、众数和算术平均数的关系:Mo 3Me 2又2、离散程度(1)除数据的集中趋势之外,数据的离散趋势 是数据分布的一个重要特征,它所反映 的是各个变量值远离中心的程度

5、,也称为离中趋势。全距R平均差A?D标准差(2)描述数据离散程度的指标主要有:、二者的基本思想一致,只是计算时对负号的数学处 r理方法有异,应用更广泛方差L变异系数V(3)计算公式全距R=最大值-最小值平均差a?d : a?Dx x1、a?dn|x x| f标准差(x x)22 _(x x) f:fy p(i p)(是非标志的标准差)99 (x x)29 (x x)2 f方差 2:2、2 一-一nf方差的加法定理:总方差(x x)2n、组间方差29(xi x) nn2平均组内方差i2Lni22 或。一首天东in变异系数V : V - 100% x(反应平均值代表性大小用变异系数;变异系数消除了

6、原单位的影响。)3、相对位置测度及异常值检测(1) z分数:通常被称为标准化值,表示观察值偏离平均数的标准差个数。(2)切贝谢夫定理:在任意一组数据中,至少有(1 1/z2)个数据落在与平均数 z倍标准差范围内,z是大于1的任意数。仅供学习与参考第3章时间序列分析1、时间序列是社会经济指标的数值按时间顺序排列而形成的一种数列。2、时间序列的种类时期序列绝对数时间序列JI时点序列时间序列 相对数时间序列I平均数时间序列3、时间序列的指标分析法环比发展速度/发展速度,L定基发展速度环比增长速度(2)速度指标 ,曾长速度j定基增长速度上期水平100,增长1%的绝对值几何平均法:参考第 2章几何平均数

7、G平均发展速度tI高次方程法:用于存量指标平均发展速度的计算(年距发展速度:本期发展水平与去年同期发展水平之比)平均增长速度时期序列:未分组:af绝对数J连续YI已分组:a平均发展水平(,时点序列 ”的为右侧检验,备择假设中含有“V”为左侧检验。(4)两类错误与显著性水平弃真错误当原假设为真时拒绝原假设,所犯的错误称为第I类错误,又称弃真错误,犯此类错误的概率常用表示。取伪错误当原假设为假时没有拒绝原假设,所犯的错误为第n类错误,又称为取伪错误(或纳伪错误),犯此类错误的概率常用表示。显著性水平假设检验中犯第I类错误的概率,称为显著性水平,记为。(5)检验统计量根据样本观测结果计算得到的,并据

8、以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。检验统计量实际为总体参数的点估计量,例如单个总体大样本情况下,总体均值的检验统计量为X ,标一2X准化检验统计量为 z 。根据第5章的抽样分布,有 x N(,),即zn(6)临界值与拒绝域能够拒绝原假设的检验统计量的所有可能取值的集合,称为拒绝域。根据给定的显著性水平确定的拒绝域的边界值称为临界值。(7)假设检验的步骤第一步:提出原假设和备择假设;第二步:计算检验统计量的值;第三步:根据显著性水平查表,得出临界值和拒绝域。第四步:得出结论。学习资料2、单个总体的假设检验x 0总体方差未知:检验统计量z = N(0,1)sVn广大样本

9、(1)总体均值的假设检验I总体方差已知:、检验统计量z正态总体方差已知:L正态总体方差未知:tt(n 1)(2)总体成数的假设检验(大样本):检验统计量zP0 双尾检验H。:0, H1:0拒绝域耳Z/2左侧检验H。:0, H1:0拒绝域zz右侧检验H。:0 , H1:0拒绝域zzt检验、总体成数检验思路一样,请同学们灵活把握, 后面两个总体的t检验和z检验道理也一样(3)总体方差的假设检验(正态总体)R(1P0)N(0,1):检验统计量2 (n 丁02(n 1)双尾检验H0:0 , H1 :,一20拒绝域2/2(n21)及22/小1 2(n 1)左侧检验H0:0, H1 :,,,20拒绝域12

10、 (n1)右侧检验H。:0, H1 :0拒绝域22(n1)学习资料3、两个总体的假设检验 (i)均值之差的假设检验方差未知:(xi x2 )( i 2 )2Sini2s2n2 N(0,1)方差已知:(Xi X2) 2 i(i 2)i2 N(0,i)2独立样本正态总体方差已知:正态总体方差未知d do大样本z l N(0,i)Sd / n。匹配样本nin2,方差相等方差不等(Xi 又2)(n2ninin2 n :02 : t(Xi2t(ni n2 2),其中 sp22(ni i)Si(n21居02 2(Xi X2)(12SiniX2)(12nii2S2n2i2) t(2n 2)S2022) t(

11、v),其中自由度2 Sini22Sinin i2 2s2n222S2 n2n? i小样本td doSd Jdt(n 1)(2)比例之差的假设检验/ H。: P1 P2 zP1 P2P P(1 P)= N(0,1),其中 p 1X1X2n1n2n1Pn2 P2n2(3)方差之比的假设检验2FSL2S2F(ni 1,n2 1)双侧检验Ho:H1 :拒绝域/2(n11,n2 1)及 FF1 /2(n1 1, n21)左侧检验Ho:H1:拒绝域F1(ni 1,1 1)右侧检验Ho:H1:拒绝域(5 1,1 1)第8章相关和回归分析1、基本概念(1)相关关系变量之间存在的不确定性数量关系,称为相关关系。

12、(2)相关系数根据样本数据计算的对两个变量之间线性关系强度的度量值,称为相关系数。2、符号和计算(1)样本相关系数r(x x)(y y)r :(x x)2 ? 1 (y y)2r的取值范围-1 r1oSxy简化的计算公式为Sx Syn xy x ? yn x2 ( x)2?.n y2 ( y)20vrw1,正线性相关关系;-1 wr0,负线性相关关系;r=1 ,完全正线性相关关系;r=-1 ,完全负线性相关关系;r=0,说明y的取值与x无关,即二者之间不存在(2)相关系数的检验线性相关关系。第一步:提出原假设和备择假设H0 :0 H1 :0第二步:计算检验统计量 tr1n ; t(n 1 r2

13、)第三步:进行决策。(拒绝域为,t 2(n 2)(3) 一元线性回归方程的参数估计(最小二乘法)一元线性回归方程为 ? a bx,其中参数b(4) 一元线性回归直线的拟合优度分析方差分析(y y)2(? y)2 (y y)2n xy x ? y2 /C2-n x ( x)(x x)(y y)(x x)y bx。即:总离差平方和二回归离差平方和+残差平方和r222(?y)ssr1 (yy)1 sse(yy)2sst (yy)2 sst即: SST=SSR+SSE相关系数r . r2估计标准误差Sy估计标准误差是指实际值y与估计值 ?的平均离差,说明回归方程推算结果的准确程度,其计算公式为Sy(y ? (y y),简化公式为Svn 2y2y a y b xyon 2

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!