华中科技大学统计学课件

上传人:xiao****017 文档编号:16383777 上传时间:2020-09-30 格式:PPT 页数:622 大小:4.97MB
收藏 版权申诉 举报 下载
华中科技大学统计学课件_第1页
第1页 / 共622页
华中科技大学统计学课件_第2页
第2页 / 共622页
华中科技大学统计学课件_第3页
第3页 / 共622页
资源描述:

《华中科技大学统计学课件》由会员分享,可在线阅读,更多相关《华中科技大学统计学课件(622页珍藏版)》请在装配图网上搜索。

1、统计学原理,?,唐跃志 tangyz_ Tel:027-62589359,参考教材,黄良文、曾五一 统计学原理。 贾俊平、何效群、金勇进 统计学。 佐和隆光 数量经济分析基础,统计学原理,学习目标,了解统计的作用。 掌握统计学的基本原理和基本方法。 使用统计方法,对所研究的对象,进行数量分析。,统计学原理,总目录,Ch1 统计学的对象和方法 Ch2 统计数据与统计调查 Ch3 数据的整理与描述 Ch4 统计分布的数值特征 Ch5 抽样和抽样分布 Ch6 统计推断 Ch7 相关与回归分析 Ch8 统计指数 Ch9 时间序列分析 Ch10 统计预测与预警分析,统计学原理,Ch1 统计学的对象和方法

2、,统计学原理,1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),主要介绍: 统计与统计学,统计的历史,统计的作用,统计的特点,统计的基本方法。,Ch1 主要内容,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),Ch1 学习目的,1,掌握统计学的对象和性质 2,掌握统计学的基本范畴 3,掌握统计学的方法,Ch1 统计学的对象和方法 1.1 统计与统计学 1.

3、2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),Ch1 统计学的对象和方法,统计学原理,1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),1.1 统计与统计学,1.1.1 统计与统计研究对象 1.1.2 统计(研究对象数据)的特点 1.1.3 统计学的作用,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5

4、统计学的产生和发展(new),返回,一、统计问题 在了解什么是统计之前,先看几个问题。 【例1-1】市场研究。面对变化多端、杂乱无章的市场数据,作为一个理性的投资者,最迫切最需要掌握的,理所当然就是市场的变化规律。但是,怎样去认识掌握这个多变的市场运动规律呢?这个市场规律,有什么特点?,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,【例1-2 】市场经济国家收入的负幂分配现象。也称为帕累托统计分布规律。意大利经济学家帕累托发现,各国的经济制度虽然不同,但收入分配却有共同的规律,它可以写成 N= N0 X -b,b0. N0其中为人口总数,X为收入水平,N为收

5、入不少于X之人数。 市场经济国家的收入分配,为什么存在帕累托分布规律?帕累托分布规律是怎样发现的?帕累托分布现象,是偶然的现象还是必然的现象?,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,【例1-3】市场经济国家收入的两级分化问题。帕累托的研究还发现,如果将社会人口由富人到穷人依次排列,占人口比重较大的低收入人口,没有取得与人口比重相应的社会收入,相反,占人口比重较小的高收入人口,却取得了社会收入的较大份额。这种现象也叫收入的两级分化。 为什么会出现收入的两级分化?帕累托分布规律与收入的两级分化是什么关系? 【例1-4】如何去发现存在于客观现象内部的、类似

6、于帕累托分布律的其他统计规律?等等。,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,如何去发现任意领域的经验规律? (不知因果关系) 第1步 “猜测” ! 第2步科学总结! 第3步统计! “猜测”!科学总结! 统计!,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,二,统计 就是以客观现象的数量关系和数量特征为研究对象,通过搜集、整理、归纳和分析等手段,探索总结客观数据现象的内在规律性,以达到对客观事物的科学认识,并最终获得客观现象规律性表现的统计解释。,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统

7、计研究对象,二,统计 统计是认识最直接、最有效的手段。 统计是科学总结的基础。 统计的用途很广。 统计学是经济研究最常用的工具。,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,1.1.1 统计与统计研究对象,三,统计数据和统计定律 利用统计方法搜集到的现象数据,叫做统计数据; 利用统计数据归纳发现的经验规律,叫统计定律。 帕累托分布和收入的两级分化,就是统计归纳发现的经济现象的统计定律。 统计定律,是客观规律的近似反映。,Ch1 统计学的对象和方法 1.1 统计与统计学,四,统计研究对象 统计的研究对象: 是客观现象的数量关系和数量特征,客观统计数据。 客观

8、现象的统计数据,是统计研究的基础和出发点。没有统计数据,就无法进行统计研究。 统计的作用,就是利用统计数据,充分发现、提出现象的统计规律性,并试图问为什么有此规律。,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,五,统计过程与统计学 统计学, 就是关于如何搜集、整理、归纳和分析客观数据的方法论科学。或者说,统计学是关于数据分析的科学,是关于研究现象数量表现的科学。 统计过程 搜集数据.整理数据.归纳数据.分析数据. 其中: 1,数据搜集:主要通过调查与实验,来获得所需要的数据。 2,数据的整理:通过数据的分组或者分类技术,获得现象的差异性认识。 3,数据的归

9、纳、展示:主要是利用图表技术,展示现象的特征特点。 4,数据分析:通过各种分析方法,寻找现象之间的相互联系。,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,六,统计的历史作用 英国的威廉配第(W.Petty,16231687),利用统计方法,研究了十七世纪中叶的英国、法国、荷兰的“财富和力量”对比; 英国的约翰格朗特(J.Graurt,16201674),则利用统计图表,研究并发现了一系列人口演变规律; 法国的拉普拉斯(P.S.Laplace,17491827),利用统计数据,推算了法国的人口数; 比利时的凯特勒(A.Quetelet,17961874) ,

10、应用概率统计,研究了犯罪、人口、寿命等社会问题的成因; 英国学者高尔顿(F.Galton,18761937)与皮尔逊 (K.Pearson,18571936) ,则利用了统计技术,研究并发现了遗传学领域的“回归”定律;,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,返回,统计学是研究数量表现的学科。但它的研究对象却有自身的特点。 数量性:统计数据是反映客观现实的具体数量,而非抽象的量。 总体性:统计数据是反映现象总体数量特征的数据,其研究及成果是一个总体研究,而非个别研究。 变异性:统计研究的是同类现象总体的数量特征;但这些总体单位的特征表现是有差异的;其差

11、异的来源是随机因素,而非特定原因。,1.1.2 统计(研究对象统计数据)的特点,Ch1 统计学的对象和方法 1.1 统计与统计学,返回,一、统计学的特点 统计学是研究数据数量表现的学科。 统计是一个定量研究。这个定量研究,具有客观、精确和可检验的特点,所以,统计方法就成为实证研究的最重要方法。 统计学可以应用于所有的领域。 在统计学基础上,发展起来的应用学科相当多。,1.1.3 统计学的作用,Ch1 统计学的对象和方法 1.1 统计与统计学,二、统计学的作用 统计的作用,概括起来一般为以下三点: 1,理论安排。 几乎所有的科学实验,都把统计方法作为认知的有效手段。比如,在实验前,利用统计方法,

12、做出科学的实验安排。 2,理论归纳。 在实验中,依靠统计分析显示事物之间的关系及规律性。特别是,当人们对现象的规律一无所知或者知之甚少时,统计可以帮助我们找到的规律的线索,指明研究的方向,并利用规律,解决前进过程中出现的新情况新问题。 3,理论检验。 在实验后,对实验结果做出解释,并检验它的正确性。,1.1.3 统计学的作用,Ch1 统计学的对象和方法 1.1 统计与统计学,返回,1.2 统计学的分科,1.2.1 描述统计学与推断统计学 1.2.2 理论统计学与应用统计学,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new)

13、 1.4 统计学的方法 1.5 统计学的产生和发展(new),返回,一、描述统计与推断统计 统计学早期的研究方法,侧重于对现象总体数量特征的描述和对比,称为描述统计学。 20世纪20年代以后,其研究方法发展为,以随机抽样为基础,对总体数量特征的推断,称为推断统计学。,1.2.1 描述统计与推断统计,Ch1 统计学的对象和方法 1.2 统计学的分科(new),二、描述统计与推断统计的关系,1.2.1 描述统计与推断统计,Ch1 统计学的对象和方法 1.2 统计学的分科(new),返回,一、理论统计学与应用统计学 理论统计学,是把研究对象一般化、抽象化,以概率论为基础,对统计方法加以论证。理论统计

14、学的中心内容是统计推断,实质上是用归纳方法,研究随机变量的一般规律。例如,统计分布理论,统计估计与假设检验理论,相关与回归分析,方差分析,时间序列分析,随机过程理论,等等。 应用统计学,是从研究领域和专门的问题出发,针对研究对象的性质,采用适当的指标体系和统计方法,解决所要研究的问题。例如,工程统计,医学统计,社会统计,经济统计,等等。,1.2.2 理论统计学与应用统计学,Ch1 统计学的对象和方法 1.2 统计学的分科(new),二、理论统计学与应用统计学的区别: 第一,理论统计学以方法为中心,建立统计指标体系,并在各种方法项下阐明所能解决的问题; 方法问题. 应用统计学则以问题为中心,建立

15、专门的统计指标体系,并在各种问题项下阐明所能解决的问题。 问题方法. 第二,理论统计学从事随机变量的数学分析;应用统计学不仅从事数量分析,还要进行质量分析。,1.2.2 理论统计学与应用统计学,Ch1 统计学的对象和方法 1.2 统计学的分科(new),返回,1.3 统计学与其他学科的关系,1.3.1 统计学与数学的关系 1.3.2 统计学与其他学科的关系,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),返回,一、统计学与数学的关系 统计学几乎可以应用于所有领

16、域。统计学是研究数据数量表现的学科,但它与数学有本质的区别与联系。 二、统计学与数学的联系: 统计学使用大量的数学知识。 数学为统计理论、统计方法的发展提供了数学基础。 不能将统计学等同于数学。,1.3.1 统计学与数学的关系,Ch1 统计学的对象和方法 1.3 统计学与其他学科的关系(new),三、统计学与数学的区别: 数学研究的是抽象的数量关系,统计学研究具体、实际的数量关系; 数学研究的是没有量纲或者单位的抽象数,统计学研究具体实物或者有单位的数据; 统计学与数学的逻辑方法不同, 数学使用的是演绎方法; 统计学使用的是演绎与归纳相结合的方法,但以归纳方法为主。,1.3.1 统计学与数学的

17、关系,Ch1 统计学的对象和方法 1.3 统计学与其他学科的关系(new),四、数学与统计学的逻辑体系,1.3.1 统计学与数学的关系,Ch1 统计学的对象和方法 1.3 统计学与其他学科的关系(new),返回,一、统计学与与其他学科的关系 ,1.3.2 统计学与其他学科的关系,Ch1 统计学的对象和方法 1.3 统计学与其他学科的关系(new),返回,1.4 统计学的方法,1.4.1 大数定律的方法论意义 1.4.2 统计研究基本方法 1.4.3 理论假设与现实统计的距离,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new

18、) 1.4 统计学的方法 1.5 统计学的产生和发展(new),返回,一、大数定律: 统计研究现象总体的数量特征,所用方法与数量的总体性有关,其依据是大数定律。 大数定律,亦称大数法则;它是指大量随机现象的平均结果一定是稳定的。比如:在一定时期内,每个人的身高是不一样的;但是社会人群的平均身高值,却会在相当长的一段时间内,维持一个比较稳定的数值。,1.4.1 大数定律的方法论意义,Ch1 统计学的对象和方法 1.4 统计学的方法,二、大数定律的几何解释 研究方向,1.4.1 大数定律的方法论意义,Ch1 统计学的对象和方法 1.4 统计学的方法,三、大数定律的方法论意义 现象总体的某种规律,只

19、有该现象总体的数量足够多的时后,才能显现出来; 现象的某种总体规律,通常以平均数的形式表现出来; 所研究现象总体包含的单位数越多,平均数就越能正确的反映这些现象的规律性; 各单位的共同倾向决定着平均数的水平,而单位对平均数离差的影响则不大。,1.4.1 大数定律的方法论意义,Ch1 统计学的对象和方法 1.4 统计学的方法,返回,一、统计学的基本方法 统计研究方法,主要有:实验设计,大量观察,统计描述,统计推断。其中,统计推断,又包括参数估计和假设检验。,1.4.2 统计学的基本方法,Ch1 统计学的对象和方法 1.4 统计学的方法,二、实验设计: 就是设计实验的合理程序,使得搜集到的数据满足

20、统计分析的需要。 实验设计三原则: 重复性原则:即允许在相同条件下重复进行多次实验。 随机性原则:在实验设计中,对实验对象的分配和实验次数都是按随机安排的。 区组化原则:利用类型分组技术,对实验对象按有关标志顺序排队,然后依次将各单位随机地分配到各组,使各组组内标志值的差异相对扩大,而组间的差异相对的小。 具体方法: 室内实验法; 市场实验法;,1.4.2 统计学的基本方法,Ch1 统计学的对象和方法 1.4 统计学的方法,三、大量观察法: 就总体中的全部或者足够多的单位进行观察,并加以综合研究。 具体方法: 普查; 抽样调查; 统计报表调查; 重点调查。,1.4.2 统计学的基本方法,Ch1

21、 统计学的对象和方法 1.4 统计学的方法,四、统计描述: 对数据进行登记,审核,整理,归类,计算出能反映总体数量特征的综合指标,并加以分析,从中抽出有用的信息,用表格和图像表示出来。 具体方法: 分组法:研究总体差异。 综合指标法:用指标反映特征。 统计模型法:用数学方程模拟客观现象。 具体内容: 搜集数据; 整理数据; 描述数据特征; 找出数据的基本规律。,1.4.2 统计学的基本方法,Ch1 统计学的对象和方法 1.4 统计学的方法,五、统计推断: 以一定的置信标准要求,根据样本数据来判断总体数量特征的归纳推理方法。 具体方法: 参数估计法:在一定置信(风险)下,用样本数据去估计总体数量

22、特征。 假设检验法:在一定置信标准(风险假设)下,用样本数据去检验总体数量特征。如果样本数据满足假设要求则假设得证;反之,否定假设。,1.4.2 统计学的基本方法,Ch1 统计学的对象和方法 1.4 统计学的方法,六、统计方法使用的一般原则: 一个具体的统计问题,应该使用何种统计方法,与统计问题所处的研究阶段有关。 统计研究过程的各个阶段,从统计资料的搜集、数据的整理汇总,以至统计分析检验,都有专门的方法。 在资料搜集时,对于无法从实验取得资料的现象,一般应用大量观察法;对于可以通过实验取得资料的现象,一般应建立在合理的试验设计基础上;在数据的整理和汇总时,则多使用统计描述法;而在统计分析和检

23、验时,则主要使用统计推断法。,1.4.2 统计学的基本方法,Ch1 统计学的对象和方法 1.4 统计学的方法,七、统计方法使用原则图解:,1.4.2 统计学的基本方法,Ch1 统计学的对象和方法 1.4 统计学的方法,返回,一、理论与现实的距离问题: 统计分析的前提是,假定现象规律和数据规律存在高度的对称性。在此前提下,才有可能通过部分数据的归纳,总结出现象的规律性;并以此为依旧,检验原有假设的正确与否。但事实上,实证结果与理论假设常常存在较大的偏差。 是什么原因造成如此大的偏差呢?这里的解释无外乎有两种:一是统计数据的代表性不够,出现了通常讲的统计假象;二是理论本身就存在不足,或者干脆有错误

24、,因此,理所当然就存在偏差问题。因此,从这个意义上说,统计可以对理论进行实证检验。,1.4.3 理论假设与统计现实的距离,Ch1 统计学的对象和方法 1.4 统计学的方法,返回,1.5 统计学的产生和发展,1.5.1 政治算术社会经济统计 1.5.2 概率论数理统计,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),返回,一、政治算术社会经济统计的历史 政治算术学派,产生于17世纪的英国。该学派代表人物,是威廉配第(W.Petty,1623-1687)和约翰格朗

25、特(J.Graurt,1620-1674)。,1.5.1 政治算术社会经济统计,Ch1 统计学的对象和方法 1.5 统计学的产生和发展(new),二、威廉配第(W.Petty,1623-1687) 在政治算术一书中,开天辟地地使用数量对比的方法,分析了十七世纪中叶,英国、法国、荷兰三国的“财富和力量”状况,论证当时英国的国际地位并不悲观。因为他在政治算术中提出了“劳动价值论”的观点,马克思称他为“政治经济学之父”;又因为他第一个用数字、重量和尺度,作为论据的方法来论证想说明的问题,又被后人称为统计学的创始人。,1.5.1 政治算术社会经济统计,Ch1 统计学的对象和方法 1.5 统计学的产生和

26、发展(new),三、约翰格朗特(J.Graurt,1620-1674) 通过大量的观察,研究并发现了一系列人口统计规律。如,男婴出生多于女婴,基本上为14:13;男性的死亡率高于女性;新生儿在大城市的死亡率较高;一般疾病和事故的死亡率较稳定,而传染病的死亡率波动较大;等等。在对死亡表的自然和政治观察中,格朗特根据当时伦敦发表的人口公报,分析了人口出生和死亡的关系,如性别比例关系,不同死因的死亡人数占死亡人数的比重等。在具体分析方法中,他采用了具有现代统计学意义的数量分析法;在方法论上,开创了现代统计分析方法的先河。因此被认为是统计学的正宗。,1.5.1 政治算术社会经济统计,Ch1 统计学的对

27、象和方法 1.5 统计学的产生和发展(new),返回,一、概率论数理统计的历史 政治算术学派,以社会经济现象为研究对象,属于实质性科学,至于统计方法,仅仅属于所使用的工具而已。到了18世纪,作为数学分支的概率论,被引入统计学,形成了数理统计学派,从而使统计学方法产生了重大进步。 数理统计,是以随机现象为研究对象。它是对统计方法的科学性进行论证的一个专门性学科。 代表人物有法国数学家拉普拉斯(P.S.Laplace,17491827) ,比利时统计学家阿道夫凯特勒(A.Quetelet,17961874) ,。,1.5.2 概率论数理统计,Ch1 统计学的对象和方法 1.5 统计学的产生和发展(

28、new),二、拉普拉斯(P.S.Laplace,17491827) 他以大数定律为桥梁,将概率论与政治算术联系起来,通过对法国17991802年间30个县市人口的抽样资料,推算了法国的人口数,并指出其可能的误差区间,这在统计方法论上,具有开创性意义。 三、阿道夫凯特勒(A.Quetelet,17961874) 凯特勒发展了大量观察法。凯特勒指出,随机偶然现象中存在必然规律,这些规律可以通过大量观察、实验显示出来,其具体存在形式就是概率。凯特勒还广泛应用概率论,研究社会问题,如犯罪、人口、寿命等问题。由于其在应用数理统计在实际工作中的贡献,有人推崇他为现代统计学之父。,1.5.2 概率论数理统计

29、,Ch1 统计学的对象和方法 1.5 统计学的产生和发展(new),四、数理统计方法的发展 在社会科学和自然科学等各个领域得到了广泛应用。数理统计学早期的研究方法,侧重于对现象总体数量特征的描述和对比,称为描述统计学。20世纪20年代以后,其研究方法发展为,以随机抽样为基础,对总体数量特征的推断,称为推断统计学。,1.5.2 概率论数理统计,Ch1 统计学的对象和方法 1.5 统计学的产生和发展(new),返回,Ch1 内容小结,1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),Ch1 统

30、计学的对象和方法,Ch2 统计数据与统计调查 介绍如何把一个研究对象,抽象成一个数据集。以及通过何种方法去获得所需要的数据。,下一章,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),思考与练习,1.1、什么是统计?统计有何作用? 1.2、统计学的研究对象是什么?统计研究对象有何特点? 1.3、什么叫统计定律?统计定律在认识中有何作用? 1.4、什么是统计工作过程?其包含哪些内容? 1.5、如何理解统计学与数学的关系? 1.6、什么是大数定律?大数定律的方法论意

31、义是什么? 1.7、什么是实验设计?实验设计要遵循哪些原则? 1.8、什么是统计分组?什么是统计模型? 1.9、什么是统计推断?它和统计描述的关系任何? 1.10、结合统计工作过程,简述统计方法使用的基本原则。 1.11、从历史的发展来看,统计学的性质有哪些变化? 1.12、如何理解理论假设与统计现实的距离问题?,Ch1 统计学的对象和方法,Ch3 统计的整理与描述,统计学原理,3.1 统计数据的预处理(new) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描述(new) 3.4 统计分组(类) 3.5 统计整理的应用(new),介绍如何整理数据,以及利用何种技术描述整理的

32、结果。 统计整理的目的,就是要把无规的数据变成有规的数据。 数据整理,通常包括:数据的预处理、分类或者分组、汇总等内容,它是统计分析的必要步骤。其中,统计分组,是统计整理的核心。 有规的数据的描述,通常是用统计图和统计表来完成。,Ch3 主要内容,Ch3 统计的整理与描述 3.1 统计数据的预处理(new) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描述(new) 3.4 统计分组(类) 3.5 统计整理的应用(new),Ch3 学习要求,1,掌握统计整理的程序 2,掌握统计分组(类)技术 3,掌握统计图(表)技术,Ch3 统计的整理与描述 3.1 统计数据的预处理(ne

33、w) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描述(new) 3.4 统计分组(类) 3.5 统计整理的应用(new),Ch3 统计的整理与描述,3.1 统计数据的预处理(new) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描述(new) 3.4 统计分组(类) 3.5 统计整理的应用(new),统计学原理,3.1 统计数据的预处理,3.1.1 数据的审核与筛选 3.1.2 统计数据的排序 3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描述(

34、new) 3.4 统计分组(类) 3.5 统计整理的应用(new),返回,一,统计整理综述 统计整理的目的: 无规的数据变成有规的数据。 数据整理: 数据的预处理分类或分组汇总编制统计图表。 它是统计分析的必要步骤。其中,统计分组,是统计整理的核心。 数据的审核和筛选,是统计整理的基础。 有规的数据的描述,通常是用统计图(表)来完成。,3.1.1 数据的审核与筛选,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),二,审核与筛选目的 以保证数据的质量,为下一步的整理分析打好基础。 从不同的渠道取得的统计数据,其审核的内容和方法有所不同; 不同类型的统计数据,在审核内容和方法上有所差

35、异。 数据的审核与筛选,包括原始数据和第二手数据的审核与筛选。,3.1.1 数据的审核与筛选,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),三,原始数据审核 审核内容:完整性和准确性。 完整性审核,主要是检查应调查的单位是否有遗漏,所有的调查项目或指标是否填写齐全等。 准确性审核,主要包括两个方面:一是检查数据资料,是否真实地反映了客观实际情况,内容是否符号实际;二是检查数据是否有错误,计算是否正确等。 审核数据准确性的方法,主要有逻辑检查和计算检查。 逻辑检查,主要是从定性角度审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无矛盾。逻辑检查,主要用于品质数据的审核。 计

36、算检查,是检查调查表中的各项数据在计算方法上有无错误。计算检查,主要用于数值数据的审核。,3.1.1 数据的审核与筛选,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),四,第二手数据审核 内容:完整性和准确性,适用性和时效性。 首先要弄清数据的来源、数据的口径以及有关的背景材料,以确定这些数据,是否符合分析研究的需要,是否需要重新加工整理等,不能盲目生搬硬套。 对数据的时效性进行审核,有些时效性很强的问题,如果所取得的数据过于滞后,就失去了研究的意义。 一般来说,应尽可能使用最新的数据。数据经过审核后,确认适合实际需要,才能进行进一步的加工整理。,3.1.1 数据的审核与筛选,C

37、h3 统计的整理与描述 3.1 统计数据的预处理(new),五,数据筛选 对审核过程中发现的错误应及时纠正。当数据中发现的错误不能纠正,或者有些数据不符合调查的要求而又无法弥补时,就需要对数据进行筛选。 数据筛选,包括两方面内容:一是将某些不符合要求的数据或者有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,对不符合特定条件的数据予以剔除。 数据的筛选,在市场调查中有特殊的意义。,3.1.1 数据的审核与筛选,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),返回,一,数据的排序 数据的排序,就是按一定的顺序将数据进行排列。简言之,就是对于一个给定的序i和给定序列 x

38、i : i=1,2,n. (3.1.1) 如何确定一组具体的数据 Y1 ,Y2 ,Y3 , ,Ym-1 ,Ym ;, n m. 的某一个数值,在这个xi序列中的位置。 一般地,值相同数据占据相同的位置,值不同数据则有不同的序。,3.1.2 统计数据的排序,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),二,排序的目的 通过排序,发现数据的一些明显特征和趋势,找到解决问题的线索。除此外,排序还有助于对数据检查纠错,为重新归类或者分组提供依据。 在某些场合,排序本身就是分析的目的之一。例如,了解谁是中国家电生产的三巨头,对于家电生产商而言是非常重要的信息。美国财富杂志每年都要排出世界

39、500强企业,通过这一信息,经营者不仅可以了解自己所处的地位,清楚自己的差距,还可以了解竞争对手的状况,从而有效地制定企业发展的规划和战略目标。,3.1.2 统计数据的排序,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),三,数据的排序方式 数据序列,一般有三种排列,即递增序列、递减序列和随机序列。 递增序列,即序列xi一般有 x1 x2 x3 x4 x5 xn-1 xn ; (3.1.2) 递减序列,即序列xi一般有 x1 x2 x3 x4 x5 xn-1 xn ; (3.1.3) 随机序列,即序列xi一般有 x1 x2 x3 x4 x5 xn-1 xn ; (3.1.4) 即

40、各个xi的i只表示它们是不同的数值,共有n个数据,除此以外,别无其他的意思。,3.1.2 统计数据的排序,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),四,数据的一般排序方式 一般序列,主要是递增序列或随机序列。 排序后的标志变量,通称为标志变量序列。 标志变量序列一般是指递增序列。它一般表示是 xi : i=1,2,n. (3.1.5) 其中:i代表序号,通常为升序自然数排列。 对于标志变量序列,当然有, x1 x2 x3 x4 x5 xn-1 xn ; 。,3.1.2 统计数据的排序,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),返回,一,排序的方法 数据的

41、排序,首先要确定排序的标志,然后根据标志的特点,确定排序的方法。 原则是:根据标志值的大小,来确定数据序的方向,然后根据序的方向,确定某一个数据在这个序中的位置。简言之,就是 先确定标志序, 然后确定数据序。 不同类型的数据,其排序方法是不同的。 无论是定性数据还是数字型数据,排序均可借助于计算机完成。,3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),二,定类数据的排序(1) 由于定类数据值本身,并不是一个数值,而是一个文字数据,定类数据的值之间,也不存在绝对的大小序关系,而只是一个属于或者不属于的归属关系,因此,定类数据的排序,不能完全按值的大小确定

42、排序的方向。 通常的做法是,按字母做升序或者降序排列,或者按笔画或者其他什么约定,做升序或者降序排列。 总而言之,定类数据的排序,相对比较自由。,3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),【例3-1】为了研究广告市场的状况,某公司在某城市随机调查了200个市民,其中的一个问题是:“您比较关心下列哪一类广告?” 商品广告,服务广告,金融广告,房地产广告,招生招聘广告,其他广告。 试对其进行排序。 解:这里数据为200个居民的回答数据,共200个。这200个数据的排序,应先选择排序标志。由于这200个数据均从属于“广告类型”变量集,即 商品广告,服务

43、广告,金融广告,房地产广告,招生招聘广告,其他广告 显然,i=1,2,3,4,5,6。因此,可以选择“广告类型”变量为排序标志, “广告类型”为定类变量,不同类型的广告就是变量值。 由于广告变量值并不是一个数字,而是一个文字数据,广告变量值之间,也不存在绝对的大小序关系,而只是一个属于或者不属于的归属关系,因此,可以指定 x1= “商品广告”,x2=“服务广告”,x3=“金融广告”, x4=“房地产广告”,x5=“招生招聘广告”,x6=“其他广告”。 根据标志序列xi,进一步确定200个回答数据的归属,就就可以确立每一个回答数据在xi中的位置 。,3.1.3 数据的排序方法,Ch3 统计的整理

44、与描述 3.1 统计数据的预处理(new),三,定序数据的排序(1) 定序数据依然是文字数据,虽然定序数据的值之间,不存在绝对的大小关系,但存在一个类似大小的优于关系。 优于关系可以用“”表示,它基本与“”等价。 即定序数据序列xi,都存在如下序关系 x1 x2 x3 x4 x5 xn-1 xn ; 且这种序关系常常与人们的价值观一致。 因此,可以根据人们的价值观,确定定序数据的序位置。,3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),【例3-2】在一项有关住房问题的研究中,研究人员在某城市随机调查了300户居民,其中的一个问题是“您对您目前的住房状况

45、是否满意?” 非常不满意,不满意,一般,满意,非常满意。 试对其进行排序。 解:这里数据为居民的回答数据,共300个。这300个数据的排序,应先选择排序标志。由于这300个数据,均从属于“满意程度类型”变量集,即 非常不满意,不满意,一般,满意,非常满意 显然,i=1,2,3,4,5。 因此,可以选择“满意程度”为排序标志, “满意程度”为定序变量,不同类型的满意值就是变量值。但是这个定序变量,显然有 非常不满意 不满意 一般 满意 非常满意 于是,可令 x1=“非常不满意”,x2=“不满意”,x3=“一般”, x4=“满意”,x5=“非常满意”。 再确定这300个数据的归属,就可完成它们的排

46、序。,3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),四,定距数据和定比数据的排序 定距数据和定比数据,都是数字数据。数字数据的数据值之间,一般存在大小的序关系。 因此,定距数据和定比数据的排序,可以根据标志值的大小,来确定数据序的方向,然后根据序的方向,确定某一个数据在这个序中的位置。 定距数据和定比数据的排序,一般按递增方法排序。 按递增要求排序后的数据,也称为顺序统计量。,3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),【例3-3】某班学生共55人,每个人的兴趣、爱好各异,初步判断与他们的性别和年龄有关。

47、从年龄这个角度分组,发现这55人的年龄,主要集中在 “18,19,20,21,22。” 岁之间。试对其进行排序。 解:这里数据为55个学生的兴趣、爱好数据,共55个。由于这55个数据的结果与年龄有关。因此,数据的排序标志为“年龄”, “年龄变量”为排序标志变量,不同的年龄值就是变量值。即 18,19,20,21,22 显然有 18 19 20 21 22 。 于是,可令 x1=18,x2=19,x3=20,x4=21,x5=22。 再确定这55个数据的归属,就可完成它们的排序。,3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),返回,3.2 品质数据的整

48、理与描述,3.2.1 定类数据的整理与描述 3.2.2 定序数据的整理与描述,Ch3 统计的整理与描述 3.1 统计数据的预处理(new) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描述(new) 3.4 统计分组(类) 3.5 统计整理的应用(new),返回,3.2.1 定类数据的整理与描述,一、分组与分类 数据经过预处理后,可进一步做分类或者分组整理。 所谓分类(组),就是值相同的数据归为同一个组,值不同的数据则归为不同的类。 在对数据进行整理时,应首先弄清数据的类型,因为不同类型的数据所采取的整理方法是不同的。 对品质数据主要做分类处理,对数值型数据则主要做分组处理

49、。,Ch3 统计的整理与描述 3.2 品质数据的整理与描述(new),3.2.1 定类数据的整理与描述,二、定类数据整理的程序 定类数据本身就是对事物的一种分类。 所以,在整理时,除了要列出所分的类别外,还要计算每一类别的频数、频率、比例、比率指标,同时选择适当的图形进行描述,以便对数据的特征有一个初步了解。,Ch3 统计的整理与描述 3.2 品质数据的整理与描述(new),3.2.1 定类数据的整理与描述,三、频数与频率分布 频数也称次数,就是落在各类别中的数据个数。 将各个类别及其频数对应地排列起来,就构成了频数分布或者次数分布。 频数分布有两个基本构成要素:一是分组标志序列xi,二是组的

50、频数序列f i,或称次数序列。一般表示为 标志序列xi : x1,x2,x3,x4,x5,xn-1, xn ; (3.2.1) 频数序列f i : f1,f2,f3,f4,f5,fn-1, fn ; (3.2.2) 其中,标志序列xi多为递增序列,而频数序列f i,则是根据分组的位置归类计算的结果,是一个指标变量随机序列。,Ch3 统计的整理与描述 3.2 品质数据的整理与描述(new),3.2.1 定类数据的整理与描述,三、频数与频率分布 将频数分布用表格的形式表现出来,就是频数分布表。 将频数分布用图形的形式表现出来,就是频数分布图。频数分布图也叫统计分布图。,表34某标志分组表,Xi ;

51、 f i;分组表统计图,Ch3 统计的整理与描述 3.2 品质数据的整理与描述(new),3.2.1 定类数据的整理与描述,三、频数与频率分布 【例3-4】为了研究广告市场的状况,某广告公司在某城市随机调查了200个市民,其中的一个问题是:“您比较关心下列哪一类广告?” 商品广告,服务广告,金融广告,房地产广告,招生招聘广告,其他广告。 根据广告标志整理后,得到市民关注的广告类型频数分布。,市民关注的广告类型频数分布,Ch3 统计的整理与描述 3.2 品质数据的整理与描述(new),3.2.1 定类数据的整理与描述,三、频数与频率分布 解:这里的标志变量为“广告类型”,这是个定类变量,不同类型

52、的广告就是变量值。即 x1=“商品广告”,x2=“服务广告”,x3=“金融广告”, x4=“房地产广告”,x5=“招生招聘广告”,x6=“其他广告”。 归类计算了200个市民的关心广告数据,求得了人数变量序列fi,即 f1=112,f2=51,f3=9,f4=16,f5=10,f6=2。 通过数据的整理,我们可以知道,某市居民对广告关注的重心归属于哪一类,以及它的分布结构。,市民关注的广告类型频数分布,Ch3 统计的整理与描述 3.2 品质数据的整理与描述(new),3.2.1 定类数据的整理与描述,四、统计条形图和统计柱形图 用图形显示频数分布,比用频数分布表更加形象和直观。一张好的统计图,

53、往往胜过冗长的文字表述。统计图的类型很多。多数可以用计算机完成。图31是统计图的一种。图31也叫统计条形图。 统计条形图,就是用宽度相同的条形高度或者长度来表示数据的变动。其横轴表示各类别数据的频数或者频率,通常条形的高度或长度表示频数或者频率的大小;而纵轴则表示各个类别。统计条形图可以横置,也可以纵置。横置时称为条形图,纵置时称为柱形图。 绘制条形图时,各类别可放在横轴,也可以放在纵轴。放在横轴时称为条形图,放在纵轴时称为柱形图。,Ch3 统计的整理与描述 3.2 品质数据的整理与描述(new),3.2.1 定类数据的整理与描述,四、统计条形图和统计柱形图 【例3-5】某个学生班级55人,按

54、性别标志归类统计后,得如下统计表。试编制其柱形图。 解:以性别为横坐标,人数或者人数比重为纵坐标,在绘制纵横坐标的刻度后,标出各组别的数值,得某班学生性别分布柱形图3-2。,某班学生性别分组表,Ch3 统计的整理与描述 3.2 品质数据的整理与描述(new),返回,3.2.2 定序数据的整理与描述,一、累计频数和累计频率 前面介绍的定类数据的整理与描述方法,也都适用于定序数据。但有些方法,只适用于定序数据,而不适用于定类数据。 累计频数,就是将各类别的频数逐次累加起来。累计频数有向上累计和向下累计之分。向上累计频数 Si=f1+f2+fi. (3.2.4) 向下累计频数 Sn+1-i=fn+f

55、n-1+fn+1-i. (3.2.5) 通过累计频数,可以很容易地看出某一类别以下或者以上的频数之和。 用同样的方法,可以推广出累计频率的概念。累计频率也存在着向上累计和向下累计之分。,Ch3 统计的整理与描述 3.2 品质数据的整理与描述(new),3.2.2 定序数据的整理与描述,一、累计频数和累计频率 【例3-6】在一项有关住房问题的研究中,研究人员在某城市随机调查了300户居民,其中的一个问题是“您对您目前的住房状况是否满意?” 非常不满意,不满意,一般,满意,非常满意。 根据满意程度标志,整理后得到了市民对住房状况评价的频数分布。,市民对住房状况的评价频数分布,Ch3 统计的整理与描

56、述 3.2 品质数据的整理与描述(new),3.2.2 定序数据的整理与描述,一、累计频数和累计频率 解:这里的标志变量为“满意程度”, “满意程度”是个定序变量,不同“满意程度”值就是标志变量值。即 x1= “非常不满意”,x2=“不满意”,x3=“一般”, x4=“满意”,x5=“非常满意”。 归类计算了300户市民的满意值数据,求得了人数变量序列fi,即 f1=24,f2=108,f3=93,f4=45,f5=30。 同时按Si=f1+f2+fi.计算向上累计户数序列。 通过观察统计表和统计图的表现,我们亦可以知道,某市居民对住房关注的重心在何处。,108,Ch3 统计的整理与描述 3.

57、2 品质数据的整理与描述(new),3.2.2 定序数据的整理与描述,二、累计频数分布图或者累计频率分布图 根据累计频数或者累计频率,可以编制累计频数分布图或者累计频率分布图。,Ch3 统计的整理与描述 3.2 品质数据的整理与描述(new),返回,3.3 数字数据的整理与描述,3.3.1 数据的分组 3.3.2 统计直方图与统计折线图 3.3.3 频率分布的类型,Ch3 统计的整理与描述 3.1 统计数据的预处理(new) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描述(new) 3.4 统计分组(类) 3.5 统计整理的应用(new),返回,3.3.1 数据的分组,一

58、、数据的分组 品质数据的整理与描述方法,可用于数值型数据的整理与描述。但数值型数据还有一些特定的方法,并不适用于品质数据。 数据的分组,也叫统计分组。是指根据统计研究目的,将数据按某种标准划分为不同的组别。 分组后,再计算出各组中出现的次数或频数,就形成了一个频数分布表。 分组的方法有单变量分组和组距变量分组。,Ch3 统计的整理与描述 3.3 数字数据的整理与描述(new),3.3.1 数据的分组,二、单变量分组(1) 就是把数值相等的数据归为一个组,每组赋予一个变量值,然后再计算出各组中的数据个数。这种分组方法,只适用于离散型变量且变量值比较少的场合,如表34所示。,表34某标志单变量分组

59、表,下面结合具体的例子,说明单变量分组的过程和频数分布的编制过程。,Ch3 统计的整理与描述 3.3 数字数据的整理与描述(new),3.3.1 数据的分组,二、单变量分组(2) 【例3-7】某公司50名员工的月工资资料如下。共50个数据,试对其进行单变量分组,并编制其频数分布。(p54) 1200, 2500, 1000, 1200, 800, 1000, 1200, 1500, 1000, 1000, 1500, 800, 1000, 2000, 2500, 1200, 2000, 1200,1200, 1500,1000, 1200, 1000,800, 1200, 1000, 1200

60、, 1200, 1500, 1200, 1200, 800, 1200, 1200, 800, 1200, 1000, 1200, 1000, 1500, 1200, 1500, 2000, 1200, 2000, 1200 ,2000, 2500, 1500, 1200。 解:先对上面的数据进行排序,结果为 800 800 800 800 800 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200

61、 1200 1200 1200 1200 1200 1500 1500 1500 1500 1500 1500 1500 2000 2000 2000 2000 2000 2500 2500 2500。 显然,排序后的结果,构成了一个标志变量序列Xi :i=1,2,50.,Ch3 统计的整理与描述 3.3 数字数据的整理与描述(new),3.3.1 数据的分组,二、单变量分组(3) 然后对Xi分组归类,值相同的归为同一个组,值不同的则归为不同的类,并计数计算各组xi的频数f i,得频数序列f i:i=1,2,6.,如下表3-5。,表35某公司员工工资变量分组表,Ch3 统计的整理与描述 3.3

62、 数字数据的整理与描述(new),3.3.1 数据的分组,二、单变量分组(4) 在此基础上,还可以计算频率、累计频数等等。 观察表3-5,我们可以得到该公司员工的月工资分布特征认识。 但从表3-5也可以看出,在数据较多的情况下,单变量分组由于组数较多,不便于观察数据分布的特征和规律,而且对于连续变量无法采取这种分组方法。 同样的问题,也可以在观察图3-5的特征过程中得出。图3-5是根据某公司员工工资变量分布表做出来的。图3-5的特征并不非常明显。图3-5也叫统计分布竖线图。,Ch3 统计的整理与描述 3.3 数字数据的整理与描述(new),3.3.1 数据的分组,二、单变量分组 【例3-8】表

63、36是某班学生按年龄分组表。共55人,试按年龄标志,对其进行单变量分组,并编制其频数分布图。 解:以年龄为横坐标,人数或者人数比重为纵坐标,在绘制纵横指标的刻度后,标出各组别的数值,得某班学生年龄分布竖线图3-6。,表36 某班学生按年龄分组表,Ch3 统计的整理与描述 3.3 数字数据的整理与描述(new),3.3.1 数据的分组,三、组距变量分组 组距式分组,就是将数据的变化范围,依次划分为若干个半开半闭区间,并将每一区间内的数据归为一个组。区间的最小值称为组下限,区间的最大值称为组上限,区间的宽度称为组距。区间的中心值称为组中值。组中值是该组数据变量的代表值。 设某组的区间为Li,Ui)

64、,它等价于 Li xiUi. i=1,2,n. (3.3.1) 且 Li+1=Ui. i=1,2,n-1. (3.3.2) 则组距 di=Ui-Li. i=1,2,n. (3.3.3) 如果各组的组距均相等,则分组为等距分组;如果其中有一组的组距与其他组不相等,则分组为异距分组。 记各组的组中值为 ,则 (3.3.4) 不论是等距分组还是异距分组,组距分组的结果,一般表示为,Ch3 统计的整理与描述 3.3 数字数据的整理与描述(new),3.3.1 数据的分组,三、组距变量分组,表37某标志组距变量分组表,Ch3 统计的整理与描述 3.3 数字数据的整理与描述(new),3.3.1 数据的分组,三、组距变量分组 半开半闭区间Li,Ui)所对应的组,通常叫做闭口组。闭口组的组中值计算按式(3.3.4)计算。 如果是无限区间(-,Ui)或者(Li,-),则其所对应的组为开口组。开口组通常存在于第1组(-,U1)和第n组(Ln,-)。开口组(-,U1)和(Ln,-)的组中值计算,则应修正为,表37某标志组距变量分组表,下面结合具体的例子,说明单变量分组的过程和频数分布的编制过程。,Ch3 统计的整理与描述 3.3 数字数据的整理与描述(new),3.3.1 数据的分组,三、组距变量分组 【例3-9】某班级80名学生的英语成绩资料如下。试按成绩标志进行组距变量分组,并编制其频数分布。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!