《统计学》教学课件.pps

上传人：za****8 文档编号：17099424 上传时间：2020-11-08 格式：PPS 页数：356 大小：3.77MB

收藏版权申诉举报下载

第1页 / 共356页

第2页 / 共356页

第3页 / 共356页

下载文档到电脑，查找使用更方便

19.9 积分

下载资源

资源描述：

《《统计学》教学课件.pps》由会员分享，可在线阅读，更多相关《《统计学》教学课件.pps（356页珍藏版）》请在装配图网上搜索。

1、统计学教学课件（ PowerPoint）制作人：徐国祥马俊玲赵宁教育部普通高等教育 “ 十一五 ” 国家级规划教材目录统计学第 1章总论第 7章抽样和抽样分布第 6章概率分布第 2章统计资料的搜集和整理第 3章集中趋势和离散趋势第 4章相对指标和指数第 5章概率第 10章非参数统计第 8章参数估计第 9章假设检验第 13章统计决策第 11章相关分析与回归分析第 12章时间序列分析和预测教育部普通高等教育 “ 十一五 ” 国家级规划教材第 1章总论返回总目录统计学的产生和发展最早的统计是作为国家重要事项

2、的记录。从统计学的产生和发展过程来看，可以把统计学划分为三个时期：统计学的萌芽期、统计学的近代期、统计学的现代期返回本章返回总目录 1.统计学的萌芽期统计学的萌芽期始于 17世纪中叶至 18世纪中、末叶，当时主要有国势学派和政治算术学派。（ 1）国势学派国势学派对统计学的创立和发展所作的贡献：为统计学这门学科起了一个至今仍为世界公认的名词“统计学” （ Statistics），并提出了一些仍为统计学者采用的术语：如“显著事项”等。国势学派在研究各国的显著事项时，主要是系统运用对比的方法来研究各国实力和强弱，实际上是“对比”思想的形象化的产物。返回本章返回总目

3、录（ 2）政治算术学派政治算术学派在统计发展史上的作用：在数量统计资料的基础上进行全面系统的总结，并从中提炼出理论原则。同时，政治算术学派第一次有意识地运用可度量的方法，力求把自己的论证建筑在具体的、有说服力的数字上面，依靠数量的观察来解释与说明社会经济生活。主要的代表人物：威廉配第（ W.Petty）、约翰格朗特（ J.Graunt）政治算术学派在很大程度上毕竟还处于统计核算的初创阶段，它只能从简单的、粗略的算术方法来对社会经济现象进行计量和比较。返回本章返回总目录 2.统计学的近代期统计学的近代期始于 18世纪末至 19世纪末，在这时期的统计学主要有数理

4、统计学派和社会统计学派。（ 1）数理统计学派主要代表人：拉普拉斯（ P.S.Laplace）凯特勒（ A.Quetelet）统计学之父，他把统计学发展中的三个主要源泉，即德国的国势学派、英国的政治算术派和意大利、法国的古典概率派加以统一、改造并融合成具有近代意义的统计学，促使统计学向新的境界发展。返回本章返回总目录（ 2）社会统计学派社会统计学派由德国大学教授尼斯（ K.G.A.Knies）首创，主要代表人物为恩格尔（ C.K.E.Engel）和梅尔（ G.V.Mayr）他们认为，统计学的研究对象是社会现象，目的在于明确社会现象内部的联系和相互关系；统计方法应当包括

5、社会统计调查中资料的搜集、整理，以及对其分析研究。同时，他们还认为，在社会统计中，全面调查，包括人口普查和工农业调查，居于重要地位；以概率论为根据的抽样调查，在一定的范围内具有实际意义和作用。返回本章返回总目录 3.统计学的现代期从世界范围看，自 20世纪 60年代以后，统计学的发展有 3个明显的趋势：第一，随着数学的发展，统计学依赖和吸收数学营养的程度越来越迅速；第二，向其他学科领域渗透，或者说，以统计学为基础的边缘学科不断形成；第三，随着应用的日益广泛和深入，特别是借助电子计算机后，统计学所发挥的功效日益增强。返回本章返回总目录统计学的研究对象和研究方法 1.统

6、计的涵义统计一词由英语“ Statistics”翻译过来。统计一般具有统计学、统计工作和统计资料三种涵义。统计工作是对社会、经济以及自然现象的总体数量方面进行搜集、整理和分析的活动过程。统计资料是统计工作的成果，是统计工作过程所取得的各项数字和有关情况的资料，它反映现象的规模、水平、速度和比例关系等等，以表明现象发展的特征。统计工作的好坏直接影响统计资料的数量和质量。统计学是研究如何进行统计工作，是统计工作经验的理论概括，又用理论和方法指导统计工作，推动统计工作的不断提高。随着统计工作的进一步发展，统计学不断地充实和提高，两者是理论和实践的关系。返回本章返回总目录

7、2.统计学的研究对象由统计学的发展史可知，统计学是从研究社会经济现象的数量开始的，随着统计方法的不断完善，统计学得以不断发展。因此，统计学的研究对象为大量现象的数量方面。就其性质来说，它是一门适用于自然现象和社会现象的方法论学科。返回本章返回总目录 3.统计学的研究方法统计学的研究对象和性质决定着统计学的研究方法。统计学的研究方法主要有大量观察法、综合指标法和统计推断法。（ 1）大量观察法是指对研究的事物的全部或足够数量进行观察的方法。大量观察的意义在于可使个体与总体之间在数量上的偏误相互抵消。大量观察法的数学依据是大数定律。大数定律是随机现象出现的基本规律，也是

8、在随机现象大量重复中出现的必然规律。大数定律的本质意义在于，经过大量观察，把个别的、偶然的差异性相互抵消，而必然的、集体的规律性便显示出来。返回本章返回总目录（ 2）综合指标法综合指标就是从数量方面对现象总体的规模及其特征的概括说明。所谓综合指标法，就是运用各种综合指标对现象的数量关系进行对比分析的方法。（ 3）统计推断法在一定置信程度下，根据样本资料的特征，对总体的特征作出估计和预测的方法称为统计推断法。统计推断是现代统计学的基本方法，在统计研究中得到了极为广泛的应用，它既可以用于对总体参数的估计，也可以用作对总体的某些假设检验。返回本章返回总目录统计学的要素

9、和内容 1.统计要素统计的要素包括：总体、样本、推断以及推断的可靠性（ 1）总体就是要调查或统计的某一现象（如工商业中某一经济现象）的全部数据的集合，就任何一个统计问题而言，总体是最基本的要素。（ 2）样本就是从总体中随机抽取的若干数据的子集。返回本章返回总目录就是对以样本所包含的信息为基础，对总体的某些特征作出决策、预测和估计。（ 4）推断的可靠性推断的可靠性测度是统计问题的最重要的要素，也是统计对企业决策最重要的贡献，它使统计的推断与“算命”截然分开。（ 3）推断统计问题的 4个要素小结：明确调查的总体；从总体中抽取样本并对样本的信息加以分析；根据样本信

10、息对总体作出推断；对推断的可靠性加以测度。返回本章返回总目录 2.统计学的内容统计学的内容由描述统计和推断统计组成。（ 1）描述统计就是指如何从一直的观察资料，搜集、整理、分析、研究并提供统计的资料的理论和方法，用以说明研究现象的情况和特征。描述统计包括各种数据处理，主要是用来总括或描述数据的重要特征，而不必深入一层地去试图推论数据本身以外的任何事情。其主要作用就是通过对现象进行调查，然后将所得到的大量数据加以整理、简缩、制成统计图表，并就这些数据的分布特征计算出一些概括性的数字。返回本章返回总目录（ 2）推断统计是指凭样本资料来推断总体特征的技术和方法。推断统计

11、可以利用样本资料来代替总体资料，在观察资料的基础上深入一步地分析、研究和推断，以推知资料本身以外的情况和数量关系，从而对不肯定的事物作出决断，为进行决策提供数据依据。推断统计主要有两种类型，即参数估计和假设检验。必须指出，描述统计是推断统计的前提，而推断统计是描述统计的发展。返回本章返回总目录统计在管理决策中作用的流程图管理问题的提出现实问题管理问题的确立统计问题的提出管理问题的解决管理问题的答案统计问题的答案统计分析新问题返回总目录返回本章第 2章统计资料的搜集和整理返回总目录统计调查的概念和方案的设计统计调查就是对统计资料的搜集。它是

12、根据统计研究的目的和要求，有组织、有计划地向调查对象搜集原始资料和次级资料的过程。原始资料又称为初级资料，是指为了研究某个问题而进行实地观察或通过调查所获得的第一手资料。次级资料是指借用原来已经加工的现成资料。由于次级资料一般都是从原始资料过渡而来的，所以统计调查所搜集的资料主要是指原始资料。统计调查按照资料的组织方式不同，可以分为专门调查和统计报表两类。 1. 统计调查的概念返回本章返回总目录一个完整的统计调查方案，应该包括以下五个方面的内容。 2. 统计调查方案的设计（ 1）确定调查的目的（ 2）确定调查对象、调查单位和填报单位这是制定统计调查方案的首要问题

13、。即首先要明确所搜集的资料要解决什么问题。调查对象是被研究对象的总体。调查单位是指构成总体的每一个单位。填报单位是指受征集资料的单位。返回本章返回总目录（ 3）明确调查项目和制定调查表格（ 4）确定调查时间（ 5）制定调查的组织实施计划调查项目是进行调查时要向被调查者所要询问的问题。调查表是把确定好的调查项目按一定的逻辑顺序排列在一定的表格上，凡是以文字作为答案的，可以采取问答式；凡是以数字作为答案的，则必须制定调查表。调查时间包含两个方面的含义：一是调查资料所属的时间；二是调查工作的起止时间。返回本章返回总目录统计调查的方式和方法 1. 专门调查是指为了

14、某些特定目的而专门进行的调查。这种调查多属一次性调查，一般有普查、重点调查、抽样调查和典型调查四种。（ 1）普查是专门组织的一次性全面调查。普查所搜集的资料表明某一现象在某一时点或某一时期的情况，时间性要求很强。一、统计调查的方式返回本章返回总目录（ 2）重点调查是指在调查对象中选择一部分重点单位进行调查，借以了解总体基本情况的一种非全面调查。重点调查既可以用于经常性调查，也可以用于一次性调查。重点单位是指在总体中具有举足轻重的单位，这些单位数量小，但是它们调查的标志值在总体指标值中占有绝大的比重。（ 3）抽样调查是指根据随机原则从调查总体中抽取部分单位进行观

15、察并根据其结果推断总体数量特征的一种非全面调查的方法。（ 4）典型调查是指根据调查的目的和要求，在对研究对象进行全面分析的基础上，有意识地选择部分有代表性的单位进行调查，它是一种非全面调查。返回本章返回总目录抽样调查、重点调查和典型调查之间是有区别的：最大的不同点是，抽样调查是从总体中随机地抽取部分单位尽心调查，而重点调查和典型调查则是从总体中有意识地选择部分单位作为调查的对象。 2. 统计报表统计报表是我国搜集统计资料的主要方式之一，是按照国家有关法规的规定，自上而下地统一布置，自下而上地逐级提供统计资料的一种统计调查方法。返回本章返回总目录统计报表的分类：

16、按调查范围的不同：分为全面和非全面统计报表按报表内容和实施范围的不同：分为国家统计报表、部门统计报表和地方统计报表按保送周期长短：分为日报、旬报、月报、季报、半年报和年报按填报单位的不同：分为基层统计报表和综合统计报表统计报表的资料来源于基层单位的原始记录。从原始记录到统计报表，中间还要经过统计台账和企业内部报表。返回本章返回总目录 1. 直接观察法是指调查人员到现场对调查对象进行观察、计量和登记以取得资料的方法。二、统计调查的方法 2. 报告法是指报告单位以各种原始记录和核算资料为依据，向有关单位提供统计资料的方法。返回本章返回总目录 3. 采访法

17、是指调查员和应答者之间的一种对话。目的在于准确地搜集资料。它主要是按照事先印刷好的调查表由调查员逐一提问的方法进行的调查。 4. 邮寄调查法是指通过邮政系统分发和收回调查表的调查方法，它是一种典型的被调查者自填法。返回本章返回总目录问卷的设计 1. 问卷的概念和作用问卷，就是有问有答的调查表。问卷调查的作用在于：（ 1）可以使调查研究规范化。（ 2）可以使调查研究程序化。（ 3）可以使调查研究科学化。返回本章返回总目录 2. 问卷的基本要素问卷的基本要素有四个：前言、问题和答案、编码、资料登录地址。（ 1）前言，是给应答者的简短信函，一般写在问卷的首页或

18、封面上。（ 2）问题和答案，是问卷的核心内容。（ 3）编码，就是用自然数给各种答案编上号码。（ 4）登录地址，是指明每一项资料在汇总时，登录在什么地方，实际上起着资料索引的作用。返回本章返回总目录 3. 设计问卷时应注意的问题（ 1）对每个问题和答案的设计，应充分考虑到问题的统计方法。（ 2）提问的意义要准确、清楚。（ 3）问题要适用于调查对象的最低文化程度。（ 4）问题应当短小，便于作明确的答复。（ 5）问题的排列应当具有逻辑性。（ 6）对敏感性问题设计问卷时应遵守保密的原则。返回本章返回总目录统计分组 1. 统计分组的意义统计分组就是根据统计研究的需要，

19、将统计总体按照一定的标志区分为若干组成部分的一种统计方法。统计分组的作用在于：（ 1）划分现象的类型，并反映各类型组的数量特征；（ 2）按照某一标志将性质不同的单位进行分组，以说明现象的内部结构；（ 3）通过分组可以揭示现象与现象之间的依存关系。返回本章返回总目录 2. 统计分组的标志在进行统计分组时，最关键的问题就是如何选择分组的标志和确定各组的界限。分组标志，是将总体区分为不同组别的标准和根据。分组标志有品质标志和数量标志 2种。（ 1）按品质标志分组就是按事物的品质特征进行分组。（ 2）按数量标志分组就是按事物的数量特征进行分组。返回本章返回总目录 3

20、. 统计分组体系为了从不同侧面反映总体的特征，就必须运用几个标志对总体进行分组，形成一个完整的体系，这就是统计分组体系。统计分组体系有以下两种不同的形式：（ 1）平行分组体系如果总体按照一个标志进行分组，就称为简单分组。同一总体的几个简单分组按某一规定排列起来就构成一个平行分组体系。按性别分组男女按民族分组汉族组藏族组回族组按年龄分组 0 6岁组 7 17岁组 18 59岁组 60岁以上组返回本章返回总目录（ 2）复合分组体系如果总体同时按两个或两个以上的标志层叠起来分组，就称为复合分组，由复合分组形成的分组系列就称为复合分组体系。高等学校学生总体文

21、科学生组本科学生组专科学生组理科学生组本科学生组专科学生组男生组女生组男生组女生组男生组女生组男生组女生组返回本章返回总目录频数分布 1. 频数分布的概念在统计分组的基础上，将总体中所有单位按一定标志进行分组整理，形成总体中各单位数在各组间的分布，称为频数分布，又称分布数列，它是统计整理的结果。分布在各组的个体单位数称为频数，又称次数。各组次数与总次数之比称为频率，又称为比率。根据分组标志特征的不同，分布数列可分为属性分布数列和变量分布数列两种。返回本章返回总目录（ 1）属性分布数列是指按品质标志分组所形成的分布数列，简称品质数列。对于

22、品质数列来讲，如果分组标志选择得好、分组标准定得恰当，则事物的差异就表现得比较明确，总体中各组如何划分就较易解决。属性分布数列一般也比较稳定，通常均能准确地反映总体的分布特征。返回本章返回总目录（ 2）变量分布数列是指按数量标志形成的分布数列，简称变量数列。变量数列往往因人的主观认识不同而不同，因此，按同一数量标志分组是有出现多种分布数列的可能。变量数列按照用以分组的变量的表现形式，可以分为单项式变量数列和组距变量数列。单项式变量数列是指数列中每个组的变量值都只有一个，即一个变量值就代表一组。单项式变量数列一般是在离散型变量变异幅度不太大的情况下所采用。组距式变量数

23、列是指按一定的变化范围或距离进行分组的变量数列。编制组距数列适用于变量值个数较多、变动范围较大的资料。返回本章返回总目录 2. 频数分布表的编制（ 1）整理原始资料：确定最大最小值，并计算全距（ 2）确定变量数列的形式：对于离散型变量，可以按一定的次序一一列举数值；对于连续型变量，不能编制单项式变量数列，而只能贬值组距式变量数列。（ 3）编制组距式变量数列应注意的问题确定组距：组距的大小要适度，要能正确地反映总体的分布特征及其规律。如果资料分布比较均匀，就可采用等距分组，否则应采用不等距分组。确定组限：基本原则是，按这样的组限分组后，要能是性质相同的单位归入

24、同一组内，使不同性质的单位按不同的组别划分。返回本章返回总目录（ 4）频数分布表的具体编制 3. 频数分布表示方法频数分布表示方法主要有列表法和图示法（ 1）列表法即用统计表来表示频数分布，并可列入累计频数。（ 2）图示法即用统计图形来表示频数分布的方法。常用的有直方图、折线图和曲线图三种。返回本章返回总目录统计汇总方法和统计表 1. 统计汇总的组织方法统计汇总的组织方法基本上有两种：逐级汇总法和集中汇总法。（ 2）集中汇总法是一种把全部调查资料集中到某一机构进行一次性汇总的方法。（ 1）逐级汇总法就是一种从基层取得调查资料，按照一定的领导系统，自下而

25、上逐级整理综合的方法。返回本章返回总目录 2. 统计汇总的技术方法在我国的统计实践中，常用的有手工汇总和电子计算机汇总两种。 3. 次级资料的汇总整理方法从统计角度来讲，对刺激资料的汇总整理主要有三种方法：调整法、推算法、再分组。返回本章返回总目录 4. 统计表统计表是纵横线交叉所组成的一种表格，表格内所列的是整理后系统的统计资料。其优点在于：资料易于条理化，简单明了，且可以节省大量文字叙述，便于比较分析、检查数值的完整性和准确性。（ 2）统计表的内容统计表是由总标题、横行标题、纵栏标题、纵横表格线和数字资料等基本内容构成。（ 1）统计表的形式统计表分为

26、主词栏和宾词栏两部份。返回本章返回总目录第 3章集中趋势和离散趋势返回总目录集中趋势的测度集中趋势是对频数分布资料的集中状况和平均水平的综合测度。而离散趋势是对频数分布资料的差异程度和离散程度的测度，用来衡量集中趋势所册书之的代表性，或者反映变量值的稳定性和均匀性。常用来表达数列集中趋势的测度有算术平均数、调和平均数、几何平均数、中位数和众数。这些测度在统计学中也称为平均指标或平均数，可以用来反映标志值的典型水平和标志值分布的中心位置或集中趋势。返回本章返回总目录 1. 算术平均数算术平均数是平均指标中最重要的一种，一般不特别说明时，所称的 “ 平均数

27、 ” 就是指算术平均数，其定义的公式为：算术平均数总体标志总量总体单位总量计算算术平均数时，标志总量和单位总量必须属于同一总体，分子分母所包含的口径必须一致。否则，计算出来的平均数指标便失去了科学性。算术平均数，可以分为简单算术平均数和加权算术平均数两种。返回本章返回总目录（ 1）简单算术平均数将总体的各个单位标志值简单相加，然后除以单位个数，求出的平均标志值，叫做简单算术平均数。简单算术平均数的计算公式为： N X N XXXXX n i i n 1321 式中： X iX N 算术平均数第 i个单位的标志值， i 1， 2， 3, ,n 总体单位数总和返回本章

28、返回总目录（ 2）加权算术平均数加权算术平均数的计算公式为： n i i n i ii f fX X 1 1 式中： )( ffi 或）（或 XX i n )( 1 XffXn i ii 或标志值出现的次数或权数标志值组数标志总量 )( XXi 或返回本章返回总目录 2. 调和平均数调和平均数又称 “ 倒数平均数 ” ，它是根据各标志值的倒数来计算的平均数，即各个标志值倒数的算术平均数的倒数。调和平均数也分简单调和平均数和加权调和平均数。简单调和平均数的计算公式为： N XXXX X n H 1111 1 321 X N XXXX NX n H 11111 321

29、即设 m为权数，则加权调和平均数的计算公式为： n n n H mmmm X m X m X m X m X 321 3 3 2 2 1 1 1 n i i i n i i n n n H X m m X m X m X m X m mmmmX 1 1 3 3 2 2 1 1 321则返回本章返回总目录 3. 几何平均数几何平均数是计算平均比率和平均速度最适用的一种方法。几何平均数有简单几何平均数和加权几何平均数之分。 Nn nG XXXXXX 321 N n简单几何平均数是次方根。个标志值连乘积的其计算公式为： N 1 2 311l n l n l n l n l n l n

30、G nX X X X X XNN 在用几何平均数法计算平均数时，如果大于 2，可采用对数法计算。计算公式为：返回本章返回总目录需要指出的是，当把几何平均数应用于经济现象时，必须注意经济现象本身的特点。只有当标志总量表现为各个标志值的连乘积时，才适合采用几何平均数方法来计算平均标志值。一般来说，计算社会经济现象在各个时期的平均发展速度时，要采用几何平均数。例如，工农业总产值年平均发展速度、全国人口年平均发展速度等。返回本章返回总目录 4. 中位数中位数是一种按其在数列中的特殊位置而决定的平均数。把总体各单位标志值按大小顺序排列后，处在中点位次的标志值就是中位数，它将

31、全部标志值分成两个部分，一半标志值比它大，一半标志值比它小，而且比它大的标志值个数和比它小的标志值个数相等。要求得中位数，首先要确定中位数的位次。未分组资料时，中位数位次 2 1N N N 当总体位数为奇数时，中位数就是中位数位次上的那个数据；当为偶数时，中位数是中位数位次上 2项数据的算术平均数。返回本章返回总目录分组资料时，中位数位次 2 f 可以利用中位数所在组的下限来测算中位数，即中位数的下限公式为： if Sf LM m m c 12 cM L mf f i 1mS 中位数中位数所在组的下限中位数所在组的次数总次数即各组次数总和小于中位数组的各组次

32、数之和中位数所在组的组距式中：返回本章返回总目录也可以利用中位数所在组的上限来测算中位数，即中位数的上限公式为： if Sf UM m m c 12 式中： U 中位数所在组的上限 1mS 大于中位数组的各组次数之和中位数最大的特点是：它是序列中间 1项或 2项的平均数，不受极端值的影响，所以在当一个变量数列中含有特大值与特小值的情况下，采用中位数较为适宜。正式由于中位数的这一特点，在统计研究中，当遇到掌握统计资料不多而且各标志值之间差异程度较大或频数分布有偏态时，为避免计算标志值所得的算术平均数偏大或偏小，就可利用中位数来表示现象的一般水平。返回本章返回总目录

33、5. 众数众数是一种位置平均数。众数是总体单位中，标志值出现次数最多的那个数值。为了确定众数的具体数值，可以利用下限公式或上限公式加以计算。计算众数的下限公式为： i dd dLM 21 10 式中： 0M 众数 L 1d 2d i 众数组的下限众数组次数与上一组次数之差众数组次数与下一组次数之差众数组的组距返回本章返回总目录计算众数的上限公式为： i dd dUM 21 10 式中： U 众数组的上限众数的计算只适用于单位数较多，且存在明显的集中趋势的情况，否则，计算众数时没有意义的。返回本章返回总目录离散趋势的测度离散趋势的测度，在统计学中也称为指标变异指

34、标，是用来描述数列中指标值的离散趋势与离散程度的。常用的标志变异指标有极差、平均差和标准差等。 1. 极差极差是指一个数列中两个极端值即最大值与最小值之间的差异。根据极差的大小能说明标志值变动范围的大小。其计算公式为：极差最大标志值最小标志值根据组距数列求极差的计算公式为：极差最高组上限最低组下限在实际工作中，极差可以用于检查产品质量的稳定性和进行质量控制。在正常生产的条件下，产品质量稳定，极差在一定范围内波动，若极差超过给定的范围，就说明有不正常情况产伤。但极差受到极端是的影响，测定结果往往不能反映数据的实际离散程度。返回本章返回总目录 2. 四分位差四分位差是根

35、据四分位数计算的。首先把变量各单位标志值从小到大排序，再将数列四等分，处于四分位点位次的标志值就是四分位数，记作，为第一四分位数（也称为下四分位数），为第二四分位数，就是中位数，为第三四分位数。 1 2 3M M M，，四分位差的计算公式为： 31 2 MM四分位差 1M 2M eM 3M 四分位差的计算步骤为：先寻找四分位数，然后根据四分位差的计算公式计算。返回本章返回总目录四分位数的计算（ 1）由未分组资料计算四分位数。 1 1 4 nM 的位次是整数，则位次对应的标志值即为相应的四分位数。首先确定四分位数的位次，再找出对应位次的标志值

36、即为四分位数。设样本容量为 n ， 3 3 ( 1 ) 4 nM 的位次 14n 不是整数，则用 1 4n 相邻位次上的标志值的加权算术平均数插值法计算四分位数。返回本章返回总目录（ 2）由分组资料计算四分位数。 14 ( 1 , 2 , 3 ) mi i i i mi if S M L d if iL mif f id 1miS 第四分位数所在组的下限；第四分位数所在组的次数；总次数，即各组次数总和；小于第四分位数所在组的各组次数之和；第四分位数所在组的组距。式中：第四分位数的计算公式为： i i i i i 返回本章返回总目录四分位差是对极差的一

37、种改进。与极差相比，四分位差因不受极值的影响，在反映数据的离散程度方面比极差准确，具有较高的稳定性；同时，对于存在开口的组距数列，不能计算极差，但可以计算四分位差。四分位差与极差相比较：四分位差和极差一样，不能充分利用数据的全部信息，也无法反映标志值的一般变动。返回本章返回总目录 3. 平均差平均差是各单位标志值对平均数的离差绝对值的平均数。平均差仅反映总体各单位标志值对其平均数的平均离差量。平均差越大，表明标志变异程度越大；反之，则表明标志变异程度越小。平均差通常用字母表示。 .DA 未分组资料时，其计算公式为： N XX DA . 分组资料时，其计算公式为：

38、 f fXX DA . 返回本章返回总目录 4. 方差和标准差未分组资料时，方差的公式为： N XX 22 标准差的公式为： N XX 2 分组资料时，方差的公式为：标准差的公式为： f fXX 22 f fXX 2 式中： X N 算术平均数总体单位数返回本章返回总目录 f 各组次数 2 方差标准差 X 变量值需要指出的是，是总体标准差，而样本标准差为。 N XX 2 1 2 n XXS 当样本较大时，由于几乎等于，因此常用公式代替公式来计算样本标准差 S，并用于估计总体标准差。 11n n 1 n XX 2 1 2 n XX 1 2 n XXS n X

39、XS 2 在小样本的情况下，较为总体标准差的更优良的估计量。返回本章返回总目录 5. 离散系数上述的各种标志变异度指标，都是对总体中各单位指标值变异测定的绝对量指标。而离散系数是测定总体中各单位标志值变异的相对量指标，以消除不同总体之间在计量单位、平均水平方面的不可比因素。常用的离散系数主要有平均差离散系数和标准差离散系数 .DAV V 其公式分别为： %100. XDAV DA %100 XV 返回本章返回总目录 6. 偏度和峰度（ 1）偏度偏度是用来反映变量数列分布偏斜程度的指标。变量数列的单峰钟形分布对称分布非对称分布（或称偏态分布）右偏分布

40、（或称正偏分布）左偏分布（或称负偏分布）返回本章返回总目录偏态分布情况下平均数、中位数、众数有近似的关系： 2 ( )e o eM M X M X f X f eM oM X f eoX M M XeM 对称分布右偏分布左偏分布利用平均数、中位数、众数的位置关系大致判断分布是否对称：返回本章返回总目录 oM X eMoM X eoX M M eoX M M OXMSK 用偏度系数准确地测定分布的偏斜程度和进行比较分析。 Pearson 偏度系数，用 SK 表示。 SK 为无量纲的系数，通常取值在 -3+3之间。绝对值越大，说明分布的倾斜程度越大。 SK =0 对称分布

41、 SK 0 右偏分布 SK 0 右偏分布，值越大，右偏程度越高； 3 尖顶曲线，值越大，顶部尖峭程度越高； 3 平顶曲线，值越小，顶部越平坦； =1.8 变量数列的曲线呈矩形分布； 5，因此可利用正态近似处理，即认为样本比率的抽样分布近似服从均值和方差的正态分布。将值变换为服从正态分布的 z值，即将例题中的数据代入上述公式，得： p 05.0 p nppp /)1(2 p n pp ppz )1( 201.0 02.0 475 )05.01(05.0 05.003.0 1 z 5.2 01.0 025.0 475 )05.01(05.0 05.0075.0 2 z 于是所求得

42、概率为： %1.97)9772.01(9938.0)2()5.2()5.22( zP 返回本章返回总目录两个样本比率之差的抽样分布实例某公司市场研究人员的调查报告表明，在 A市场有 15的人喜欢该公司生产的某种牌号的牙膏，而在 B市场则有 9的人喜欢该产品。如果从 A、 B 两个市场中各抽取由 120人组成的独立随机样本，问样本比率之差的数值大于或等于 0.14的概率有多大？ ) ( BA pp 此例中没有说明总体服从何种分布，但因其样本容量足够大， n1 和 n2 都为 120，因此根据中心极限定理，可认为近似服从正态分布 0 4 17.0120 )09.01(09.0120

43、)15.01(15.0 06.009.015.0 AA AA pp pp 于是所求的概率为： 0 .1 4 0 .0 6( 0 .1 4 ) ( ) 0 .0 4 1 7ABP p p P z 02 74.097 26.01)92.1( zP 计算结果表明值大于或等于 0.14的概率为 2.74%。 )( BA pp 返回本章返回总目录 t 分布、分布和 F 分布 2 t 分布 t 分布是小样本分布，小样本指 n 0.05时 , 考虑有限总体校正系数： 1NnN 返回本章返回本目录总体比率和两个总体比率之差的区间估计 1. 总体比率的区间估计回顾：第 7 章中曾讨论了样本比率 p

44、的抽样分布并指出当 np 和 )1( pn 两者都大于 5 时， p 的抽样分布近似服从平均值为 p 、标准差为 n pp p )1( 的正态分布。实际中常用样本比率 p 来代替 p ，得到标准差的估计值 n pp s p )1( 返回本章返回本目录因此，如果 np 和 )1( pn 两者都大于 5 且 n 相对于总体容量来说很小，则 p 的近似 )%1(100 的置信区间为： 2 ( 1 )pp pz n ，如果所研究的总体是有限的，尤其是抽样的比重较大时，即 05.0 N n 时，就要采用有限总体修正系数，从而 p 的区间估计公式为： 1 ) 1( 2 N nN n pp

45、 zp 返回本章返回本目录 2. 两个总体比率之差的区间估计回顾：第 7 章介绍了当 1n 和 2n 两者都很大即大样本且总体比率不太接近 0 或 1 时， 2 个独立样本的 21 pp 的抽样分布近似服从正态分布，其平均值为 21 pp ，标准差可以通过下面的式子来估计： 2 22 1 11 ) 1( ) 1( 21 n pp n pp S pp 两个总体比率之差的区间估计 1 1 2 2 12 122 ( 1 ) ( 1 )() p p p pp p z nn 返回本章返回本目录总体比率的区间估计列表待估计参数已知条件置信区间总体比率 p 两个总体比率之差 p1-p2

46、2 (1 )pppz n 1 )1( 2 N nN n ppzp np和 nq都大于 5, 并且 n相对 N很小对有限总体， np和 nq都大于 5, 且 n/N0.05 1 1 2 2 12 122 ( 1 ) ( 1 )() p p p pp p z nn 两个总体样本都是大样本返回本章返回本目录样本容量的确定决定样本大小的因素：（ 1）总体方差值大小的影响。总体方差大，抽样误差大，则应多抽一些样本容量，反之可以少抽一些。可以做试验性调查或根据历史资料来估计总体方差。 2 （ 2）可靠性程度的高低。要求的可靠性越高，所需的样本容量越大，即为获得所需精度而指定的概率越大，

47、所需的样本容量就越大。（ 3）允许误差的大小。若允许误差可以大一些，则样本容量可以少一些，反之，样本容量要求多一些。返回本章返回本目录 1. 估计总体平均数时样本容量的确定重复抽样条件下 22 2 2 x z n ，表示允许误差；不重复抽样时 22 2 2 2 2 2 ( 1 ) x Nz n Nz 返回本章返回本目录 2. 估计总体比率时样本容量的确定 2 2 2 (1 ) p z p p n 2 2 22 2 ( 1 ) ( 1 ) ( 1 )p N z p p n N z p p 重复抽样条件下不重复抽样时在上述两个公式中都要知道总体比率 p ，但一般 p 是未知

48、的。所以要先估计 p . 返回本章返回本目录 p 的估计方法主要有：（ 1）用以往的资料估计 p （ 2 ）在正式抽样之前，先抽一个试验样本，用此样本比率 p 来代替 p 。（ 3）当对某一总体比率有很大把握时，可用它作为的估计值（ 4 ）如果没有任何资料，则可以令 5.0p ，因为此时 )1( pp 这一乘积达到最大，从而所需的样本也比较多，推断也比较可靠。 p 返回本章返回本目录正态总体方差和两个正态总体方差比的区间估计 22 2 22 1 ( 1 ) ( 1 )n s n s 22 11 2 2 2 2 1 2 2 2 1 22 ss ss FF 正态总体方差

49、的区间估计两个正态总体方差比的区间估计返回本章返回本目录第 9章假设检验返回总目录 1. 假设检验就是对总体参数所作的一个假设开始，然后搜集样本数据，计算出样本统计量，进而运用这些数据测定假设的总体参数在多大程度上是可靠的，并作出承认还是拒绝该假设的判断原假设 H0（ Null hypothesis）备择假设 H1（ Alternative hypothesis ） 80 :0 H 80 :1 H 返回本章返回总目录原假设 H0是关于总体参数的表述，它是接受检验的假设备择假设 H1是当原假设被否定时另一种可成立的假设原假设和备择假设是相互对立的，在任何情况下只能

50、有一个成立。如果接受 H 0就必须拒绝 H1；拒绝 H0就必须接受 H1 就对总体平均数的假设而言有三种情况： 0 0 （ 2） H0：； H1： 0（ 1） H0： 0 返回本章返回总目录； H1： 0 0 ； H1：（ 3） H0： 2. 第 I类错误、第 II类错误对假设 H0采取的行动自然状态 H0为真 H0为伪接受 H0 决断正确第 II类错误拒绝 H0 第 I类错误决断正确在假设检验中，犯第 I 类错误（弃真错误）的概率为，称其为显著性水平；犯第 II 类错误（取伪错误）的概率为。返回本章返回总目录越大，就也有可能犯第 I 类错误，即越有可

51、能否定真实的原假设。越大，就越有可能犯第 II 类错误，即越有可能接受非真的原假设。我们希望犯这两类错误的概率都尽可能小，但在一定样本容量下，减少会引起增大，减少会引起增大。在假设检验中，我们一般事先规定允许犯第 I 类错误的概率，然后尽量减少犯第 II 类错误的概率。返回本章返回总目录 3. 双侧检验和单侧检验对总体平均数的假设检验可分两类，即双侧检验和单侧检验。双侧检验当 H 0 ： 0 ； H 1 ： 0 时，就必须用双侧检验，其目的是观察在规定的显著性水平下所抽取的样本统计量是否显著地高于或低于假设的总体参数。标准正态曲线下两个尾部面积各占

52、2 ，这样就有了两个拒绝区域。如果样本统计量落在这两个区域内，就拒绝原假设。注意：在双侧检验中差距是不分正负的。返回本章返回总目录双侧检验的接受区域和拒绝区域 1 的面积拒绝区域拒绝区域 2 的面积 2 的面积接受区域返回本章返回总目录单侧检验单侧检验分为左侧检验和右侧检验两种，它们都只有一个拒绝域左侧检验一般而言，如果假设是： H 0 ： 0 ； H 1 ： 0 就用左侧检验 1 的面积拒绝区域的面积接受区域返回本章返回总目录右侧检验右侧检验适用于原假设 H 0 ： 0 ，而备择假设 H 1 ： 0 的情况，只要样本平均数显著地超过

53、假设的总体参数，就拒绝原假设 H 0 而接受备择假设 H 1 。接受区域 1 的面积拒绝区域 2 的面积返回本章返回总目录（ 1）根据研究问题的需要提出假设，包括原假设和备择假设。（ 2）找出检验的统计量及其分布。（ 3）规定显著性水平，即选择所允许犯第类错误的概率。（ 4）确定决策规则。（ 5）根据样本数据计算统计量的数值并由此作出决策。 4. 假设检验的一般程序返回本章返回总目录检验步骤建立总体假设 H0， H1 抽样得到样本观察值 1 2 选择统计量确定 H0为真时的抽样分布 3 根据具体决策要求确定确定临界点 C和检验规则计算检验统计量的数值

54、比较并作出检验判断 7 4 5 6 返回本章返回总目录 1 总体为正态分布且方差已知检验统计量为 xz n ，服从标准正态分布。总体平均数的假设检验条件检验统计量拒绝域 H0、 H1 (1) H0： =0 H1： 0 2 2 z (2) H0： 0 H1： 0 (3) H0： 0 H1： 0 z 0 z n xZ 0 正态总体 2已知 2Z2Z 0 0 Z Z 返回本章返回总目录 t 拒绝域 H0、 H1 (1) H0： =0 H1： 0 (2) H0： 0 H1： 0 (3) H0： 0 H1： 0 t 0 ns xt 0 正态总体 2未知 (n 30) 条件检验统

55、计量 0 2 2 2t 2t0 t 2 总体为正态分布且 30n ，但方差未知检验统计量为 xt sn ，服从自由度为 1n 的 t 分布。 t t 返回本章返回总目录条件检验统计量拒绝域 H0、 H1 (1) H0： =0 H1： 0 (2) H0： 0 H1： 0 (3) H0： 0 H1： 0 z 0 2 2 2Z 2Z0 n xZ 0 nS xZ 0 非正态总体 n30 2已知或未知 z 0 z Z Z 3 总体为非正态分布 30n 检验统计量为 xz n ，近似服从正态分布。返回本章返回总目录条件检验统计量拒绝域 H0、 H1 (1) H0： 1=2 H

56、1: 1 2 2 2 z (2) H0： 1 2 H1: 1 2 (3) H0： 1 2 H1： 1 2 z 0 z 0 2Z 2Z0 2 2 2 1 2 1 21 nn xxZ 两个正态总体 21 22, 已知 Z Z 两个总体平均数之差的假设检验 1两个正态总体且方差已知检验统计量为： 12 12 22 12 12 ( ) ( )xxz nn ，服从标准正态分布。返回本章返回总目录条件检验统计量拒绝域 H0、 H1 (1) H0: 1 = 2 H1: 1 2 2 2 t (2) H0: 2 H1: 2 (3) H0： 1 2 H1： 1 2 t t 0 2t 2t0 两个正

57、态总体 21 2 2,未知，但相等 221 1 2 2 12 ( 1 ) ( 1 ) 2p n S n SS nn 0 12 12 11 p xxt S nn 2 两个正态总体，其方差未知但相等检验统计量为： 12 12 22 12 ( ) ( ) pp xx t ss nn 其中， 22 2 1 1 2 2 12 ( 1 ) ( 1 ) 2p n s n ss nn 服从自由度为 12 2nn 的 t 分布。返回本章返回总目录 t t 条件检验统计量拒绝域 H0、 H1 (1) H0： 1 = 2 H1： 1 2 (2) H0： 1 2 H1： 1 2 (3) H0： 1 2

58、 H1： 1 2 z 0 2 2 2Z 2Z0 两个非正态体 n130 n230 21 22, 已知或未知 2 2 2 1 2 1 21 nn xxZ 2 2 2 1 2 1 21 n S n S xx Z 0 z z Z Z 3 非正态分布总体且方差未知在 12nn和足够大时，检验统计量 12 12 22 12 12 ( ) ( )xx z ss nn ，近似服从标准正态分布返回本章返回总目录条件检验统计量 H0、 H1 (1) H0： p=p0 H1： pp0 2 2 (2) H0： pp0 H1： p p0 (3) H0： pp0 H1： p p0 z 0 z 0 2Z

59、2Z0 np5 nq5 000(1 )ppZ pp n 拒绝域 z Z Z 1单个总体比率的检验检验统计量为：，服从标准正态分布。 (1 )ppZ pp n 总体比率之差的假设检验返回本章返回总目录条件检验统计量拒绝域 H0、 H1 (1) H0： p1=p2 H1： p1p2 2 z (2) H0： p1 p2 H1： p1 p2 (3) H0： p1 p2 H1： p1 p2 z 0 z 0 2Z 2Z0 n 1p15 n1q15 n2p25 n2q25 21 2211 21 21 )1()1( nn pnpn p n pp n pp pp Z 2 返回本章返回总目录 2两

60、个总体比率之差的检验（）检验两个总体比率是否相等的假设，检验统计量为：其中。 5np 1 2 1 2 12 () (1 ) (1 ) p p p pZ p p p p nn 1 1 2 2 12 n p n pp nn Z Z 总体方差的假设检验条件检验统计量拒绝域 H0、 H1 (1) 2 2 (2) (3) 22 2 0 ( 1)nS 正态总体 22 0 : 0 22 1 : 0 H H 22 0 : 0 22 1 : 0 H H 22 0 : 0 22 1 : 0 H H )1(2 21 na )1(2 na )1(2 2 na )1(21 na 1 单个正态总体方差的假设检验检验统计量为： 2 2 2 ( 1 )ns ，服从自由度为 1n 的 2 分布返回本章返回总目录条件检验统计量拒绝域 H0、 H1 (1) 2 2 (2) (3) 2 2 2 2 2 1 2 1 / / S SF 正态总体 2 2 2 1:1 2 2 2 1:0 H H 22 0 : 1 2 22 1 : 1 2 H H 22 0 : 1 2 22 1 : 1 2 H H )1(21 nF a )1(2 nFa )1( nFa )1(1 nF a 2 两个正态总体方差比的假设检验检验统计量为 2 1 2 2 s F s ，服从

展开阅读全文

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

备案号:蜀ICP备2024067431号-1 川公网安备51140202000466号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知装配图网，我们立即给予删除！

《统计学》教学课件.pps

最新文档

相关资源

相关搜索