《统计学》教学课件.pps

上传人:za****8 文档编号:17099424 上传时间:2020-11-08 格式:PPS 页数:356 大小:3.77MB
收藏 版权申诉 举报 下载
《统计学》教学课件.pps_第1页
第1页 / 共356页
《统计学》教学课件.pps_第2页
第2页 / 共356页
《统计学》教学课件.pps_第3页
第3页 / 共356页
资源描述:

《《统计学》教学课件.pps》由会员分享,可在线阅读,更多相关《《统计学》教学课件.pps(356页珍藏版)》请在装配图网上搜索。

1、 统计学 教 学 课 件( PowerPoint) 制作人:徐国祥 马俊玲 赵宁 教育部普通高等教育 “ 十一五 ” 国家级 规划教材 目 录 统计学 第 1章 总论 第 7章 抽样和抽样分布 第 6章 概率分布 第 2章 统计资料的搜集 和整理 第 3章 集中趋势和离散趋势 第 4章 相对指标和指数 第 5章 概率 第 10章 非参数统计 第 8章 参数估计 第 9章 假设检验 第 13章 统计决策 第 11章 相关分析与回归 分析 第 12章 时间序列分析和预测 教育部普通高等教育 “ 十一五 ” 国家级规划教材 第 1章 总论 返回总目录 统计学的产生和发展 最早的统计是作为国家重要事项

2、的记录。 从统计学的产生和发展过程来看,可以把统计学 划分为 三个时期 : 统计学的萌芽期、统计学的近代期、统计学的现 代期 返回本章 返回总目录 1.统计学的萌芽期 统计学的萌芽期始于 17世纪中叶至 18世纪中、末 叶,当时主要有国势学派和政治算术学派。 ( 1)国势学派 国势学派对统计学的创立和发展所作的贡献:为统计学这 门学科起了一个至今仍为世界公认的名词“统计学” ( Statistics),并提出了一些仍为统计学者采用的术语: 如“显著事项”等。国势学派在研究各国的显著事项时, 主要是系统运用对比的方法来研究各国实力和强弱,实际 上是“对比”思想的形象化的产物。 返回本章 返回总目

3、录 ( 2)政治算术学派 政治算术学派在统计发展史上的作用:在数量统计资料 的基础上进行全面系统的总结,并从中提炼出理论原则。 同时,政治算术学派第一次有意识地运用可度量的方法, 力求把自己的论证建筑在具体的、有说服力的数字上面, 依靠数量的观察来解释与说明社会经济生活。 主要的代表人物 : 威廉 配第( W.Petty)、约翰 格朗特( J.Graunt) 政治算术学派在很大程度上毕竟还处于统计核算的初 创阶段,它只能从简单的、粗略的算术方法来对社会 经济现象进行计量和比较。 返回本章 返回总目录 2.统计学的近代期 统计学的近代期始于 18世纪末至 19世纪末,在这时期 的统计学主要有数理

4、统计学派和社会统计学派。 ( 1)数理统计学派 主要代表人:拉普拉斯( P.S.Laplace) 凯特勒( A.Quetelet) 统计学之父,他把 统计学发展中的三个主要源泉,即德国的国势学派、英国的政治算术 派和意大利、法国的古典概率派加以统一、改造并融合成具有近代意 义的统计学,促使统计学向新的境界发展。 返回本章 返回总目录 ( 2)社会统计学派 社会统计学派由德国大学教授尼斯( K.G.A.Knies)首创,主 要代表人物为恩格尔( C.K.E.Engel)和梅尔( G.V.Mayr) 他们认为,统计学的研究对象是社会现象,目的在于明确社会现 象内部的联系和相互关系;统计方法应当包括

5、社会统计调查中资 料的搜集、整理,以及对其分析研究。同时,他们还认为,在社 会统计中,全面调查,包括人口普查和工农业调查,居于重要地 位;以概率论为根据的抽样调查,在一定的范围内具有实际意义 和作用。 返回本章 返回总目录 3.统计学的现代期 从世界范围看,自 20世纪 60年代以后,统计学的发展有 3个明显的趋势:第一,随着数学的发展,统计学依赖和 吸收数学营养的程度越来越迅速;第二,向其他学科领 域渗透,或者说,以统计学为基础的边缘学科不断形成; 第三,随着应用的日益广泛和深入,特别是借助电子计 算机后,统计学所发挥的功效日益增强。 返回本章 返回总目录 统计学的研究对象和研究方法 1.统

6、计的涵义 统计一词由英语“ Statistics”翻译过来。 统计一般具有统计学、统 计工作和统计资料三种涵义。 统计工作是对社会、经济以及自然 现象的总体数量方面进行搜集、整理和分析的活动过程。统计资 料是统计工作的成果,是统计工作过程所取得的各项数字和有关 情况的资料,它反映现象的规模、水平、速度和比例关系等等, 以表明现象发展的特征。统计工作的好坏直接影响统计资料的数 量和质量。统计学是研究如何进行统计工作,是统计工作经验的 理论概括,又用理论和方法指导统计工作,推动统计工作的不断 提高。随着统计工作的进一步发展,统计学不断地充实和提高, 两者是理论和实践的关系。 返回本章 返回总目录

7、2.统计学的研究对象 由统计学的发展史可知,统计学是从研究社会经济现象 的数量开始的,随着统计方法的不断完善,统计学得以 不断发展。因此, 统计学的研究对象为大量现象的数 量方面 。就其性质来说,它是一门适用于自然现象和社 会现象的方法论学科。 返回本章 返回总目录 3.统计学的研究方法 统计学的研究对象和性质决定着统计学的研究方法。统计学的研 究方法主要有大量观察法、综合指标法和统计推断法。 ( 1)大量观察法 是指对研究的事物的全部或足够数量进行观察的方法。大量观察的意义在于 可使个体与总体之间在数量上的偏误相互抵消。大量观察法的数学依据是大 数定律。大数定律是随机现象出现的基本规律,也是

8、在随机现象大量重复中 出现的必然规律。大数定律的本质意义在于,经过大量观察,把个别的、偶 然的差异性相互抵消,而必然的、集体的规律性便显示出来。 返回本章 返回总目录 ( 2)综合指标法 综合指标就是从数量方面对现象总体的规模及其特征的概括说明。 所谓综合指标法,就是运用各种综合指标对现象的数量关系进行对 比分析的方法。 ( 3)统计推断法 在一定置信程度下,根据样本资料的特征,对总体的特征作出估计 和预测的方法称为统计推断法。统计推断是现代统计学的基本方法, 在统计研究中得到了极为广泛的应用,它既可以用于对总体参数的 估计,也可以用作对总体的某些假设检验。 返回本章 返回总目录 统计学的要素

9、和内容 1.统计要素 统计的要素包括:总体、样本、推断以及推断的可靠性 ( 1)总体 就是要调查或统计的某一现象(如工商业中某一经济现象)的全部数据的 集合,就任何一个统计问题而言,总体是最基本的要素。 ( 2)样本 就是从总体中随机抽取的若干数据的子集。 返回本章 返回总目录 就是对以样本所包含的信息为基础,对总体的某些特征作出决策、预测和 估计。 ( 4)推断的可靠性 推断的可靠性测度是统计问题的最重要的要素,也是统计对企业决策最重 要的贡献,它使统计的推断与“算命”截然分开。 ( 3)推断 统计问题的 4个要素 小结 :明确调查的总体;从总体中抽取样本 并对样本的信息加以分析;根据样本信

10、息对总体作出推断;对推 断的可靠性加以测度。 返回本章 返回总目录 2.统计学的内容 统计学的内容由描述统计和推断统计组成。 ( 1)描述统计 就是指如何从一直的观察资料,搜集、整理、分析、研究并提供统计的资 料的理论和方法,用以说明研究现象的情况和特征。 描述统计包括各种数据处理,主要是用来总括或描述数据的重要特征,而 不必深入一层地去试图推论数据本身以外的任何事情。其主要作用就是通 过对现象进行调查,然后将所得到的大量数据加以整理、简缩、制成统计 图表,并就这些数据的分布特征计算出一些概括性的数字。 返回本章 返回总目录 ( 2)推断统计 是指凭样本资料来推断总体特征的技术和方法。推断统计

11、可以利 用样本资料来代替总体资料,在观察资料的基础上深入一步地分 析、研究和推断,以推知资料本身以外的情况和数量关系,从而 对不肯定的事物作出决断,为进行决策提供数据依据。 推断统计主要有 两种类型 ,即参数估计和假设检验。 必须指出,描述统计是推断统计的前提,而推断统计是描述统计 的发展。 返回本章 返回总目录 统计在管理决策中作用的流程图 管理问题的提出 现实问题 管理问题的确立 统计问题的提出 管理问题的解决 管理问题的答案 统计问题的答案 统计分 析 新问题 返回总目录 返回本章 第 2章 统计资料的搜集和整理 返回总目录 统计调查的概念和方案的设计 统计调查就是对统计资料的搜集。它是

12、根据统计研究的 目的和要求,有组织、有计划地向调查对象搜集原始资 料和次级资料的过程。 原始资料又称为初级资料,是指为 了研究某个问题而进行实地观察或 通过调查所获得的第一手资料。 次级资料是指借用原来已 经加工的现成资料。 由于次级资料一般都是从原始资料过渡而来的,所以统计 调查所搜集的资料主要是指原始资料。统计调查按照资料 的组织方式不同,可以分为专门调查和统计报表两类。 1. 统计调查的概念 返回本章 返回总目录 一个完整的统计调查方案,应该包括以下五个方面的内容。 2. 统计调查方案的设计 ( 1)确定调查的目的 ( 2)确定调查对象、调查单位和填报单位 这是制定统计调查方案的首要问题

13、。即首先要明确所搜集 的资料要解决什么问题。 调查对象是被研究对象的总体。 调查单位是指构成总体的每一个单位。 填报单位是指受征集资料的单位。 返回本章 返回总目录 ( 3)明确调查项目和制定调查表格 ( 4)确定调查时间 ( 5)制定调查的组织实施计划 调查项目是进行调查时要向被调查者所要询问的问题。 调查表是把确定好的调查项目按一定的逻辑顺序排列在一 定的表格上,凡是以文字作为答案的,可以采取问答式; 凡是以数字作为答案的,则必须制定调查表。 调查时间包含两个方面的含义:一是调查资料所属的时间; 二是调查工作的起止时间。 返回本章 返回总目录 统计调查的方式和方法 1. 专门调查 是指为了

14、某些特定目的而专门进行的调查。这种调查多 属一次性调查,一般有普查、重点调查、抽样调查和典 型调查四种。 ( 1)普查 是专门组织的一次性全面调查。普查所搜集的资料表明某一现象在 某一时点或某一时期的情况,时间性要求很强。 一、统计调查的方式 返回本章 返回总目录 ( 2)重点调查 是指在调查对象中选择一部分重点单位进行调查,借以了解总体基 本情况的一种非全面调查。重点调查既可以用于经常性调查,也可 以用于一次性调查。 重点单位是指在总体中具有举足轻重的单位, 这些单位数量小,但是它们调查的标志值在 总体指标值中占有绝大的比重。 ( 3)抽样调查 是指根据随机原则从调查总体中抽取部分单位进行观

15、察并根据其结果推 断总体数量特征的一种非全面调查的方法。 ( 4)典型调查 是指根据调查的目的和要求,在对研究对象进行全面分析的基础上,有 意识地选择部分有代表性的单位进行调查,它是一种非全面调查。 返回本章 返回总目录 抽样调查、重点调查和典型调查之间是有区别的:最大 的不同点是,抽样调查是从总体中随机地抽取部分单位 尽心调查,而重点调查和典型调查则是从总体中有意识 地选择部分单位作为调查的对象。 2. 统计报表 统计报表是我国搜集统计资料的主要方式之一,是按照国家有关法规 的规定,自上而下地统一布置,自下而上地逐级提供统计资料的一种 统计调查方法。 返回本章 返回总目录 统计报表的分类:

16、按调查范围的不同: 分为全面和非全面统计报表 按报表内容和实施范围的不同: 分为国家统计报 表、部门统计报表和地方统计报表 按保送周期长短: 分为日报、旬报、月报、季报、 半年报和年报 按填报单位的不同: 分为基层统计报表和综合统 计报表 统计报表的资料来源于基层单位的原始记录。从原始记录到统计报表, 中间还要经过统计台账和企业内部报表。 返回本章 返回总目录 1. 直接观察法 是指调查人员到现场对调查对象进行观察、计量和登记 以取得资料的方法。 二、统计调查的方法 2. 报告法 是指报告单位以各种原始记录和核算资料为依据,向有 关单位提供统计资料的方法。 返回本章 返回总目录 3. 采访法

17、是指调查员和应答者之间的一种对话。目的在于准确地 搜集资料。它主要是按照事先印刷好的调查表由调查员 逐一提问的方法进行的调查。 4. 邮寄调查法 是指通过邮政系统分发和收回调查表的调查方法,它是 一种典型的被调查者自填法。 返回本章 返回总目录 问卷的设计 1. 问卷的概念和作用 问卷, 就是有问有答的调查表。 问卷调查的作用 在于: ( 1)可以使调查研究规范化。 ( 2)可以使调查研究程序化。 ( 3)可以使调查研究科学化。 返回本章 返回总目录 2. 问卷的基本要素 问卷的基本要素有四个:前言、问题和答案、编码、 资料登录地址。 ( 1)前言,是给应答者的简短信函,一般写在问卷的 首页或

18、封面上。 ( 2)问题和答案,是问卷的核心内容。 ( 3)编码,就是用自然数给各种答案编上号码。 ( 4)登录地址,是指明每一项资料在汇总时,登录在 什么地方,实际上起着资料索引的作用。 返回本章 返回总目录 3. 设计问卷时应注意的问题 ( 1)对每个问题和答案的设计,应充分考虑到问题的 统计方法。 ( 2)提问的意义要准确、清楚。 ( 3)问题要适用于调查对象的最低文化程度。 ( 4)问题应当短小,便于作明确的答复。 ( 5)问题的排列应当具有逻辑性。 ( 6)对敏感性问题设计问卷时应遵守保密的原则。 返回本章 返回总目录 统计分组 1. 统计分组的意义 统计分组 就是根据统计研究的需要,

19、将统计总体按照 一定的标志区分为若干组成部分的一种统计方法。 统计分组的作用 在于:( 1)划分现象的类型,并反映 各类型组的数量特征;( 2)按照某一标志将性质不同 的单位进行分组,以说明现象的内部结构;( 3)通过 分组可以揭示现象与现象之间的依存关系。 返回本章 返回总目录 2. 统计分组的标志 在进行统计分组时,最关键的问题就是如何选择分组 的标志和确定各组的界限。分组标志,是将总体区分 为不同组别的标准和根据。分组标志有品质标志和数 量标志 2种。 ( 1)按品质标志分组 就是按事物的品质特征进行分组。 ( 2)按数量标志分组 就是按事物的数量特征进行分组。 返回本章 返回总目录 3

20、. 统计分组体系 为了从不同侧面反映总体的特征,就必须运用几个标志对总体进 行分组,形成一个完整的体系,这就是统计分组体系。 统计分组体系有以下两种不同的形式: ( 1)平行分组体系 如果总体按照一个标志进行分组,就称为简单分组。同一总体的 几个简单分组按某一规定排列起来就构成一个平行分组体系。 按性别分组 男 女 按民族分组 汉族组 藏族组 回族组 按年龄分组 0 6岁组 7 17岁组 18 59岁组 60岁以上组 返回本章 返回总目录 ( 2)复合分组体系 如果总体同时按两个或两个以上的标志层叠起来分组,就称为 复合分组,由复合分组形成的分组系列就称为复合分组体系。 高等学校 学生总体 文

21、科学生组 本科学生组 专科学生组 理科学生组 本科学生组 专科学生组 男生组 女生组 男生组 女生组 男生组 女生组 男生组 女生组 返回本章 返回总目录 频数分布 1. 频数分布的概念 在统计分组的基础上,将总体中所有单位按一定标志进行分组 整理,形成总体中各单位数在各组间的分布,称为频数分布, 又称分布数列,它是统计整理的结果。分布在各组的个体单位 数称为频数,又称次数。各组次数与总次数之比称为频率,又 称为比率。 根据分组标志特征的不同,分布数列可分为属性分布数列和变 量分布数列两种。 返回本章 返回总目录 ( 1)属性分布数列 是指按品质标志分组所形成的分布数列,简称品质 数列。 对于

22、品质数列来讲,如果分组标志选择得好、分组标准 定得恰当,则事物的差异就表现得比较明确,总体中各 组如何划分就较易解决。属性分布数列一般也比较稳定, 通常均能准确地反映总体的分布特征。 返回本章 返回总目录 ( 2)变量分布数列 是指按数量标志形成的分布数列,简称变量数列。 变量数列往往因人的主观认识不同而不同,因此,按同一数 量标志分组是有出现多种分布数列的可能。 变量数列按照用以分组的变量的表现形式,可以分为单项式变量 数列和组距变量数列。 单项式变量数列是指数列中每个组的变量值都只有一个,即一个 变量值就代表一组。单项式变量数列一般是在离散型变量变异幅 度不太大的情况下所采用。组距式变量数

23、列是指按一定的变化范 围或距离进行分组的变量数列。编制组距数列适用于变量值个数 较多、变动范围较大的资料。 返回本章 返回总目录 2. 频数分布表的编制 ( 1)整理原始资料: 确定最大最小值,并计算全距 ( 2)确定变量数列的形式: 对于离散型变量,可以按一 定的次序一一列举数值;对于连续型变量,不能编制单项式 变量数列,而只能贬值组距式变量数列。 ( 3)编制组距式变量数列应注意的问题 确定组距: 组距的大小要适度,要能正确地反映总体的 分布特征及其规律。如果资料分布比较均匀,就可采用等距 分组,否则应采用不等距分组。 确定组限: 基本原则是,按这样的组限分组后,要能是 性质相同的单位归入

24、同一组内,使不同性质的单位按不同的 组别划分。 返回本章 返回总目录 ( 4)频数分布表的具体编制 3. 频数分布表示方法 频数分布表示方法主要有列表法和图示法 ( 1)列表法 即用统计表来表示频数分布,并可列入累计频数。 ( 2)图示法 即用统计图形来表示频数分布的方法。常用的有直方图、折 线图和曲线图三种。 返回本章 返回总目录 统计汇总方法和统计表 1. 统计汇总的组织方法 统计汇总的组织方法基本上有两种:逐级汇总法和集 中汇总法。 ( 2)集中汇总法 是一种把全部调查资料集中到某一机构进行一次性汇总的方 法。 ( 1)逐级汇总法 就是一种从基层取得调查资料,按照一定的领导系统,自下 而

25、上逐级整理综合的方法。 返回本章 返回总目录 2. 统计汇总的技术方法 在我国的统计实践中,常用的有手工汇总和电子计算 机汇总两种。 3. 次级资料的汇总整理方法 从统计角度来讲,对刺激资料的汇总整理主要有三种 方法:调整法、推算法、再分组。 返回本章 返回总目录 4. 统计表 统计表 是纵横线交叉所组成的一种表格,表格内所列的是 整理后系统的统计资料。其 优点 在于:资料易于条理化, 简单明了,且可以节省大量文字叙述,便于比较分析、检 查数值的完整性和准确性。 ( 2)统计表的内容 统计表是由总标题、横行标题、纵栏标题、纵横表格线和 数字资料等基本内容构成。 ( 1)统计表的形式 统计表分为

26、主词栏和宾词栏两部份。 返回本章 返回总目录 第 3章 集中趋势和离散趋势 返回总目录 集中趋势的测度 集中趋势 是对频数分布资料的集中状况和平均水平的综 合测度。而 离散趋势 是对频数分布资料的差异程度和离 散程度的测度,用来衡量集中趋势所册书之的代表性, 或者反映变量值的稳定性和均匀性。 常用来表达数列集中趋势的测度有算术平均数、调和平均 数、几何平均数、中位数和众数。这些测度在统计学中也 称为平均指标或平均数,可以用来反映标志值的典型水平 和标志值分布的中心位置或集中趋势。 返回本章 返回总目录 1. 算术平均数 算术平均数是平均指标中最重要的一种,一般不特别说明时, 所称的 “ 平均数

27、 ” 就是指算术平均数,其定义的公式为: 算术平均数总体标志总量总体单位总量 计算算术平均数时,标志总量和单位总量必须属于同一总体, 分子分母所包含的口径必须一致。否则,计算出来的平均数 指标便失去了科学性。算术平均数,可以分为简单算术平均 数和加权算术平均数两种。 返回本章 返回总目录 ( 1)简单算术平均数 将总体的各个单位标志值简单相加,然后除以单位个数,求出 的平均标志值,叫做简单算术平均数。简单算术平均数的计算 公式为: N X N XXXXX n i i n 1321 式中: X iX N 算术平均数 第 i个单位的标志值, i 1, 2, 3, ,n 总体单位数 总和 返回本章

28、返回总目录 ( 2)加权算术平均数 加权算术平均数的计算公式为: n i i n i ii f fX X 1 1 式中: )( ffi 或 )(或 XX i n )( 1 XffXn i ii 或 标志值 出现的次数或权数 标志值 组数 标志总量 )( XXi 或 返回本章 返回总目录 2. 调和平均数 调和平均数又称 “ 倒数平均数 ” ,它是根据各标志值的倒数 来计算的平均数,即各个标志值倒数的算术平均数的倒数。 调和平均数也分简单调和平均数和加权调和平均数。 简单调和平均数的计算公式为: N XXXX X n H 1111 1 321 X N XXXX NX n H 11111 321

29、即 设 m为权数,则加权调和平均数的计算公式为: n n n H mmmm X m X m X m X m X 321 3 3 2 2 1 1 1 n i i i n i i n n n H X m m X m X m X m X m mmmmX 1 1 3 3 2 2 1 1 321则 返回本章 返回总目录 3. 几何平均数 几何平均数是计算平均比率和平均速度最适用的一种方法。 几何平均数有简单几何平均数和加权几何平均数之分。 Nn nG XXXXXX 321 N n简单几何平均数是 次方根。 个标志值连乘积的 其计算公式为: N 1 2 311l n l n l n l n l n l n

30、G nX X X X X XNN 在用几何平均数法计算平均数时,如果 大于 2, 可采用对数法计算。计算公式为: 返回本章 返回总目录 需要指出的是,当把几何平均数应用于经济现象时,必须注 意经济现象本身的特点。只有当标志总量表现为各个标志值 的连乘积时,才适合采用几何平均数方法来计算平均标志值。 一般来说,计算社会经济现象在各个时期的平均发展速度时, 要采用几何平均数。例如,工农业总产值年平均发展速度、 全国人口年平均发展速度等。 返回本章 返回总目录 4. 中位数 中位数是一种按其在数列中的特殊位置而决定的平均数。把总 体各单位标志值按大小顺序排列后,处在中点位次的标志值就 是中位数,它将

31、全部标志值分成两个部分,一半标志值比它大, 一半标志值比它小,而且比它大的标志值个数和比它小的标志 值个数相等。 要求得中位数,首先要确定中位数的位次。 未分组资料时 ,中位数位次 2 1N N N 当总体位数 为奇数时,中位数就是中位数位次上的那个数据; 当 为偶数时,中位数是中位数位次上 2项数据的算术平均数。 返回本章 返回总目录 分组资料时 ,中位数位次 2 f 可以利用中位数所在组的下限来测算中位数,即中位数的下 限公式为 : if Sf LM m m c 12 cM L mf f i 1mS 中位数 中位数所在组的下限 中位数所在组的次数 总次数即各组次数总和 小于中位数组的各组次

32、数之和 中位数所在组的组距 式中: 返回本章 返回总目录 也可以利用中位数所在组的上限来测算中位数,即中位数的 上限公式为 : if Sf UM m m c 12 式中: U 中位数所在组的上限 1mS 大于中位数组的各组次数之和 中位数最大的特点是:它是序列中间 1项或 2项的平均数,不受极 端值的影响,所以在当一个变量数列中含有特大值与特小值的情 况下,采用中位数较为适宜。正式由于中位数的这一特点,在统 计研究中,当遇到掌握统计资料不多而且各标志值之间差异程度 较大或频数分布有偏态时,为避免计算标志值所得的算术平均数 偏大或偏小,就可利用中位数来表示现象的一般水平。 返回本章 返回总目录

33、5. 众数 众数是一种位置平均数。众数是总体单位中,标志值出现次 数最多的那个数值。 为了确定众数的具体数值,可以利用 下限公式或上限公式加以计算。 计算众数的下限公式为: i dd dLM 21 10 式中: 0M 众数 L 1d 2d i 众数组的下限 众数组次数与上一组次数之差 众数组次数与下一组次数之差 众数组的组距 返回本章 返回总目录 计算众数的上限公式为: i dd dUM 21 10 式中: U 众数组的上限 众数的计算只适用于单位数较多,且存在明显的集中趋势的 情况,否则,计算众数时没有意义的。 返回本章 返回总目录 离散趋势的测度 离散趋势的测度,在统计学中也称为指标变异指

34、标,是用来描述数 列中指标值的离散趋势与离散程度的。常用的标志变异指标有极差、 平均差和标准差等。 1. 极差 极差是指一个数列中两个极端值即最大值与最小值之间的差异。 根据极差的大小能说明标志值变动范围的大小。其计算公式为: 极差最大标志值最小标志值 根据组距数列求极差的计算公式为: 极差最高组上限最低组下限 在实际工作中,极差可以用于检查产品质量的稳定性和进行质量控制。 在正常生产的条件下,产品质量稳定,极差在一定范围内波动,若极差超 过给定的范围,就说明有不正常情况产伤。但极差受到极端是的影响,测 定结果往往不能反映数据的实际离散程度。 返回本章 返回总目录 2. 四分位差 四分位差是根

35、据四分位数计算的。首先把变量各单位标志值从 小到大排序,再将数列四等分,处于四分位点位次的标志值就 是四分位数,记作 , 为第一四分位数(也称为下 四分位数), 为第二四分位数,就是中位数 , 为第三 四分位数。 1 2 3M M M, , 四分位差的计算公式为: 31 2 MM四 分 位 差 1M 2M eM 3M 四分位差的计算步骤为: 先寻找 四分位数 , 然后根据四分位差的计算公式计算。 返回本章 返回总目录 四分位数的计算 ( 1)由未分组资料计算四分位数。 1 1 4 nM 的 位 次 是整数,则位次对应的 标志值即为相应的四分位数。 首先确定四分位数的位次,再找出对应位次的标志值

36、即为四分位数。 设样本容量为 n , 3 3 ( 1 ) 4 nM 的 位 次 14n 不是整数,则用 1 4n 相邻位次上的标志值的加 权算术平均数 插值法 计算四分位数。 返回本章 返回总目录 ( 2)由分组资料计算四分位数。 14 ( 1 , 2 , 3 ) mi i i i mi if S M L d if iL mif f id 1miS 第 四分位数所在组的下限; 第 四分位数所在组的次数; 总次数,即各组次数总和; 小于第 四分位数所在组的各组次数之和; 第 四分位数所在组的组距。 式中: 第 四分位数的计算公式为: i i i i i 返回本章 返回总目录 四分位差是对极差的一

37、种改进。与极差相比,四分位差因不受 极值的影响,在反映数据的离散程度方面比极差准确,具有较 高的稳定性;同时,对于存在开口的组距数列,不能计算极差, 但可以计算四分位差。 四分位差与极差相比较: 四分位差和极差一样,不能充分利用数据的全部信息,也无法 反映标志值的一般变动 。 返回本章 返回总目录 3. 平均差 平均差是各单位标志值对平均数的离差绝对值的平均数。平均 差仅反映总体各单位标志值对其平均数的平均离差量。平均差 越大,表明标志变异程度越大;反之,则表明标志变异程度越 小。平均差通常用字母 表示。 .DA 未分组资料时 ,其计算公式为: N XX DA . 分组资料时 ,其计算公式为:

38、 f fXX DA . 返回本章 返回总目录 4. 方差和标准差 未分组资料时 ,方差的公式为: N XX 22 标准差的公式为: N XX 2 分组资料时 ,方差的公式为: 标准差的公式为: f fXX 22 f fXX 2 式中: X N 算术平均数 总体单位数 返回本章 返回总目录 f 各组次数 2 方差 标准差 X 变量值 需要指出的是, 是总体标准差,而样本标 准差为 。 N XX 2 1 2 n XXS 当样本较大时,由于 几乎等于 ,因此常用公式 代替公式 来计算样本标准差 S,并 用于估计总体标准差 。 11n n 1 n XX 2 1 2 n XX 1 2 n XXS n X

39、XS 2 在小样本的情况下, 较 为总体标准差 的更优 良的估计量 。 返回本章 返回总目录 5. 离散系数 上述的各种标志变异度指标,都是对总体中各单位指标 值变异测定的绝对量指标。而离散系数是测定总体中各 单位标志值变异的相对量指标,以消除不同总体之间在 计量单位、平均水平方面的不可比因素。常用的离散系 数主要有平均差离散系数 和标准差离散系数 .DAV V 其公式分别为: %100. XDAV DA %100 XV 返回本章 返回总目录 6. 偏度和峰度 ( 1)偏度 偏度是用来反映变量数列分布偏斜程度的 指标。 变量数列的 单峰钟形分布 对称分布 非对称分布 (或称偏态分布) 右偏分布

40、 (或称正偏分布) 左偏分布 (或称负偏分布) 返回本章 返回总目录 偏态分布情况下平均数、中位数、众数有近似的关系: 2 ( )e o eM M X M X f X f eM oM X f eoX M M XeM 对称分布 右偏分布 左偏分布 利用平均数、中位数、众数的位置关系大致判断分布是否对称: 返回本章 返回总目录 oM X eMoM X eoX M M eoX M M OXMSK 用偏度系数准确地测定分布的偏斜程度和进行比较分析。 Pearson 偏度系数, 用 SK 表示。 SK 为无量纲的系数,通常取值在 -3+3之间。绝对值越大, 说明分布的倾斜程度越大。 SK =0 对称分布

41、 SK 0 右偏分布 SK 0 右偏分布, 值越大,右偏程度越高; 3 尖顶曲线, 值越大,顶部尖峭程度越高; 3 平顶曲线, 值越小,顶部越平坦; =1.8 变量数列的曲线呈矩形分布; 5,因此可利用正态近似处理,即认为样本比率 的抽样分布近似服从均值 和方差 的正态分布。将 值 变换为服从正态分布的 z值,即 将例题中的数据代入上述公式,得: p 05.0 p nppp /)1(2 p n pp ppz )1( 201.0 02.0 475 )05.01(05.0 05.003.0 1 z 5.2 01.0 025.0 475 )05.01(05.0 05.0075.0 2 z 于是所求得

42、概率为 : %1.97)9772.01(9938.0)2()5.2()5.22( zP 返回本章 返回总目录 两个样本比率之差的抽样分布实例 某公司市场研究人员的调查报告表明,在 A市场有 15的人喜欢该公司生 产的某种牌号的牙膏,而在 B市场则有 9的人喜欢该产品。如果从 A、 B 两个市场中各抽取由 120人组成的独立随机样本,问样本比率之差 的数值大于或等于 0.14的概率有多大? ) ( BA pp 此例中没有说明总体服从何种分布,但因其样本容量足够大, n1 和 n2 都为 120, 因此根据中心极限定理,可认为近似服从正态分布 0 4 17.0120 )09.01(09.0120

43、)15.01(15.0 06.009.015.0 AA AA pp pp 于是所求的概率为: 0 .1 4 0 .0 6( 0 .1 4 ) ( ) 0 .0 4 1 7ABP p p P z 02 74.097 26.01)92.1( zP 计算结果表明 值大于或等于 0.14的概率为 2.74%。 )( BA pp 返回本章 返回总目录 t 分布、 分布和 F 分布 2 t 分布 t 分布是小样本分布,小样本指 n 0.05时 , 考虑有限总体校正系数: 1NnN 返回本章 返回本目录 总体比率和两个总体比率之差 的区间估计 1. 总体比率的区间估计 回顾:第 7 章中曾讨论了样本比率 p

44、 的抽样分布并指出 当 np 和 )1( pn 两者都大于 5 时, p 的抽样分布近似服从平 均值为 p 、标准差为 n pp p )1( 的正态分布。实际中常 用样本比率 p 来代替 p ,得到标准差的估计值 n pp s p )1( 返回本章 返回本目录 因此,如果 np 和 )1( pn 两者都大于 5 且 n 相对于总体容 量来说很小,则 p 的近似 )%1(100 的置信区间为: 2 ( 1 )pp pz n ,如果所研究的总体是有限的,尤其是抽 样的比重较大时,即 05.0 N n 时,就要采用有限总体修正 系数,从而 p 的区间估计公式为: 1 ) 1( 2 N nN n pp

45、 zp 返回本章 返回本目录 2. 两个总体比率之差的区间估计 回顾:第 7 章介绍了当 1n 和 2n 两者都很大即大样本 且总体比率不太接近 0 或 1 时, 2 个独立样本的 21 pp 的抽样分布近似服从正态分布,其平均值为 21 pp ,标准差可以通过下面的式子来估计: 2 22 1 11 ) 1( ) 1( 21 n pp n pp S pp 两个总体比率之差的区间估计 1 1 2 2 12 122 ( 1 ) ( 1 )() p p p pp p z nn 返回本章 返回本目录 总体比率的区间估计列表 待估计参数 已知条件 置信区间 总体比率 p 两个总体 比率之差 p1-p2

46、2 (1 )pppz n 1 )1( 2 N nN n ppzp np和 nq都大于 5, 并且 n相对 N很小 对有限总体, np和 nq都大于 5, 且 n/N0.05 1 1 2 2 12 122 ( 1 ) ( 1 )() p p p pp p z nn 两个总体样本都是大样本 返回本章 返回本目录 样本容量的确定 决定样本大小的因素: ( 1)总体方差 值大小的影响。总体方差大,抽样误 差大,则应多抽一些样本容量,反之可以少抽一些。可 以做试验性调查或根据历史资料来估计总体方差。 2 ( 2)可靠性程度的高低。要求的可靠性越高,所需的 样本容量越大,即为获得所需精度而指定的概率越大,

47、 所需的样本容量就越大。 ( 3)允许误差的大小。若允许误差可以大一些,则样 本容量可以少一些,反之,样本容量要求多一些 。 返回本章 返回本目录 1. 估计总体平均数时样本容量的确定 重复抽样条件下 22 2 2 x z n , 表示允许误差;不重复 抽样时 22 2 2 2 2 2 ( 1 ) x Nz n Nz 返回本章 返回本目录 2. 估计总体比率时样本容量的确定 2 2 2 (1 ) p z p p n 2 2 22 2 ( 1 ) ( 1 ) ( 1 )p N z p p n N z p p 重复抽样条件下 不重复抽样时 在上述两个公式中都要知道总体比率 p ,但一般 p 是未知

48、的。 所以要先 估计 p . 返回本章 返回本目录 p 的估计 方法主要有: ( 1)用以往的资料估计 p ( 2 ) 在正式抽样之前,先抽一个试验样本,用此样本 比率 p 来代替 p 。 ( 3)当对某一总体比率有很大把握时,可用它作为 的估计值 ( 4 )如果没有任何资料,则可以令 5.0p ,因为此时 )1( pp 这 一乘积达到最大,从而所需的样本也比较多,推断也比较可靠。 p 返回本章 返回本目录 正态总体方差和两个正态总体 方差比的区间估计 22 2 22 1 ( 1 ) ( 1 )n s n s 22 11 2 2 2 2 1 2 2 2 1 22 ss ss FF 正态总体方差

49、的区间估计 两个正态总体方差比的区间估计 返回本章 返回本目录 第 9章 假设检验 返回总目录 1. 假设检验 就是对总体参数所作的一个假设开始,然后搜集样本数据, 计算出样本统计量,进而运用这些数据测定假设的总体参 数在多大程度上是可靠的,并作出承认还是拒绝该假设的 判断 原假设 H0( Null hypothesis) 备择假设 H1( Alternative hypothesis ) 80 :0 H 80 :1 H 返回本章 返回总目录 原假设 H0是关于总体参数的表述,它是接受检验的假设 备择假设 H1是当原假设被否定时另一种可成立的假设 原假设和备择假设是相互对立的,在任何情况下只能

50、有一个成立。如果接受 H 0就必须拒绝 H1;拒绝 H0就必须接受 H1 就对总体平均数的假设而言有三种情况: 0 0 ( 2) H0: ; H1: 0( 1) H0: 0 返回本章 返回总目录 ; H1: 0 0 ; H1: ( 3) H0: 2. 第 I类错误、第 II类错误 对假设 H0采取的行动 自然状态 H0为真 H0为伪 接受 H0 决断正确 第 II类错误 拒绝 H0 第 I类错误 决断正确 在假设检验中,犯第 I 类错误 (弃真错误) 的概率为 ,称其为显著性水平; 犯第 II 类错误 (取伪错误) 的概率为 。 返回本章 返回总目录 越大,就也有可能犯第 I 类错误,即越有可

51、能否定真 实 的原假设。 越大,就越有可能犯第 II 类错误,即越有可能接受非真的原假设。 我们希望犯这两类错误的概率都尽可能小,但在一定样本容量下,减少 会引起 增大,减少 会引起 增大。 在假设检验中,我们一般事先规定允许犯第 I 类错误的概率 ,然 后尽量减少犯第 II 类错误的概率 。 返回本章 返回总目录 3. 双侧检验和单侧检验 对总体平均数的假设检验可分两类,即双侧检验和单侧检验。 双侧检验 当 H 0 : 0 ; H 1 : 0 时,就必须用双侧检验,其目的 是观察在规定的显著性水平下所抽取的样本统计量是 否显著地高于或低于假设的总体参数。 标准正态曲线下 两 个尾部面积各占

52、2 ,这样就有了 两 个 拒绝区域。如果样本统计量落在这 两 个区域内 ,就拒绝 原假设。注意:在双侧检验中差距是不分正负的 。 返回本章 返回总目录 双侧检验的接受区域和拒绝区域 1 的面积 拒绝区域 拒绝区域 2 的面积 2 的面积 接受区域 返回本章 返回总目录 单侧检验 单侧检验分为左侧检验和右侧检验两种,它们都只有一个拒绝域 左侧检验 一般而言,如果假设是: H 0 : 0 ; H 1 : 0 就用 左侧检验 1 的面积 拒绝区域 的面积 接受区域 返回本章 返回总目录 右侧检验 右侧检验 适用于原假设 H 0 : 0 ,而备择假设 H 1 : 0 的情 况,只要样本平均数显著地超过

53、假设的总体参数,就拒绝原假设 H 0 而接受备择假设 H 1 。 接受区域 1 的面积 拒绝区域 2 的面积 返回本章 返回总目录 ( 1)根据研究问题的需要提出假设,包括原假设和备择假设。 ( 2)找出检验的统计量及其分布。 ( 3)规定显著性水平,即选择所允许犯第 类错误的概率。 ( 4)确定决策规则。 ( 5)根据样本数据计算统计量的数值并由此作出决策。 4. 假设检验的一般程序 返回本章 返回总目录 检验步骤 建立总体假设 H0, H1 抽样得到样 本观察值 1 2 选择统计量 确定 H0为真 时的抽样分布 3 根据具体决策 要求确定 确定临界点 C和 检验规则 计算检验统 计量的数值

54、 比较并作出检验判断 7 4 5 6 返回本章 返回总目录 1 总体为 正态分布且方差已知 检验统计量为 xz n ,服从标准正态分布。 总体平均数的假设检验 条 件 检验统计量 拒绝域 H0、 H1 (1) H0: =0 H1: 0 2 2 z (2) H0: 0 H1: 0 (3) H0: 0 H1: 0 z 0 z n xZ 0 正态总 体 2已知 2Z2Z 0 0 Z Z 返回本章 返回总目录 t 拒绝域 H0、 H1 (1) H0: =0 H1: 0 (2) H0: 0 H1: 0 (3) H0: 0 H1: 0 t 0 ns xt 0 正态总体 2未知 (n 30) 条 件 检验统

55、计量 0 2 2 2t 2t0 t 2 总体为 正态分布且 30n , 但方差未知 检验统计量为 xt sn ,服从自由度为 1n 的 t 分布。 t t 返回本章 返回总目录 条件 检验统计量 拒绝域 H0、 H1 (1) H0: =0 H1: 0 (2) H0: 0 H1: 0 (3) H0: 0 H1: 0 z 0 2 2 2Z 2Z0 n xZ 0 nS xZ 0 非正态 总体 n30 2已知 或未知 z 0 z Z Z 3 总体为 非正态分布 30n 检验统计量为 xz n ,近似服从正态分布。 返回本章 返回总目录 条件 检验统计量 拒绝域 H0、 H1 (1) H0: 1=2 H

56、1: 1 2 2 2 z (2) H0: 1 2 H1: 1 2 (3) H0: 1 2 H1: 1 2 z 0 z 0 2Z 2Z0 2 2 2 1 2 1 21 nn xxZ 两个 正态 总体 21 22, 已知 Z Z 两个总体平均数之差的假设检验 1两个正态总体且方差已知 检验统计量为: 12 12 22 12 12 ( ) ( )xxz nn ,服从标准正态分布。 返回本章 返回总目录 条件 检验统计量 拒绝域 H0、 H1 (1) H0: 1 = 2 H1: 1 2 2 2 t (2) H0: 2 H1: 2 (3) H0: 1 2 H1: 1 2 t t 0 2t 2t0 两个正

57、 态总体 21 2 2,未知, 但相等 221 1 2 2 12 ( 1 ) ( 1 ) 2p n S n SS nn 0 12 12 11 p xxt S nn 2 两 个正态总体,其方差未知但相等 检验统计量为: 12 12 22 12 ( ) ( ) pp xx t ss nn 其中, 22 2 1 1 2 2 12 ( 1 ) ( 1 ) 2p n s n ss nn 服从自由度为 12 2nn 的 t 分布。 返回本章 返回总目录 t t 条件 检验统计量 拒绝域 H0、 H1 (1) H0: 1 = 2 H1: 1 2 (2) H0: 1 2 H1: 1 2 (3) H0: 1 2

58、 H1: 1 2 z 0 2 2 2Z 2Z0 两个非 正态体 n130 n230 21 22, 已知或 未知 2 2 2 1 2 1 21 nn xxZ 2 2 2 1 2 1 21 n S n S xx Z 0 z z Z Z 3 非正态分布总体且方差未知 在 12nn和 足够大时,检验统计量 12 12 22 12 12 ( ) ( )xx z ss nn ,近似服从标准正态分布 返回本章 返回总目录 条件 检验统计量 H0、 H1 (1) H0: p=p0 H1: pp0 2 2 (2) H0: pp0 H1: p p0 (3) H0: pp0 H1: p p0 z 0 z 0 2Z

59、2Z0 np5 nq5 000(1 )ppZ pp n 拒绝域 z Z Z 1单个总体比率的检验 检验统计量为: ,服从标准正态分布。 (1 )ppZ pp n 总体比率之差的假设检验 返回本章 返回总目录 条件 检验统计量 拒绝域 H0、 H1 (1) H0: p1=p2 H1: p1p2 2 z (2) H0: p1 p2 H1: p1 p2 (3) H0: p1 p2 H1: p1 p2 z 0 z 0 2Z 2Z0 n 1p15 n1q15 n2p25 n2q25 21 2211 21 21 )1()1( nn pnpn p n pp n pp pp Z 2 返回本章 返回总目录 2两

60、个总体比率之差的检验( ) 检验两个总体比率是否相等的假设,检验统计量为: 其中 。 5np 1 2 1 2 12 () (1 ) (1 ) p p p pZ p p p p nn 1 1 2 2 12 n p n pp nn Z Z 总体方差的假设检验 条件 检验统计量 拒绝域 H0、 H1 (1) 2 2 (2) (3) 22 2 0 ( 1)nS 正态 总体 22 0 : 0 22 1 : 0 H H 22 0 : 0 22 1 : 0 H H 22 0 : 0 22 1 : 0 H H )1(2 21 na )1(2 na )1(2 2 na )1(21 na 1 单个正态总体方差的假设检验 检验统计量为: 2 2 2 ( 1 )ns ,服从自由度为 1n 的 2 分布 返回本章 返回总目录 条件 检验统计量 拒绝域 H0、 H1 (1) 2 2 (2) (3) 2 2 2 2 2 1 2 1 / / S SF 正态 总体 2 2 2 1:1 2 2 2 1:0 H H 22 0 : 1 2 22 1 : 1 2 H H 22 0 : 1 2 22 1 : 1 2 H H )1(21 nF a )1(2 nFa )1( nFa )1(1 nF a 2 两 个正态总体方差比的假设检验 检验统计量为 2 1 2 2 s F s ,服从

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!