统计学教学课件:第3章 统计整理

上传人:努力****83 文档编号:190716004 上传时间:2023-02-28 格式:PPTX 页数:57 大小:1.75MB
收藏 版权申诉 举报 下载
统计学教学课件:第3章 统计整理_第1页
第1页 / 共57页
统计学教学课件:第3章 统计整理_第2页
第2页 / 共57页
统计学教学课件:第3章 统计整理_第3页
第3页 / 共57页
资源描述:

《统计学教学课件:第3章 统计整理》由会员分享,可在线阅读,更多相关《统计学教学课件:第3章 统计整理(57页珍藏版)》请在装配图网上搜索。

1、统计工作的过程统计工作的过程第第2章章 统计调查统计调查统计统计设计设计统计统计调查调查统计统计整理整理统计统计分析分析统计统计预测预测统计统计决策决策第第3章章 统计整理统计整理思考题思考题1.某市场调查共发放某市场调查共发放问卷问卷2000份,其中每份问卷份,其中每份问卷包含包含15题、每题题、每题4个选项,请问个选项,请问如何整理如何整理?需要?需要利用计算机吗?如果需要,请问如将统计数据利用计算机吗?如果需要,请问如将统计数据输输入计算机入计算机?2.某课程共有某课程共有96人参加考试,其成绩分布为:人参加考试,其成绩分布为:8人人优秀、优秀、40人良好、人良好、35人中等、人中等、9

2、人及格、人及格、4人不人不及格。请问用什么图表可以较好地表示该及格。请问用什么图表可以较好地表示该成绩分成绩分布布?第第3 3章章 统计整理统计整理统计统计整理整理1涵义涵义2数据数据预处预处理理3分类分类数据数据4顺序顺序数据数据5数值数值型数型数据据6统计统计表表3.统计整理统计整理本章学习目的本章学习目的 了解了解数据整理在统计活动中的地位、数据整理的内容、数据审核与汇总的技术。领会领会统计分组的概念、关键、统计分组体系及次数分布的类型和特征。明确明确统计数据的表现形式统计表和统计图的基本内容。掌握掌握统计分组、分配数列和统计图表的编绘制方法。本章重难点提示本章重难点提示 本章重点本章重

3、点:统计分组、变量数列的编制、统计数据的显示方法统计表和统计图。本章难点本章难点:统计分组、变量数列的编制、次数分布图的绘制。3.1 统计整理的涵义统计整理的涵义统计整理的统计整理的概念概念统计整理的统计整理的内容内容统计整理的概念统计整理的概念使统计数据由使统计数据由特征特征过渡到过渡到的工作过程的工作过程万元万元万元75012501000050201AAA1000+1250+750=5亿元亿元5亿亿/50=1000万元万元/家家例如例如:通过调查得某班平均成绩为:通过调查得某班平均成绩为3.53.5分分/人(五分制)人(五分制)则则百分制百分制下其平均成绩:下其平均成绩:5 5:100=3

4、.5100=3.5:X X,X=70X=70分。分。统计整理的统计数据包括统计整理的统计数据包括一手数据一手数据和和二手数据二手数据例如例如:某市:某市5050家建筑企业年利润额如下,求其家建筑企业年利润额如下,求其平均值平均值统计整理的概念统计整理的概念统计整理的作用统计整理的作用 统计数据整理,是统计调查的继续,也是统计数据整理,是统计调查的继续,也是统计分析的前提,承前启后,在整个统计工作统计分析的前提,承前启后,在整个统计工作中具有重要的作用。中具有重要的作用。统计整理的内容统计整理的内容预处理预处理-分类分组分类分组-统计汇总统计汇总-统计图表统计图表统计整理的内容统计整理的内容3.

5、2 数据的预处理数据的预处理数据的预数据的预处理处理数据录入数据录入数据审核数据审核完整性完整性准确性准确性数据筛选数据筛选数据排序数据排序递增排序递增排序递减排序递减排序检查数据中的错误检查数据中的错误找出符合条找出符合条件的数据件的数据升序和降序;升序和降序;寻找数据的寻找数据的基本特征基本特征数据的预处理(举例)数据的预处理(举例)8 8名同学四门课程成绩分布名同学四门课程成绩分布姓名姓名统计学成绩统计学成绩数学成绩数学成绩英语成绩英语成绩经济学成绩经济学成绩王翔王翔91 91 75 75 95 95 94 94 袁方袁方75 75 58 58 76 76 90 90 张松张松69 69

6、 68 68 84 84 86 86 赵颖赵颖75 75 96 96 81 81 83 83 田雨田雨54 54 88 88 67 67 78 78 陈风陈风87 87 76 76 92 92 77 77 宋媛宋媛83 83 72 72 66 66 71 71 李华李华81 81 60 60 86 86 64 64 数据的预处理(要求)数据的预处理(要求)1.将试卷上的成绩将试卷上的成绩;录入数据的准确性和完整性;录入数据的准确性和完整性;出四门课程成绩没有不及格者;出四门课程成绩没有不及格者;4.将统计学成绩将统计学成绩。思考思考:如何对:如何对调查问卷调查问卷中的数据进行预处理呢?中的数据

7、进行预处理呢?3.3 分类数据的整理与显示分类数据的整理与显示一、基本问题一、基本问题二、分类数据的整理二、分类数据的整理三、分类数据的图示三、分类数据的图示 基本问题基本问题1.不同类型数据不同类型数据所采取的整理与显示所采取的整理与显示方法不同方法不同。2.对分类数据和顺序数据主要是做对分类数据和顺序数据主要是做分类整理分类整理。3.对数值型数据主要是做对数值型数据主要是做分组整理分组整理。4.适用于适用于低层次低层次数据的整理和显示方法也数据的整理和显示方法也适用于高适用于高层次层次的数据;而的数据;而高层次高层次数据的整理和显示方法数据的整理和显示方法并并不适用于低层次不适用于低层次数

8、据数据。思考思考:如何确定:如何确定数据类型数据类型呢?呢?分类数据的整理(举例)63141、您所居住的小区所处的行政区域是、您所居住的小区所处的行政区域是 区。区。分类数据的图示(条形图、饼形图)6315能在能在PPT上直接作吗?上直接作吗?The Answer isThe Answer is:Yes!Yes!分类数据的图示(条形图、饼形图)63163.4 顺序数据的整理与图示6317一、顺序数据的整理一、顺序数据的整理二、顺序数据的图示二、顺序数据的图示顺序数据的整理(举例)6318关于新关于新南京市物业管理办法南京市物业管理办法实施情况的实施情况的调查调查(一)(一):1、您知道今年2月

9、份施行的新南京市物业管理办法吗?A.不知道 B.知道一些 C.知道9、您知道本小区的维修专项资金的使用情况吗?A.不知道 B.知道一些 C.知道顺序数据的整理(结果录入)6319顺序数据顺序数据是从类别顺序的开始一方向其最后一方累加是从类别顺序的开始一方向其最后一方累加频数,而频数,而数值型数据数值型数据是从小的一方向大的累加频数。是从小的一方向大的累加频数。顺序数据的整理(结果整理)6320顺序数据的图示(累计频数图)6321顺序数据的图示(累计频数图)6322顺序数据的图示(环形图)6323在在PPT里能做吗?里能做吗?Just try!3.5 数值型数据的整理与显示6324一、数值型数据

10、的分组一、数值型数据的分组二、数值型数据的整理二、数值型数据的整理三、数值型数据的图示三、数值型数据的图示数值型数据的分组6325分组方法分组方法单变量值分组单变量值分组组距分组组距分组等距分组等距分组异距分组异距分组单变量值分组1.将将每一个变量值作为每一个变量值作为一组一组。2.适用于适用于离散变量离散变量。3.适用于适用于变量值较少变量值较少的的情况下。情况下。A A 班学生年龄分布表班学生年龄分布表年龄年龄 人数人数 频率频率 17 17 18 18 19 19 20 20 21 21 6 6 14 14 18 18 9 9 3 3 0.0.12120.0.28280.360.360.

11、180.180.060.06合计合计 50 50 1.00 1.0063266327组距分组(组距分组(举例举例)组距分组(要点)63281.将全部变量值依次划分为若干个区间,并将这将全部变量值依次划分为若干个区间,并将这一区间的变一区间的变量值称为一组量值称为一组2.适用于适用于连续变量连续变量或或变量值较多变量值较多的情况下的情况下3.需要遵循需要遵循“不重不漏不重不漏”的原则的原则如何做到如何做到呢?呢?(1)不重:)不重:1)连续变量:相邻组限重叠,)连续变量:相邻组限重叠,“下闭上开下闭上开”2)离散变量:另外可采用)离散变量:另外可采用相邻组限间隔相邻组限间隔的办法的办法(2)不漏

12、:)不漏:1)认真检查;)认真检查;2)在最大最小值与其它值相距甚远时采用)在最大最小值与其它值相距甚远时采用开口组开口组组距分组(基本概念)6329组数(组数(K):):组的数目组的数目组限组限:分组的数量界限,包括上限(:分组的数量界限,包括上限(U)、下限()、下限(L)闭口组闭口组:上限和下限齐全的组:上限和下限齐全的组开口组开口组:有上限而缺下限或者有下限而缺上限的组:有上限而缺下限或者有下限而缺上限的组组距(组距(i):各组上限与下限之差(:各组上限与下限之差(i=UL)组距分组(基本概念)6330全距(全距(R):R=XmaxXmin=i如:某房地产如:某房地产2011年前年前4

13、个月住宅销售套数最高为个月住宅销售套数最高为247套套/天,天,最低为最低为141套套/天,则天,则R=106套套/天天组中值组中值:各组上限与下限的中点值各组上限与下限的中点值推测本组平均水平推测本组平均水平(1)在闭口组中在闭口组中:组中值组中值=(U+L)/2(2)在开口组中在开口组中:首组组中值首组组中值=(U+L)/2=U+(Ui)/2=Ui/2=U邻组邻组i/2末组组中值末组组中值=(U+L)/2=L+(L+i)/2=L+i/2=L+邻组邻组i/2前提(假定):各组数据在本组内均匀分布或组中前提(假定):各组数据在本组内均匀分布或组中值两侧呈对称分布值两侧呈对称分布组距分组(基本步

14、骤)1.确定组数确定组数K。组数的确定应以能够显示数据组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可采的分布特征和规律为目的。在实际分组时,可采用用斯特奇斯斯特奇斯(Sturges)经验公式确定。)经验公式确定。lg1lg2,nK 其中n为数据的个数,结果四舍五入取整数63312.确定组距确定组距i。(1)等距分组:)等距分组:i=R/K(2)异距异距分组:对某些特定现象或为了特定研究目的需分组:对某些特定现象或为了特定研究目的需要,可自行确定不等的组距。要,可自行确定不等的组距。3.根据分组整理成频数分布表根据分组整理成频数分布表频数分布表(相邻组组限间隔)6332频数分

15、布表(相邻组组限重叠)6333原则:下闭上开原则:下闭上开频数分布表(使用开口组)6334异距分组1.它适用于某些特殊情况或特定需要。它适用于某些特殊情况或特定需要。2.为消除各组次数受组距大小不同的影响,更确切地反映各为消除各组次数受组距大小不同的影响,更确切地反映各组次数的实际分布,可计算组次数的实际分布,可计算次数密度次数密度或或标准组距次数标准组距次数。3.次数密度次数密度就是单位组距内分布的次数。就是单位组距内分布的次数。()()ifi次数次数密度组距标准组距次数次数密度 标准组距63354.标准组距次数标准组距次数是选定数列中某一合适的组距作为标准组距,是选定数列中某一合适的组距作

16、为标准组距,用各组次数密度分别乘以标准组距得到的折合次数。用各组次数密度分别乘以标准组距得到的折合次数。数值型数据的图示6336(一)分组数据:(一)分组数据:直方图、条形图和折线图直方图、条形图和折线图(二)未分组数据:(二)未分组数据:茎叶图和箱形图茎叶图和箱形图(三)时间序列数据:(三)时间序列数据:线图线图(四)多变量数据:(四)多变量数据:雷达图雷达图适用于低层次数据的整理和显示方法也适用于高层次的数适用于低层次数据的整理和显示方法也适用于高层次的数据;而高层次数据的整理和显示方法并不适用于低层次数据。据;而高层次数据的整理和显示方法并不适用于低层次数据。条形图、饼图、环形图、累积分

17、布图等都适用于显示数值型数据条形图、饼图、环形图、累积分布图等都适用于显示数值型数据其他图示形其他图示形式式分组数据(直方图)6337分组数据(条形图)6338分组数据(折线图)6339未分组数据(茎叶图-概念)63401.由由“茎茎”和和“叶叶”两部分组成,其图形由数字组成。两部分组成,其图形由数字组成。2.以该组数据的以该组数据的高位数值高位数值作树作树茎茎,低位数字低位数字作树作树叶叶。3.树叶上只保留树叶上只保留最后一位最后一位数字数字;4.对于对于n(20300)个数据,茎叶图)个数据,茎叶图最大行数最大行数不超过不超过5.茎叶图类似于横置的直方图,但又有区别:茎叶图类似于横置的直方

18、图,但又有区别:直方图可观察一组数据的分布状况,但没有给出具体直方图可观察一组数据的分布状况,但没有给出具体的数值的数值 茎叶图既能给出数据的分布,又能给出每一个原始数茎叶图既能给出数据的分布,又能给出每一个原始数值,保留了原始数据的信息值,保留了原始数据的信息10lgLn未分组数据(茎叶图)6341未分组数据(箱形图-概念)63421.由一组数据的由一组数据的最大值最大值、最小值最小值、中位数中位数和和下下四位数四位数QL、上四位数上四位数QU5个特征值绘制而成个特征值绘制而成的,它由的,它由一个箱子一个箱子和和两条线段两条线段组成。组成。2.绘制步骤:绘制步骤:(1)首先找出一组数据的)首

19、先找出一组数据的5个特征值;个特征值;(2)连接两个四分位数画出箱子,再将两个)连接两个四分位数画出箱子,再将两个极值点与箱子相连接。极值点与箱子相连接。未分组数据(单批数据箱形图)6343销售量260240220200180160140120如何手绘或利用如何手绘或利用EXCEL绘制?绘制?箱形图与数据分布的关系6344未分组数据(多批数据箱形图)63458门课程考试成绩箱形图63461010101010101010N=体育土木工程思想道德计算机环境保护高等数学程序设计工程制图100959085807570656011名同学8门课程考试成绩箱形图63478888888888N=ZJBLXMS

20、JYXZYLDCRZPCBBHYHCN100908070604时间序列数据(线图)63481.时间序列数据时间序列数据:在不同时间点上获取的数值型数据:在不同时间点上获取的数值型数据2.线图线图:在平面坐标上用折线表现数量变化特征和规律的图形:在平面坐标上用折线表现数量变化特征和规律的图形1993-2000年城乡居民年城乡居民人均可支配人均可支配收入对比表收入对比表时间数列(线图-举例)6349多变量数据(雷达图-概念)63501.它是一种用于它是一种用于显示多变量的图示方法显示多变量的图示方法。2.它在显示或对比各变量的数值总和时十分它在显示或对比各变量的数值总和时十分有用。有用。3.假定各

21、变量的取值具有相同的正负号,则假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。总的绝对值与图形所围成的区域成正比。4.利用它可以研究利用它可以研究多个样本之间的相似程度多个样本之间的相似程度。多变量数据(雷达图)6351数据类型及图示小结63523.6 统计表6353一、统计表的构成一、统计表的构成二、统计表的设计二、统计表的设计统计表的构成1999-2000年城镇居民家庭资料抽样调查资料年城镇居民家庭资料抽样调查资料项目项目单位单位19992000调查户数调查户数户户 40 044 42 220平均每户家平均每户家庭人口庭人口人人3.143.13平均每人全平均每人全部

22、年收入部年收入元元5 888.776 316.81平均每人消平均每人消费性支出费性支出元元4 615.914 988.00资料来源:资料来源:中国统计年鉴中国统计年鉴2001,北京,中国统计出版社,北京,中国统计出版社,20016354表头表头行行 标标 题题数数字字资资料料列标题列标题附加附加统计表的设计63551.基本要求基本要求:科学、实用、简炼、美观;:科学、实用、简炼、美观;2.要合理安排统计表的结构,应使统计表的横竖长度比要合理安排统计表的结构,应使统计表的横竖长度比例适当,避免出现过高或过长的表格形式;例适当,避免出现过高或过长的表格形式;3.表头一般应包括表号、总标题和表中数据

23、的单位等内表头一般应包括表号、总标题和表中数据的单位等内容。如果表中全部数据同一计量单位,可在表的右上容。如果表中全部数据同一计量单位,可在表的右上角标明;若各指标的计量单位不同,则应放在每个指角标明;若各指标的计量单位不同,则应放在每个指标后或但列出一列标明;标后或但列出一列标明;4.通常,表中上下两条横线用粗线,中间其他线用细线,通常,表中上下两条横线用粗线,中间其他线用细线,统计表的左右两边不封口统计表的左右两边不封口,列标题之间一般用竖线分,列标题之间一般用竖线分开,行标题之间通常不用横线隔开。开,行标题之间通常不用横线隔开。统计表的设计(续)63564.表中表中数字数字一般是一般是右对齐右对齐,有小数点时应以小数,有小数点时应以小数点对齐,而且小数的位数应统一。对于没有数点对齐,而且小数的位数应统一。对于没有数字的表格单元,一般用字的表格单元,一般用“”表示,一张填好的表示,一张填好的统计表不应出现空白单元格。统计表不应出现空白单元格。5.在使用统计表时,尽可能在表的下方加上附加在使用统计表时,尽可能在表的下方加上附加(或称(或称注释注释),特别要注意标明资料来源,以),特别要注意标明资料来源,以表示对他人劳动的尊重,亦方便读者查阅使用。表示对他人劳动的尊重,亦方便读者查阅使用。6357The End!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!