数据的收集整理与显示

上传人:仙*** 文档编号:173175414 上传时间:2022-12-09 格式:PPT 页数:63 大小:863.52KB
收藏 版权申诉 举报 下载
数据的收集整理与显示_第1页
第1页 / 共63页
数据的收集整理与显示_第2页
第2页 / 共63页
数据的收集整理与显示_第3页
第3页 / 共63页
资源描述:

《数据的收集整理与显示》由会员分享,可在线阅读,更多相关《数据的收集整理与显示(63页珍藏版)》请在装配图网上搜索。

1、2.1 数据的收集2.2 数据的整理2.3 数据的显示主要内容主要内容目录目录数据的概念数据的概念 生活中数据例子 数据定义 人们对现象进行调查研究所收集、整理、分析和解释的事实和数字,是对客观现象进行计量的结果 数据对社会生活的重要性数据的计量尺度数据的计量尺度(一)定类尺度(一)定类尺度(Nominal scale)定类尺度也称列名尺度,它是最粗略、计量层次最低的计量尺度,它上按照事物的某种属性对其进行平行的分类或分组。(二)定序尺度(二)定序尺度(Ordinal scale)定序尺度也称顺序尺度,它是事物之间等级差或顺序差别的一种测度。与定类尺度相比较,定序尺度能够比较这些类别的优劣。(

2、三)定距尺度(三)定距尺度(Interval scale)定距尺度也称间隔尺度,它不仅能将事物分为不同类型并进行排序,而且可以准确地指出类别之间的差距是多少。与定序尺度相比较,定距尺度可以准确的指出类别间的差距使多少。(四)定比尺度(四)定比尺度(Ratio scale)定比尺度也称比率尺度,它与定距尺度属于同一层次,其计量的结果也表示为数值。与定距尺度相比较,定比尺度有绝对固定的零点。下列计量属于哪类?下列计量属于哪类?民族 长度 考试成绩 政治观点 重量 月工资 种子等级 湿度数据的类型数据的类型1(一)品质数据(Qualitative data)它是说明事物的品质特征,是不能用数值表示的

3、,其结果通常为类别,这类数据是由定类尺度和定序尺度计量形成的。(二)数量数据(Quantitative data)它说明的是现象的数量特征,是能够用数值来表现的,这类数据是由定距尺度和定比尺度计量形成的。数据类型数据类型2 横截面数据和时间序列数据 观察数据和实验数据 直接数据和间接数据一、调查组织方式一、调查组织方式统计调查统计调查二、调查方案设计二、调查方案设计报表制度报表制度普普 查查重点调查重点调查典型调查典型调查抽样调查抽样调查方案内容方案内容调查表、调查表、问卷设计问卷设计制度化的制度化的经常性调查经常性调查专门组织专门组织调查调查全面调查全面调查非全面调查非全面调查普普 查查特点

4、:特点:工作量大,时间性强,需要大量人力和财力。工作量大,时间性强,需要大量人力和财力。任务:任务:搜集重要的国情国力和资源状况的全面资料,搜集重要的国情国力和资源状况的全面资料,为政府制定规划、方针政策提供依据。为政府制定规划、方针政策提供依据。方式:方式:建立专门机构,配备专门人员调查。建立专门机构,配备专门人员调查。利用基层单位原始记录和核算资料发表调查。利用基层单位原始记录和核算资料发表调查。原则:原则:规定统一的标准时点。规定统一的标准时点。规定统一的普查期限。规定统一的普查期限。规定调查的项目和指标。规定调查的项目和指标。统计报表制度统计报表制度由政府部门组织,采用统一的表格,由政

5、府部门组织,采用统一的表格,自自上而下上而下布置,布置,自下而上自下而上报告。报告。任务:任务:搜集国民经济和社会发展基本情况的资搜集国民经济和社会发展基本情况的资料,为制订国民经济和社会发展计划和料,为制订国民经济和社会发展计划和检查计划执行情况服务。检查计划执行情况服务。优点:优点:1.精心周密设计、高度统一、规范。精心周密设计、高度统一、规范。2.回收率高,内容相对稳定,便于资料回收率高,内容相对稳定,便于资料积累、对比。积累、对比。3.层层上报、逐级汇总,可以满足各部层层上报、逐级汇总,可以满足各部门需要。门需要。特点:特点:抽样调查抽样调查特点:特点:1.按按随机原则随机原则从总体中

6、抽取样本;从总体中抽取样本;2.以样本指标(统计量)为依据以样本指标(统计量)为依据推断总体参数推断总体参数 或或检验总体的某种假设检验总体的某种假设;3.抽样误差可以事先抽样误差可以事先计算计算并加以并加以控制控制。登记性误差登记性误差代表性误差代表性误差编编 差差随机误差随机误差抽样平均误差抽样平均误差实际误差实际误差统计推断中的抽样误差就是统计推断中的抽样误差就是抽样平均误差抽样平均误差。它是统。它是统计调查所固有的,是对抽样推断精确度的量度。计调查所固有的,是对抽样推断精确度的量度。重点调查重点调查特点:特点:在总体中选择在总体中选择个别或部分重点单位个别或部分重点单位进行调查。进行调

7、查。任务:任务:及时了解总体基本情况,为主管部门指导工及时了解总体基本情况,为主管部门指导工作服务。作服务。方式:方式:一次性调查:专门设计和配备人员现场调查。一次性调查:专门设计和配备人员现场调查。重点单位重点单位指在总体中有举足轻重地位的单位,指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。其标志值在总体标志总量中占有绝大比重。经常性调查:同报表制度结合,用统计报表经常性调查:同报表制度结合,用统计报表调查。调查。典型调查典型调查特点:特点:在全面分析的基础上,有在全面分析的基础上,有意识地意识地选择代表性选择代表性的的典型单位典型单位进行现场调查。进行现场调查。任务

8、:任务:为研究某种特殊的社会经济问题,搜集详细为研究某种特殊的社会经济问题,搜集详细的第一手资料,借以认识事物的的第一手资料,借以认识事物的本质特征本质特征、因果关系因果关系、变化趋势变化趋势。为理论和政策性问题。为理论和政策性问题研究提供依据。研究提供依据。作用:作用:适宜于研究处于萌芽状态事物和倾向性问题;适宜于研究处于萌芽状态事物和倾向性问题;适宜于分析事物的类型,它们之间的差别和适宜于分析事物的类型,它们之间的差别和关系。关系。方法:方法:解剖麻雀;划类选典;抓两头。解剖麻雀;划类选典;抓两头。调查方案的主要内容调查方案的主要内容 1.确定调查确定调查目的目的 2.确定调查确定调查对象

9、对象和和调查单位调查单位 3.拟订调查拟订调查提纲提纲 4.确定调查确定调查时间时间 5.编制调查的编制调查的组织计划组织计划调查目的是调查所要达到的具体目标它回答的是:为什么调查?要解决什么样的问题?它回答的是:为什么调查?要解决什么样的问题?调查具有什么样的社会经济意义?调查具有什么样的社会经济意义?调查目的的写作应简明扼要。例如:我国人口普查的目的是例如:我国人口普查的目的是“为准确地查清我国在为准确地查清我国在人口数量、地区分布、构成和素质方面的变化,为人口数量、地区分布、构成和素质方面的变化,为科学地制定国民经济和社会发展战略与规划,统一科学地制定国民经济和社会发展战略与规划,统一安

10、排人民的物质和文化生活,检查人口政策执行情安排人民的物质和文化生活,检查人口政策执行情况,提供可靠的资料况,提供可靠的资料”。调查对象是根据调查目的确定的调查研究的总体或调查范围。调查单位是构成调查对象的每一个单位,是搜集数据资料的基本单位。调查对象和调查单位所解决的问题是:向谁调查?向谁调查?由谁来提供所需资料由谁来提供所需资料?例如:人口普查的调查对象是具有中华人民共和国国籍并例如:人口普查的调查对象是具有中华人民共和国国籍并 在中华人民共和国境内常住的人。在中华人民共和国境内常住的人。人口普查的调查单位是每一个人。人口普查的调查单位是每一个人。注意:调查单位与填报单位的区别。它可以是调查

11、单位的数量特征,如一个人的年龄、收入,一个企业的职工人数、产值;调查表是用于登记调查数据的一种表格,一般由调查表是用于登记调查数据的一种表格,一般由表头、表体和表外附加三部分组成。表头、表体和表外附加三部分组成。调查项目是调查的具体内容调查项目是调查的具体内容也可以是调查单位的某种属性特征,如一个人的性别、职业,一个企业的经济类型等。某企业基本情况报表(表头)制表机关:调查项目 项目代码 计量单位 实际数值 甲 1 人 乙 2 台 丙 3 人 表体说明:(表外附加)为确保调查资料的准确性,统计调查必须规定这两种时间是调查资料所属的时间。即规定所调查的是哪个时期或时点的资料。是进行调查工作的期限

12、。即从调查工作开始到结束的时间长度。例如:第四次人口普查规定的标准时间是“1990年 7月1日0时”,并要求在“1990年7月1日至10日 完成普查的登记工作”。1990年7月1日0时就是调查时间,1990年7月1日至10日就是调查期限。调查时间调查时间:调查期限调查期限:调查的组织调查的组织 工工 作作这项内容包括的比较多,如调查机构的确定,调查人员的选择、培训,调查经费的来源和支出预算,以及其它一些调查工作的准备等。调查问卷设计调查问卷设计调查表调查表单一表单一表一览表一览表例:例:工业企业统计报表工业企业统计报表 问卷结构:问卷结构:说明词说明词+主题词句主题词句+作业记录作业记录例:例

13、:人口普查登记表人口普查登记表问卷问卷设计设计 基本要求:基本要求:主题明确,形式简明,主题明确,形式简明,文字通俗,容易理解,文字通俗,容易理解,便于回答。词句编排,便于回答。词句编排,层次分明,先易后难。层次分明,先易后难。问卷形式:问卷形式:自由回答式词句自由回答式词句两项选择式词句两项选择式词句多项选择式词句多项选择式词句赋值评价式词句赋值评价式词句 尊敬的先生、女士:尊敬的先生、女士:我们是上海我们是上海学院的学生。为了积极参与贯学院的学生。为了积极参与贯彻国家关于扩大内需推动经济增长的方针和理论与彻国家关于扩大内需推动经济增长的方针和理论与实践相结合的教育原则,在老师指导下我们组织

14、了实践相结合的教育原则,在老师指导下我们组织了这次千户居民的社会调查。请您给予支持。调查不这次千户居民的社会调查。请您给予支持。调查不记名,全部资料用计算机处理,绝对保密和安全,记名,全部资料用计算机处理,绝对保密和安全,您只需在符合您的情况的答案上打个勾,化费几分您只需在符合您的情况的答案上打个勾,化费几分钟时间。谢谢!钟时间。谢谢!返回返回下页下页上海市城市居民消费与投资倾上海市城市居民消费与投资倾向调查问卷向调查问卷(1)您家是否已经拥有下列耐用家电设备:)您家是否已经拥有下列耐用家电设备:1.彩电彩电 2.组合音箱组合音箱 3.VCD(DVD)4.冰箱冰箱 5.空调空调 6.电脑电脑(

15、2)您家的住房是:)您家的住房是:1.租赁公房租赁公房 2.有产权公房有产权公房 3.新商品房新商品房 4.其他(请注明)其他(请注明)(3)您家今明两年是否准备以下项目支出:)您家今明两年是否准备以下项目支出:1.购买家电设备购买家电设备 2.购买成套家具购买成套家具 3.购买汽车购买汽车 4.购买(或置换)房屋购买(或置换)房屋 5.现有住房装修现有住房装修 6.支付子女教育费支付子女教育费 7.国内或国际旅游国内或国际旅游返回返回下页下页上页上页(4)您今明两年不准备上列大项目支出的主要)您今明两年不准备上列大项目支出的主要 原因是:(选填原因是:(选填3项)项)1.没有必要没有必要 2

16、.经济不宽裕经济不宽裕 3.品牌不中意品牌不中意 4.质量信不过质量信不过 5.售后服务差售后服务差 6.价格不合理价格不合理 7.其他(请注明)其他(请注明)(5)您购买商品考虑的主要因素是:)您购买商品考虑的主要因素是:1.实用价值实用价值 2.商品质量商品质量 3.价格价格 4.品牌品牌 5.售后服务售后服务 (请按您认为的重要性在(请按您认为的重要性在中写上位序)中写上位序)返回返回下页下页上页上页(6)您家平均每月总收入是:)您家平均每月总收入是:1.500元以下元以下 2.5001000元元 3.10001500元元 4.15002000元元 5.20003000元元 6.3000

17、5000元元 7.50008000元元 8.8000元以上元以上(7)您家平均每月日常生活费开支是)您家平均每月日常生活费开支是 元,元,其中用于吃(食品)支出大约是其中用于吃(食品)支出大约是 元。元。(8)您认为您家近几年生活水平是:)您认为您家近几年生活水平是:1.提高很多提高很多 2.略有提高略有提高 3.没有变化没有变化 4.略有下降略有下降 5.下降很多下降很多返回返回下页下页上页上页(9)您收入节余用于以下哪些项目?各项约占多大)您收入节余用于以下哪些项目?各项约占多大比重?比重?1.银行储蓄银行储蓄 ()%3.国债国债(国库卷国库卷)()%3.基金基金 ()%4.其他债券其他债

18、券 ()%5.股票股票 ()%6.保险保险 ()%7.其他其他 ()%(10)您存钱的主要目的是:)您存钱的主要目的是:1.购买设备购买设备 2.购买住房购买住房 3.结婚结婚 4.子女教育子女教育 5.养老防病养老防病 6.旅游旅游(请按你认为的重要性在(请按你认为的重要性在中写位序)中写位序)返回返回下页下页上页上页(11)您是否了解现在推行的信贷消费)您是否了解现在推行的信贷消费 1.不了解不了解 2.了解一点了解一点 3.了解了解 4.很了解很了解(12)您是否打算参加信贷消费:)您是否打算参加信贷消费:1.是是 2.不不 (跳过第(跳过第13题)题)(13)您信贷消费的项目是()您信

19、贷消费的项目是()1.购买家电设备购买家电设备 2.购买成套家具购买成套家具 3.购买汽车购买汽车 4.购买(或置换)房屋购买(或置换)房屋 5.现有住房装修现有住房装修 6.支付子女教育费支付子女教育费 7.国内或国际旅游国内或国际旅游 返回返回下页下页上页上页 (14)您是否同意下列看法:)您是否同意下列看法:很同无不很很同无不很同意所同不同意所同不意意 谓意同谓意同 意意 1.信贷消费不合中国国情信贷消费不合中国国情 2.信贷消费是资本主义国家的做法信贷消费是资本主义国家的做法 3.信贷消费是先甜后苦信贷消费是先甜后苦 4.借债享受有风险借债享受有风险 5.借债消费不光彩借债消费不光彩

20、6.信贷消费是现代通行的做法信贷消费是现代通行的做法 7.只要量力借贷,有利无害只要量力借贷,有利无害 8.发展信贷消费能促进经济增长发展信贷消费能促进经济增长返回返回下页下页上页上页(15)最后,了解一下您的基本情况:)最后,了解一下您的基本情况:A.您的性别:您的性别:1.男男 2.女女 B.您的年龄:您的年龄:周岁周岁 C.您的文化程度:您的文化程度:1.不识字或识字不多不识字或识字不多 2.小学小学 3.初中初中 4.高中或中专高中或中专 5.大专或大学以上大专或大学以上 D.您家庭人口数您家庭人口数 人人 其中:其中:1.在业在业 人;人;2.离退休离退休 人;人;3.失业、下岗失业

21、、下岗 人人 4.在校学生在校学生 人。人。E.您的职业您的职业 (见卡片)(见卡片)F.职务职务 返回返回上页上页统计调查设计(课后任务)调查主题:学校周边地区大家比较熟悉的某种产品或服务:服饰店、网吧、书店 每组人数3-5人 设计方案、设计问卷、组织调查、结果分析 调查期限即日起至10月31号前 提交纸质版(A4打印)3.1 统计整理的意义和方法统计整理的意义和方法3.2 统计分组统计分组3.3 分布数列分布数列3.4 统计表统计表3.5 统计图统计图主要内容主要内容目录目录主要任务主要任务资料审核、分组、汇资料审核、分组、汇总、制表、制图等。总、制表、制图等。分组分组频数分布频数分布统计

22、表统计表统计图统计图 统计调查搜集上来的资料,不论是哪一种类型的统计调查搜集上来的资料,不论是哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。型不同,研究的目的不同,资料整理的方法也不同。统计整理是根据统计研究任务的要求,对调查所统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程。统化的工作过程。统计整理的意义和方法 根据某班根据某班4040名学生统计学考试成绩分名学生统计学考试成绩分析该班学生考

23、试情况。析该班学生考试情况。57 89 49 84 86 87 75 73 72 68 57 89 49 84 86 87 75 73 72 68 75 82 97 81 67 81 54 79 87 95 75 82 97 81 67 81 54 79 87 95 76 71 60 90 65 76 72 70 86 76 71 60 90 65 76 72 70 86 85 89 8985 89 89 64 57 83 81 78 87 64 57 83 81 78 87 72 61 72 61 按成绩等级分组按成绩等级分组 人数(人)人数(人)各组人数占各组人数占 总人数比重(总人数比重

24、(%)不及格不及格 4 10.0 及及 格格 6 15.0 中中 12 30.0 良良 15 37.5 优优 3 7.5 合合 计计 40 100.0 再如:通过调查取得再如:通过调查取得100100个商业企业某月销个商业企业某月销售额资料:(单位:万元)售额资料:(单位:万元)2020,6060,4545,9090,105105,5656,250250,8989,130130,3030,9898,300300。将这些数据资料按将这些数据资料按“销售额销售额”的多少进行整的多少进行整理,得到下列整理结果:理,得到下列整理结果:销售额(万元)销售额(万元)企业数(个)企业数(个)0 50 12

25、50 100 25 100 150 30 150 200 23 250 300 10 合合 计计 100统计整理的方法:分组、汇总、编表统计整理的方法:分组、汇总、编表2533421.划分现象类型划分现象类型作用:作用:例:例:按所有制性质划分,我国现有按所有制性质划分,我国现有8种经济类型:种经济类型:国有经济;集体经济;私营经济;个体经济;联营经国有经济;集体经济;私营经济;个体经济;联营经济;股份制经济;外商投资经济;港澳台投资经济济;股份制经济;外商投资经济;港澳台投资经济2.研究总体结构研究总体结构例:上海市按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%)1980年年

26、 1990年年 1996年年 1997年年 GDP100 100 100 100 第一产业第一产业 3.2 4.3 2.5 2.3 第二产业第二产业75.7 63.8 54.5 52.2 第三产业第三产业21.1 31.9 43.0 45.53.研究现象之间的依存关系研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(例:中国农民家庭按收入分组的恩格尔系数(1984年)年)按收入分组(元)按收入分组(元)200 300 400 500 600 800 1000恩格尔系数(恩格尔系数(%)64.9 60.2 56.7 54.4 50.5 49.9 43.6统计分组统计分组:根据研究任务

27、的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分。统计分组应统计分组应达到的要求达到的要求同一组内的单位性质相同,不同组所包括的单位性质相异。例如:工业企业按经济类型分组,可分为以下几组:经济类型 企业数(个)国有企业 1000 合资企业 200 合作经营企业 300 股份制企业 500 工业企业按职工人数分组,可分为以下几组:职工人数 企业数(个)500人以下 50 5001000 200 10001500 100 工业企业按地区分组,可分为以下几组:地区 企业数(个)北京市 10000 天津市 8000 上海市 11000 分组标志的选择分组标志的选择

28、选择什么样的分组标志,就会形成什么样的分组结果,选择什么样的分组标志,就会形成什么样的分组结果,因此,分组标志的选择是统计分组的关键。因此,分组标志的选择是统计分组的关键。选择分组标志的一般原则选择分组标志的一般原则必须根据统计研究的目的,在对现象进行分析的基础上必须根据统计研究的目的,在对现象进行分析的基础上,抓住具有本质性的区别及反映现象内在联系的标志来,抓住具有本质性的区别及反映现象内在联系的标志来作为分组标志。作为分组标志。统统计计分分组组的的种种类类 按研究任务和作用不同按研究任务和作用不同 按分组标志的多少不同按分组标志的多少不同 按分组标志的性质不同按分组标志的性质不同类型分组类

29、型分组结构分组结构分组分析分组分析分组简单分组简单分组复合分组复合分组品质分组品质分组变量分组变量分组品质品质分组分组方法方法变量变量分组分组方法方法以一个变量值代表一组。如:人口按年龄分以一个变量值代表一组。如:人口按年龄分组组1 1岁一组,学生按报考科目分组等。这种岁一组,学生按报考科目分组等。这种分组适用于离散性变量,且变量值的个数较分组适用于离散性变量,且变量值的个数较少的情况。少的情况。以变量值变动的一个区间作为一组,区间的以变量值变动的一个区间作为一组,区间的距离称为组距。适用于连续型变量和离散型距离称为组距。适用于连续型变量和离散型变量的变量值较多的情况变量的变量值较多的情况。按

30、品质标志对资料进行分组。这种分组有些比较简单,按品质标志对资料进行分组。这种分组有些比较简单,有些非常复杂,复杂的品质分组称为分类。如:人口有些非常复杂,复杂的品质分组称为分类。如:人口按性别分组、按职业分组、企业按经济类型分组、等。按性别分组、按职业分组、企业按经济类型分组、等。单项式单项式分分 组组组距式组距式分分 组组三、统计分组方法三、统计分组方法 等距分组等距分组:各组组距均相等。如:各组组距均相等。如:10102020 20 203030 30 304040以上各组组距均为以上各组组距均为1010。这种分组适用于均匀分布的总体这种分组适用于均匀分布的总体。不等距不等距 分分 组组各

31、组组距不一定相等。如:各组组距不一定相等。如:10102020 20 205050 50 506060 60 607070 以上分组中,其中第二组与其它各组的以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。大或者是为了满足特殊的研究目的的需要。在进行组距分组时,会涉及到一些在进行组距分组时,会涉及到一些问题,包括:等距分组和不等距分问题,包括:等距分组和不等距分组、组限、组中值。组、组限、组中值。组限组限组限就是每一组两端的数值。组限就是每一组两端的数值。10 20 20 30 30 40下限下

32、限上限上限 确定组限的方法有两种:确定组限的方法有两种:间断式确定组限和重叠式确定组限间断式确定组限和重叠式确定组限。职工人数(人)职工人数(人)99以下以下 100199 200299 300399固定资产额(万元)固定资产额(万元)5060 6070 7080 8090间断式确定组限间断式确定组限适用于离散变量适用于离散变量重叠式确定组限适用于连续变量第三章第三章第三章第三章第三章第三章 统计整理统计整理统计整理统计整理统计整理统计整理组中值每组上限与下限之间的中点数值,是各组的每组上限与下限之间的中点数值,是各组的假定平均数。假定平均数。组中值组中值=(上限值(上限值+下限值)下限值)2

33、开口组组中值的计算:开口组组中值的计算:缺下限:组中值缺下限:组中值=本组上限本组上限(相邻组组距相邻组组距/2)/2)缺上限:组中值缺上限:组中值=本组下限本组下限+(+(相邻组组距相邻组组距/2)/2)例如例如:产值(万元)产值(万元)50以下以下50 6060 7070以上以上第一组组中值:第一组组中值:50(102)=45最后一组组中值:最后一组组中值:70+(102)=75频数分布(分布数列)频数分布(分布数列)分布数列是一种重要的分组资料,反映分布数列是一种重要的分组资料,反映总体单位在各组的分布状态。总体单位在各组的分布状态。分组分组单位数单位数频率频率合计合计100频数分布频数

34、分布频率分布频率分布工资分组工资分组 职工人数(人)职工人数(人)各组人数所占比重各组人数所占比重 (元)(元)(次数或频数)(次数或频数)(%)(频率)(频率)500600 100 25600700 200 50700800 100 25 合合 计计 400 100频率:各组的频率大于频率:各组的频率大于0 0,各组的频率总和等于,各组的频率总和等于1 1或或100%100%。(二)分配数列的种类(二)分配数列的种类 分配数列是在分组的基础上形成的,根据分组时采用的分分配数列是在分组的基础上形成的,根据分组时采用的分组标志不同,分配数列可分为:组标志不同,分配数列可分为:品质分配数列品质分配

35、数列变量分配数列变量分配数列单项式分配数列单项式分配数列组距分配数列组距分配数列等距数列等距数列不等距数列不等距数列分配数列分配数列(这种数列一般比较稳定,只要分组(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能准确地反标准定的比较恰当,通常能准确地反映总体的分布特征。)映总体的分布特征。)(三)分(三)分 配配 数数 列列 的的 编编 制制1 1、品质分配数列的编制、品质分配数列的编制:只需将品质标志的表现一一排列出来,然后汇总只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:出每一种标志表现出现的次数即可。如下例:100100 250250 合合 计

36、计 4040 32 32 20 20 8 8 100 100 80 80 50 50 20 20 国有企业国有企业 股份制企业股份制企业 合资企业合资企业 独资企业独资企业 比重(比重(%)企企 业业 数数 经济类型经济类型2、变量分配数列的编制:、变量分配数列的编制:其基本步骤为:其基本步骤为:第一步:将原始资料按数值大小依次排列。第一步:将原始资料按数值大小依次排列。第二步:确定变量的类型和分组方法(单第二步:确定变量的类型和分组方法(单 项式分组或组距分组)。项式分组或组距分组)。第三步:确定组数和组距。当组数确定后,第三步:确定组数和组距。当组数确定后,组距可计算得到:组距可计算得到:

37、组距组距 =全距全距组数组数 全距全距 =最大变量值最小变量值最大变量值最小变量值第四步:确定组限。第四步:确定组限。注意:注意:第一组的下限要小于或等于第一组的下限要小于或等于最小变量值,最后一组的上限要大最小变量值,最后一组的上限要大于最大变量值。)于最大变量值。)第五步:汇总出各组的单位数,计第五步:汇总出各组的单位数,计算频率,并编制统计表。算频率,并编制统计表。间断式确定组限:汇总各组单位数时,按照间断式确定组限:汇总各组单位数时,按照“上下限均上下限均 包括在本组内包括在本组内”的原则汇总。的原则汇总。职工人数(人)职工人数(人)499499以下以下 500 500 599 599

38、 600 600 699 699 700 700 799 799重叠式确定组限:汇总各组单位数时,按照重叠式确定组限:汇总各组单位数时,按照“上组限不在上组限不在 内内”的原则汇总。的原则汇总。产值(万元)产值(万元)50 50 60 60 60 60 70 70 70 70 80 80 80 80 90 90单位数(个)单位数(个)单位数(个)单位数(个)因为有了因为有了“上组限不在内上组限不在内”的原则,实际工作中,对的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。于离散型变量也经常采用重叠式确定组限的方法。序序 计划完成计划完成 工人数工人数 比重比重 向上累计向上累计

39、 向下累计向下累计号号 程度(程度(%)(人)(人)(%)人数人数 比重比重 人数人数 比重比重 1 60 70 2 1.0 2 70 80 5 2.5 3 80 90 14 7.0 4 90 100 31 15.5 5 100110 65 32.5 6 110120 52 26.0 7 120130 23 11.5 8 130140 8 4.0 合合 计计 200 100 3、累计频数或频率分配数列的编制方法、累计频数或频率分配数列的编制方法通过累计频数分配数列可以反映累计到某一组出现的总次通过累计频数分配数列可以反映累计到某一组出现的总次数或总频率。想一想:第四组的累计结果说明什么问题?数

40、或总频率。想一想:第四组的累计结果说明什么问题?2721521171691922001.03.510.526.058.584.596.0100831831481791931982004.015.541.574.089.596.599.0100统计表统计表构成构成总总 表表 题题 横行标题:统计研究的对象横行标题:统计研究的对象,也称主词。也称主词。纵栏标题:说明主词的指标名称纵栏标题:说明主词的指标名称,也称宾词。也称宾词。数字资料数字资料分类分类主词主词简单表简单表分组表分组表复合表复合表宾词宾词平行形式平行形式交叉形式交叉形式某厂职工人数统计表某厂职工人数统计表按性别分组按性别分组男男 职

41、职 工工女女 职职 工工合合 计计人数(人)人数(人)(频数)(频数)比率()比率()(频率)(频率)25311536868.7531.25100.00返回返回某厂职工家庭人口分组统计某厂职工家庭人口分组统计按家庭人口分组按家庭人口分组1合合 计计职工户数职工户数(频数)(频数)比率()比率()(频率)(频率)7返回返回23456381055431202.915.241.320.512.18.0255100某厂职工人数统计表某厂职工人数统计表按人数分组按人数分组5101116合合 计计人数(人)人数(人)(频数)(频数)比率()比率()(频率)(频率)512325.051.04.0返回返回17

42、2220100上海市总人口数(上海市总人口数(19801991)年年 份份1980年末总人口年末总人口1146.52返回返回年年 份份年末总人口年末总人口198119821983198419851986198719881989199119901162.841180.511194.011204.781216.691232.331249.511262.421276.451283.351287.20统计图统计图直方图直方图等距数列:(变量,频数)等距数列:(变量,频数)异距数列:(变量,频数密度)异距数列:(变量,频数密度)折线图折线图曲线图曲线图 等距数列:(组中值,频数)等距数列:(组中值,频数

43、)异距数列:(组中值,频数密度)异距数列:(组中值,频数密度)单项数列:(变量,频数)单项数列:(变量,频数)向上累计分布:(变量上限,累计频数)向上累计分布:(变量上限,累计频数)向下累计分布:(变量下限,累计频数)向下累计分布:(变量下限,累计频数)变量的组数无限增多时,折线便趋于一条变量的组数无限增多时,折线便趋于一条光滑的曲线。光滑的曲线。返回返回一、判一、判 断断 对对 错错1 1、对统计资料进行分组的目的就是为了区分各组单位之间质、对统计资料进行分组的目的就是为了区分各组单位之间质的不同。(的不同。()2 2、组中值是根据各组上限和下限计算的平均值,所以它代表、组中值是根据各组上限

44、和下限计算的平均值,所以它代表了各组的平均分配次数。(了各组的平均分配次数。()3 3、分配数列的实质是把总体单位总量按照总体所分的组进行、分配数列的实质是把总体单位总量按照总体所分的组进行分配。(分配。()4 4、某企业职工按文化程度分组形成的分配数列是一个单项式、某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。(分配数列。()5 5、对资料进行组距式分组,是假定变量值在各组内部的分布、对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。(是均匀的,所以这种分组会使资料的真实性受到损害。()6 6、任何一个分布都必须满足:各组的频率大

45、于、任何一个分布都必须满足:各组的频率大于0 0,各组的频数,各组的频数总和等于总和等于1 1或或100%100%()7 7、统计分组后掩盖了各组内部各单位的差异,而突出了各组、统计分组后掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。(之间单位的差异。()二、单二、单 项项 选选 择择 题题1 1、统计整理的关键是(、统计整理的关键是()A A、对调查资料进行审核、对调查资料进行审核 B B、对调查资料进行统计分组、对调查资料进行统计分组C C、对调查资料进行汇总、对调查资料进行汇总 D D、编制统计表、编制统计表2 2、下列分组中属于按品质标志分组的是(、下列分组中属于按品质标志分

46、组的是()A A、学生按考试分数分组、学生按考试分数分组 B B、产品按品种分组、产品按品种分组C C、企业按计划完成程度分组、企业按计划完成程度分组 D D、家庭按年收入分组、家庭按年收入分组3 3、有一个学生考试成绩为、有一个学生考试成绩为8080分,在统计分组中,这个变量值分,在统计分组中,这个变量值应归到(应归到()组。)组。A A、60607070分分 B B、70708080分分C C、80809090分分 D D、9090100100分分C C4 4、某主管局将下属企业先按轻、重工业分组,再按规模分组,、某主管局将下属企业先按轻、重工业分组,再按规模分组,这种分组属于(这种分组属于()分组。)分组。A A、简单分组、简单分组 B B、复合分组、复合分组C C、分析分组、分析分组 D D、结构分组、结构分组三、多项选择题部分2、在次数分配数列中()A、总次数一定,频数和频率成反比B、各组的频数之和等于100C、各组频率大于零,频率之和等于1D、频率越小,则组的标志值所起的作用越小E、频率表明各组标志值对总体的相对作用程度1、下列数列属于 按生产计划完成程度分组(%)企业数 8090 15 90100 30 100110 5 合 计 50 、品质分配数列 、变量分配数列、组距式变量分配数列 、等距变量分配数列、次数分配数列

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!