第三章社会统计资料的整理

上传人:痛*** 文档编号:171481223 上传时间:2022-11-27 格式:PPT 页数:58 大小:1.26MB
收藏 版权申诉 举报 下载
第三章社会统计资料的整理_第1页
第1页 / 共58页
第三章社会统计资料的整理_第2页
第2页 / 共58页
第三章社会统计资料的整理_第3页
第3页 / 共58页
资源描述:

《第三章社会统计资料的整理》由会员分享,可在线阅读,更多相关《第三章社会统计资料的整理(58页珍藏版)》请在装配图网上搜索。

1、 主要内容主要内容 原始资料杂乱无章,需加整理,才能为人所用。统计资料原始资料杂乱无章,需加整理,才能为人所用。统计资料的整理,其基础是统计分组。所谓统计分组就是按统计研的整理,其基础是统计分组。所谓统计分组就是按统计研究的目的和要求,将总体单位或全部调查数据按一定的标志究的目的和要求,将总体单位或全部调查数据按一定的标志划分成若干组,使组内差异尽量小,而组与组之间则有明显划分成若干组,使组内差异尽量小,而组与组之间则有明显差异,从而使原本杂乱无章的资料有序化,以便为在统计分差异,从而使原本杂乱无章的资料有序化,以便为在统计分析中提炼各种有用信息打下基础。析中提炼各种有用信息打下基础。统计表统

2、计表变量数列的编制变量数列的编制统计图统计图 统计分组的原则与标准统计分组的原则与标准 统计分组的原则统计分组的原则第一节第一节 统计分组的原则与标准统计分组的原则与标准 1分组应使各类别构成之和等于总体分组应使各类别构成之和等于总体 “穷举穷举”“互斥互斥”2分组设计应能反映统计总体的分布规律性分组设计应能反映统计总体的分布规律性 统计分组主要是为了能很好地反映统计总体的构统计分组主要是为了能很好地反映统计总体的构成状况,即反映总体中各单位的分布特征。分组设计成状况,即反映总体中各单位的分布特征。分组设计要适应这一要求,必须在分组后使总体单位总数在各要适应这一要求,必须在分组后使总体单位总数

3、在各组的分配情况能够反映总体的分布规律性。组的分配情况能够反映总体的分布规律性。某社团成员的构成某社团成员的构成 性别性别 人数人数 男男 女女 28 22 人数人数 年龄年龄 3 7 12 18 1055-6535-45 45-5525-3515-25频数分布数列频数分布数列 在统计资料搜集的在统计资料搜集的基础上,按分组原则,基础上,按分组原则,将总体中所有单位依一将总体中所有单位依一定顺序归类整理,即可定顺序归类整理,即可得到能够表明总体单位得到能够表明总体单位总数在各组分配情况的总数在各组分配情况的频数频数(或次数或次数)分布数列,分布数列,简称数列。频数分布数简称数列。频数分布数列是

4、统计分组工作的产列是统计分组工作的产物。物。品质数列品质数列 变量数列变量数列 100名男性青年的身高表名男性青年的身高表 单位:厘米单位:厘米第二节第二节 统计表统计表 166 181 173 171 168 164 178 167 156 194 169 175 183 168 165 180 170 172 167 175 173 169 174 172 171 169 173 184 173 169 170 181 185 168 174 187 167 174 169 165 167 172 174 173 155 179 164 158 165 162 157 175 182 16

5、8 176 161 171 163 176 159 171 178 172 169 158 163 166 168 160 178 170 164 160 170 166 178 171 167 162 169 165 171 165 168 176 174 163 177 164 170 161 179 177 162 149 169 166 153 177 164 统计调查搜统计调查搜集来的资料往往集来的资料往往是没有次序的原是没有次序的原始资料始资料(参见右表参见右表),使原始资料有,使原始资料有序化,列表和作序化,列表和作图是两种基本方图是两种基本方法,得到的分别法,得到的分别就是统计

6、表和统就是统计表和统计图。计图。2010年我国城乡人口情况年我国城乡人口情况 按城乡分按城乡分 比重(比重(%)人口数(万人)人口数(万人)12845339.0960.917824150212统计表的格式、内容与种类统计表的格式、内容与种类l格式格式 统计表是表示统计统计表是表示统计资料的表格,在由横行资料的表格,在由横行、纵栏交叉结合而成的、纵栏交叉结合而成的表格上,它能系统地组表格上,它能系统地组织和合理地安排大量数织和合理地安排大量数字资料。字资料。总标题总标题 乡村乡村 城镇城镇100.00合计合计 纵栏标题纵栏标题 统计数值统计数值 横行标题横行标题 表34 离婚案件构成离婚案件构成

7、l内容内容 主词主词统计表所要说明的对象。统计表所要说明的对象。宾词宾词用来说明主词的标志和标志值。用来说明主词的标志和标志值。如需要,主宾词可互换。如需要,主宾词可互换。l统计表按主统计表按主词是否分组以词是否分组以及分组的程度及分组的程度可分为可分为简单分组表简单分组表复合分组表复合分组表简单表简单表 中国人口年龄结构状况中国人口年龄结构状况 单位:单位:%资料来源|:2010中国统计年鉴第99页。简单分组表简单分组表 复合分组表复合分组表 我国社会福利主要费用情况我国社会福利主要费用情况 单位:亿单位:亿元元 资料来源|:2010中国统计年鉴第838页。统计表的制作规则统计表的制作规则变

8、量数列的构成要素变量数列的构成要素 第三节第三节 变量数列的编制变量数列的编制 在社会统计学中,总体中各单位的分布特征首在社会统计学中,总体中各单位的分布特征首先是用统计表来表示的。能够表示变量分布及其特先是用统计表来表示的。能够表示变量分布及其特征的统计表,即变量数列。它有两个构成要素:征的统计表,即变量数列。它有两个构成要素:变量值变量值 Xi频数频数 fi =NfPiiNfnii111niiP相对频数相对频数 Pi离散变量数列离散变量数列 离散变量所描述的对象的数量特征,可以按一离散变量所描述的对象的数量特征,可以按一定次序列出它的整数值,相邻两变量值不会出现小定次序列出它的整数值,相邻

9、两变量值不会出现小数,因而能编制出单项式和组距式两种变量数列。数,因而能编制出单项式和组距式两种变量数列。单项数列单项数列 组距数列组距数列 组距组距(hi)=上限上限(ui)下限下限(li)组中值组中值(mi)=或或 组中值组中值(mi)=2iiul 2iiilul人口数(人口数(X)户数户数(f)频率频率(P)23456785816106410.100.160.320.200.120.080.02合计合计501.00 离散变量单项数列离散变量单项数列if组中值(iXif 离散变量组距数列离散变量组距数列 某地区小学班级数某地区小学班级数 连续变量数列连续变量数列 连续变量因其数学特征,在一

10、个区间可以有无连续变量因其数学特征,在一个区间可以有无限多数值,无法按顺序一一列举,所以只能编制组限多数值,无法按顺序一一列举,所以只能编制组距数列。与离散变量组距数列不同之处在于,根据距数列。与离散变量组距数列不同之处在于,根据连续变量的特征,此时组距数列中相邻两组的上限连续变量的特征,此时组距数列中相邻两组的上限和下限共有一个组限,即相邻两组交界处的组限重和下限共有一个组限,即相邻两组交界处的组限重合。至于恰等于某一组限的数据合。至于恰等于某一组限的数据(如下表中身高如下表中身高164厘米厘米)归于哪一组,应该按照归于哪一组,应该按照“上限不包括在内上限不包括在内”的原则处理。这就是说,的

11、原则处理。这就是说,164应归于应归于“164168”这这一组,而不应归于一组,而不应归于“160l64”这一组。有了这一这一组。有了这一规定,就不会在编制连续变量的数列时,发生违背规定,就不会在编制连续变量的数列时,发生违背“穷举穷举”与与“互斥互斥”这两个基本原则的情况了。这两个基本原则的情况了。男青年身高按男青年身高按4厘米的间距分组时的频数分布厘米的间距分组时的频数分布 连续变量数列连续变量数列NRhlg322.313.确定确定组距和组距和组数组数)组距()全距()组数(hRn 组距频数频数密度组距频率频率密度 频数密度和标准组距频数计算表频数密度和标准组距频数计算表n向上累计向上累计

12、以变量数以变量数列首组的频数为始点,逐列首组的频数为始点,逐个累计各组的频数,展示个累计各组的频数,展示小于该组上限的频数和。小于该组上限的频数和。n向下累计向下累计以变量数以变量数列末组的频数为始点,逐列末组的频数为始点,逐个累计各组的频数,展示个累计各组的频数,展示大于该组下限的频数和。大于该组下限的频数和。1概念:用等宽直条的长短来表示各相互独立的指标大小的图形。2适用资料:相互独立的资料。相互独立的资料。3分类:分为单式和复式两种。单式适用于只有一组观察资料,复式适用于有若干组观察资料。4绘制要点(了解)5应用:应用:相互独立资料间的比较。相互独立资料间的比较。n适用资料:相互独立的资

13、料(资料有适用资料:相互独立的资料(资料有明确分组,不连续)。明确分组,不连续)。n分类:分为单式和复式两种。单式适分类:分为单式和复式两种。单式适用于只有一组观察资料(见图用于只有一组观察资料(见图1),),复式适用于有若干组观察资料复式适用于有若干组观察资料 n绘制要点:绘制要点:坐标轴:横轴为观察项目,纵轴为坐标轴:横轴为观察项目,纵轴为数值,纵轴坐标一定要从数值,纵轴坐标一定要从0开始。开始。直条的宽度:各直条应等宽,等间直条的宽度:各直条应等宽,等间距,间距宽度和直条相等或为其一半。距,间距宽度和直条相等或为其一半。复式直条图在同一观察项目的各组之复式直条图在同一观察项目的各组之间无

14、间距。间无间距。排列顺序:可以根据数值从大到小,排列顺序:可以根据数值从大到小,从小到大,或按时间顺序排列。从小到大,或按时间顺序排列。n应用:相互独立资料间的比较。应用:相互独立资料间的比较。图1.三 组标本血清阳性例数012345678甲乙丙组别阳性例数图2.某 地1 9 9 5年 癌 症、心血管疾病死亡率020406080100120癌症心血管疾病死亡率(1/1 0 万)男女图4.某 地5 岁以下 儿童死亡原因分布43%30%18%9%呼吸系疾病传染病先天性疾病其它条件下,很显然各矩形的面积条件下,很显然各矩形的面积与其高度成正比。因此,各矩与其高度成正比。因此,各矩形的面积同样可以用来

15、表示各形的面积同样可以用来表示各组的频数或频率,而且看起来组的频数或频率,而且看起来更形象直观。如果取各矩形的更形象直观。如果取各矩形的总面积为总面积为1,各矩形的面积必,各矩形的面积必定等于各组的相对频数。定等于各组的相对频数。其实,在频数分布图中,用面积来理解频数分布状更合适。比如直方图,当处理异距分组时应该用矩形面积而不用矩形高度来显示频数分布。下面是根据表315绘制出的两个直方图。左图用矩形高度来表示各组频数就会产生错觉。右图是按照标准组距频数作出来的,用矩形面积来表示各组频数就避免了不必要的错觉。以后当我们接触正态曲线等曲线后,将进一步体会到用面积来表示频数分布的好处。5.曲线图曲线

16、图(Diagram)图5 某地1 9 49-1958年 婴 儿死亡率0204060801001201401949 1950 1951 1952 1953 1954 1955 1956 1957 1958年份婴儿死亡率(1/千)钟形曲线:钟形曲线:“中间大,两头小中间大,两头小”对称分布:对称分布:正态分布正态分布非对称分布:非对称分布:偏态分布偏态分布右偏、左偏右偏、左偏iniiiniiIPIPG111111BAAG 2004年我国农民家庭人口及收入构成累计年我国农民家庭人口及收入构成累计 单位:%资料来源:统计研究2005年第1期。图1 0.某 地2 0 岁男 青 年身高和前臂长的关系15016017018019040455055 前臂长(c m)身高(c m)做图做图00.10.20.30.40.50.60.70.80.91051015202530WR

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!