数据模型第二章数据及其描述分析.ppt
《数据模型第二章数据及其描述分析.ppt》由会员分享,可在线阅读,更多相关《数据模型第二章数据及其描述分析.ppt(44页珍藏版)》请在装配图网上搜索。
第二讲,数据及其描述分析,本讲内容,一、统计学中的常见概念二、数据类型三、主要统计指标四、时间序列五、统计图表,一、统计学中的常见概念,1、总体:研究对象的集合2、个体(总体单位):研究对象集合中的每一个个体3、标志:反映总体单位特征的名称,如工资、利润、企业类型等,有数量标志和品质标志4、指标:反映总体数量特征的名称,如产量,续:,5、变量:指可以变化的量,指标和数量标志因其值是可变的,因而也称为变量6、样本:从总体中抽出部分个体组成的集合7、数据:指标或标志的取值,二、数据类型,1、数值型和属性型数据,数值型数据如收入、利润、成本、企业数等。不能用数值表示的数据称为属性数据,如职工性别、企业类型等。,2、静态数据和动态数据,根据数据是否随时间变化,可以分为静态数据和动态数据。,3、时间序列数据和截面数据,如下表,表示从1978年到2009年,城乡家庭恩格尔系数的变化:时间序列数据,续:,如下表,表示2008年这一时间段内5个城市空气质量的主要指标。(截面数据),4、定类数据、定序数据、定距数据和定比数据,定类数据:马鞍山市不同企业的名称。(不可加减乘除,比较也没有意义)定序数据:企业的产品质量等级。(可以比较)定距数据:各城市一年的平均气温。(可加减)定比数据:09年全国大城市房地产价格指数。(可进行任何计算),三、主要统计指标,统计指标分为四大类:总量指标相对指标平均指标变异指标,1、总量指标,价值量,实物量,产值:1亿元,货运量:1亿吨,产值:1亿元,固定资产:1亿元,注:ROE=净利润/平均净资产,2、相对指标,3、平均指标,(1)算术平均数,平均数衡量数据的平均水平,也可指中心。数据来自于未分组资料,平均数公式为:数据来自于分组资料,平均数定义为,简单算术平均数,加权算术平均数,注:为克服异常数据,常去掉几个最大值和最小值,称为修剪平均数,(2)中位数,将所有数据按从小到大排序,位于中央的数据为中位数,它是数据的位置中心。,(3)众数、几何平均数,众数:是频率出现最高的数几何平均数:主要用于利率等数据平均数的计算公式为:,案例:房屋租金,以下是来自某地区房屋租金的实际数据,试运用Excel计算其平均租金、租金的中位数和众数,Excel主要操作步骤,Excel计算步骤如下:1、将70个原始数据输入到Excel工作表的A1:J7单元格中。2、在开始菜单中选择编辑菜单中的数据计算。3、选择需要计算的函数名。4、出现对话框时,在“输入区域”方框内键入A1:J7,最后选择“确定”。,4、标志变异指标,(1)全距,全距是数据中最大与最小间的差距是衡量数据变异程度最简单的描述全距对最大与最小数据的值的敏感性很强,(2)方差,方差是度量数据分散程度的指标,也可以认为是不均衡程度、风险程度,其计算公式为:,(3)标准差、变异系数,标准差为方差的正平方根变异系数是标准差相对于平均数的大小的度量,计算公式为:,房屋租金例,续:,Variance方差StandardDeviation标准差CoefficientofVariation变异系数,四、时间序列,1、发展水平2、发展速度:定基发展速度、环比发展速度3、增长速度:定基增长速度、环比增长速度4、百分之一增长量,1、发展水平,时间序列:指按照时间先后顺序排列形成的一列数,数列中的每一个数称为该期的发展水平。,初期,末期,2、发展速度,定基发展速度:以某一期为基期,所有其它期发展水平与此相比得到的。环比发展速度:以上一期为基期,下一期发展水平与此相比得到的。,3、增长速度,增长速度=发展速度-1(定基增长速度、环比增长速度)平均增长速度:平均增长速度=平均发展速度1,4、百分之一增长量、同期增长,百分之一增长量公式为:同期增长:本年与上年同期相比的值,五、统计图表,表12006-2008我国GDP,1、饼图,饼图是常用于描述总体内部结构的图形方法,2、柱状图,3、直方图,直方图是描述在一个频数、相对频数或百分数频数分布中汇总的品质数据的图形方法。以下数据来自一次关于产品质量的调查结果,表2产品质量调查结果汇总表,续:,4、散点图,频数分布,确定无重叠的组别数一般分为5-20个组大量元素数据分较多的组小量元素数据分较少的组确定每一组的宽度每一组别的宽度相同近似组宽为,频数分布,汽车修理问题,实际举例,频数分布,如果分为6组组宽约=(109-52)/6=9.510Cost($)Frequency50-59260-691370-791680-89790-997100-1095Total50,实际举例,相对频数,一组的相对频数=一组的频数nn=元素个数,相对频数和百分数频数,RelativePercentCost($)FrequencyFrequency50-59.04460-69.262670-79.323280-89.141490-99.1414100-109.1010Total1.00100,躬形图,穹形图是一种累积频数分布或累积相对频数分布的图形数据值列示在横轴上纵轴为累积频数或相对累积频数,穹形图,实际举例,穹形图,散点图,散点图是两个变量之间关系的图形。,本讲小节,1、本讲首先介绍了一系列数据类型和描述性指标2、各种表格方法是对统计数据进行初步描述的清晰易懂的方法3、各种图形方法可为决策者理清数据的一些规律,以便于决策制定,- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据模型 第二 数据 及其 描述 分析
装配图网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文