用图表展示数据(2011年).ppt

上传人:xin****828 文档编号:20689543 上传时间:2021-04-13 格式:PPT 页数:84 大小:1.05MB
收藏 版权申诉 举报 下载
用图表展示数据(2011年).ppt_第1页
第1页 / 共84页
用图表展示数据(2011年).ppt_第2页
第2页 / 共84页
用图表展示数据(2011年).ppt_第3页
第3页 / 共84页
资源描述:

《用图表展示数据(2011年).ppt》由会员分享,可在线阅读,更多相关《用图表展示数据(2011年).ppt(84页珍藏版)》请在装配图网上搜索。

1、数据分析 (方法与案例 ) 作者 贾俊平 统 计 学 2 - 2 统计学 STATISTICS (第四版 ) 2021-1-23 图并没有说谎,是说谎者在画图。 Benjamin Disraeli 统计名言 第 2 章 用图表展示数据 2.1 用图表展示定性数据 2.2 用图表展示定量数据 2.3 合理使用图表 2 - 4 统计学 STATISTICS (第四版 ) 2021-1-23 学习目标 定性数据的频数分布表 定性数据的图示方法 定量数据的频数分布表 定量数据的图示方法 用 Excel和 SPSS作 频数分布表和 图 形 合理使用图表 2 - 5 统计学 STATISTICS (第四版

2、 ) 2021-1-23 用哪些图形展示奖牌? 2009年 7月 26日至 8月 3日第 13届世界游泳锦标 赛在意大利罗马举行 。 美国的泳坛霸主地位难 以撼动 , 中国军团也创造了史上第二的佳绩 在本届游泳世锦赛上 , 中国代表团取得金牌数 和奖牌与美国并列第一 、 奖牌榜排名第二的好 成绩 , 而且中国男子游泳首次夺得世界性大赛 的冠军并一举打破世界纪录 。 本届游泳世锦赛 共设有奖牌 227枚 , 其中金牌 75枚 、 银牌 75枚 、 铜牌 77枚 。 下表是本届游泳世锦赛金牌总数取 得前三名的国家所获得奖牌的分布情况 2 - 6 统计学 STATISTICS (第四版 ) 2021

3、-1-23 用哪些图形展示奖牌? 根据上面的数据 , 你认为可以选择哪些图形来展示 三个国家所获得的奖牌情况 ? 学完本章的图表展示 技术 , 这样的问题就会迎刃而解 2 - 7 统计学 STATISTICS (第四版 ) 2021-1-23 统计应用 把数据画图之后,要用用脑袋 沃德 (Abraham Wald)和许多统计学家 一样 , 在第二次世界大战时也处理了战 争与相关的问题 。 他发明的一些统计方 法在战时被视为军事机密 。 以下是他提 出的概念中较简单的一种 沃德被咨询飞机上什么部位应该加强钢 板时 , 开始研究从战役中返航的军机上 受敌军创伤的弹孔位置 。 他画了飞机的 轮廓 ,

4、 并且标识出弹孔的位置 。 资料累 积一段时间后 , 几乎把机身各部位都填 满了 。 于是沃德建议 , 把剩下少数几个 没有弹孔的部位补强 。 因为这些部位被 击中的飞机都没有返航 资料来源: David S.Mroore 2.1 用图表展示定性数据 2.1.1 生成频数分布表 2.1.2 定性数据的图示 第 2 章 用图表展示数据 2.1.1 生成频数分布表 2.1 用图表展示定性数据 2 - 10 统计学 STATISTICS (第四版 ) 2021-1-23 生成频数分布表 (定性数据 ) 1. 列出各类别 2. 计算各类别的频数 3. 生成频数分布表 分类 频数 比例 百分比 比率 A

5、 B C D E 2 - 11 统计学 STATISTICS (第四版 ) 2021-1-23 定性数据的描述统计量 1. 频数 (frequency) : 落在各类别中的数据个数 2. 比例 (proportion) : 某一类别数据个数占全 部数据个数的比值 3. 百分比 (percentage) : 将对比的基数作为 100 而计算的比值 4. 比率 (ratio) : 不同类别数值个数的比值 2 - 12 统计学 STATISTICS (第四版 ) 2021-1-23 生成频数分布表 (定性数据 ) 【 例 2-1】 为研究人们 对不同类型软饮料的偏 好情况 , 一家调查公司 在某超市

6、随机调查了 50名顾客 。 右表是顾 客性别及其所偏好的饮 料类型记录 。 生成频数 分布表 , 观察不同性别 的顾客及其所偏好的饮 料类型的分布状况 , 并 进行描述性分析 制作频数分布表 绿色 健康饮品 2 - 13 统计学 STATISTICS (第四版 ) 2021-1-23 使用 Excel数据透视表计数 (pivot table) 第 1步: 选择 【 数据 】 菜单中的 【 数据透视表和数据透视图 】 第 2步: 确定数据源区域 (在操作前将光标放在任意数据单元格 内 , 系统会自动选定数据源区域 ) 第 3步: 在 【 向导 3步骤之 3】 中选择数据透视表的输出位 置 , 然

7、后选择 【 布局 】 第 4步: 在 【 向导 布局 】 对话框中 , 依次将 “ 饮料类型 ” 拖 至左 边的 “ 行 ” (或列 )区域 , 将 “ 顾客性别 ” 拖至 “ 列 ” (或 行 )区域 , 将 “ 饮料类型 ” 拖至 “ 数据 ” 区域 。 第 5步: 单击 【 确定 】 , 自动返回 【 向导 3步骤之 3】 对话 框 。 单击 【 完成 】 用数据透视表生成定性数据的频数分 布 2 - 14 统计学 STATISTICS (第四版 ) 2021-1-23 生成频数分布表 (列联表 Excel) 不同类型饮料和不同性别顾客的频数分布 绿色 健康饮品 2 - 15 统计学 S

8、TATISTICS (第四版 ) 2021-1-23 用 SPSS生成定性数据的频数分布表 (单变量频数分布表 ) 第 1步: 选择 【 Analyze】 【 Descriptive Statistics-Frequencies】 进入主对话框 第 2步: 将 “ 饮料类型 ” 或 “ 顾客性别 ” 选入 【 Variable(s)】 ;选中 【 Display Frequency tables】 第 3步 (若需要描述统计量或图形 )主点 【 Statistics】 或 【 Charts】 , 并选择相应的选项 。 点击 【 OK】 生成频数分布表 2 - 16 统计学 STATISTICS

9、 (第四版 ) 2021-1-23 生成频数分布表 (定性数据 SPSS) 不同类型饮料的频数分布 饮料类型 6 1 2 . 0 1 2 . 0 1 2 . 0 10 2 0 . 0 2 0 . 0 3 2 . 0 11 2 2 . 0 2 2 . 0 5 4 . 0 8 1 6 . 0 1 6 . 0 7 0 . 0 15 3 0 . 0 3 0 . 0 1 0 0 . 0 50 1 0 0 . 0 1 0 0 . 0 果汁 矿泉水 绿茶 其他 碳酸饮料 To t a l V a l i d Fr e q u e n c y P e r c e n t V a l i d P e r c e

10、 n t C u m u l a t i v e P e r c e n t 顾客性别 22 4 4 . 0 4 4 . 0 4 4 . 0 28 5 6 . 0 5 6 . 0 1 0 0 . 0 50 1 0 0 . 0 1 0 0 . 0 男 女 T o t a l V a l i d F r e q u e n c y P e r c e n t V a l i d P e r c e n t C u m u l a t i v e P e r c e n t 升序 排列 ( 汉字 拼音 字母 ) 2 - 17 统计学 STATISTICS (第四版 ) 2021-1-23 用 SPS

11、S生成定性数据的列联表 (Crosstabulation 交叉表 ) 第 1步: 选择 【 Analyze】 【 Descriptive Statistics- Crosstabs】 进入主对话框 第 2步: 将 “ 饮料类型 ” 选入 【 Row(s)】 , 将 “ 顾客性别 ” 选 入 【 Column(s)】 (行列可以互换 ) 第 3步: (若需要对列联表进行描述性分析 )点击 【 Cells】 , 在 【 Percentages】 下选中需要的统计 量 , 如 【 Row】 、 【 Column】 、 【 Total】 等; (若 需要图形 )点击 【 Display cluster

12、ed bar chart】 。 点击 【 OK】 生成交叉频数分布表 2 - 18 统计学 STATISTICS (第四版 ) 2021-1-23 列联表的描述性分析 (例题分析 SPSS) 列 联 表 的 统 计 描 述 饮料类型 * 顾客性别 C r o s s t a b u l a t i o n 1 5 6 1 6 . 7 % 8 3 . 3 % 1 0 0 . 0 % 4 . 5 % 1 7 . 9 % 1 2 . 0 % 2 . 0 % 1 0 . 0 % 1 2 . 0 % 6 4 10 6 0 . 0 % 4 0 . 0 % 1 0 0 . 0 % 2 7 . 3 % 1 4

13、 . 3 % 2 0 . 0 % 1 2 . 0 % 8 . 0 % 2 0 . 0 % 7 4 11 6 3 . 6 % 3 6 . 4 % 1 0 0 . 0 % 3 1 . 8 % 1 4 . 3 % 2 2 . 0 % 1 4 . 0 % 8 . 0 % 2 2 . 0 % 2 6 8 2 5 . 0 % 7 5 . 0 % 1 0 0 . 0 % 9 . 1 % 2 1 . 4 % 1 6 . 0 % 4 . 0 % 1 2 . 0 % 1 6 . 0 % 6 9 15 4 0 . 0 % 6 0 . 0 % 1 0 0 . 0 % 2 7 . 3 % 3 2 . 1 % 3 0 .

14、 0 % 1 2 . 0 % 1 8 . 0 % 3 0 . 0 % 22 28 50 4 4 . 0 % 5 6 . 0 % 1 0 0 . 0 % 1 0 0 . 0 % 1 0 0 . 0 % 1 0 0 . 0 % 4 4 . 0 % 5 6 . 0 % 1 0 0 . 0 % C o u n t % w i t h i n 饮料类型 % w i t h i n 顾客性别 % o f T o t a l C o u n t % w i t h i n 饮料类型 % w i t h i n 顾客性别 % o f T o t a l C o u n t % w i t h i n 饮料类型

15、 % w i t h i n 顾客性别 % o f T o t a l C o u n t % w i t h i n 饮料类型 % w i t h i n 顾客性别 % o f T o t a l C o u n t % w i t h i n 饮料类型 % w i t h i n 顾客性别 % o f T o t a l C o u n t % w i t h i n 饮料类型 % w i t h i n 顾客性别 % o f T o t a l 果汁 矿泉水 绿茶 其他 碳酸饮料 饮料类型 T o t a l 男 女 顾客性别 T o t a l 行 百 分 比 列 百 分 比 2 -

16、19 统计学 STATISTICS (第四版 ) 2021-1-23 列联表的描述性分析 (例题分析 SPSS) 列联表的统计描述 顾客性别 * 饮料类型 C r o s s t a b u l a t i o n 1 6 7 2 6 22 4 . 5 % 2 7 . 3 % 3 1 . 8 % 9 . 1 % 2 7 . 3 % 1 0 0 . 0 % 1 6 . 7 % 6 0 . 0 % 6 3 . 6 % 2 5 . 0 % 4 0 . 0 % 4 4 . 0 % 2 . 0 % 1 2 . 0 % 1 4 . 0 % 4 . 0 % 1 2 . 0 % 4 4 . 0 % 5 4 4

17、 6 9 28 1 7 . 9 % 1 4 . 3 % 1 4 . 3 % 2 1 . 4 % 3 2 . 1 % 1 0 0 . 0 % 8 3 . 3 % 4 0 . 0 % 3 6 . 4 % 7 5 . 0 % 6 0 . 0 % 5 6 . 0 % 1 0 . 0 % 8 . 0 % 8 . 0 % 1 2 . 0 % 1 8 . 0 % 5 6 . 0 % 6 10 11 8 15 50 1 2 . 0 % 2 0 . 0 % 2 2 . 0 % 1 6 . 0 % 3 0 . 0 % 1 0 0 . 0 % 1 0 0 % 1 0 0 . 0 % 1 0 0 % 1 0 0 %

18、1 0 0 . 0 % 1 0 0 . 0 % 1 2 . 0 % 2 0 . 0 % 2 2 . 0 % 1 6 . 0 % 3 0 . 0 % 1 0 0 . 0 % C o u n t % w i t h i n 顾客性别 % w i t h i n 饮料类型 % o f T o t a l C o u n t % w i t h i n 顾客性别 % w i t h i n 饮料类型 % o f T o t a l C o u n t % w i t h i n 顾客性别 % w i t h i n 饮料类型 % o f T o t a l 男 女 顾客 性别 T o t a l 果汁

19、 矿泉水 绿茶 其他 碳酸饮料 饮料类型 T o t a l 行百分比 列百分比 2 - 20 统计学 STATISTICS (第四版 ) 2021-1-23 数据透视表 (pivot table) 1. 可以从复杂的数据中提取有用的信息 2. 可以对数据表的重要信息按使用者的习惯或分析 要求进行汇总和作图 3. 形成一个符合需要的交叉表 (列联表 ) 4. 在利用数据透视表时 , 数据源表中的首行必须有 列标题 数据透视表 2 - 21 统计学 STATISTICS (第四版 ) 2021-1-23 生成频数分布表 (列联表 Excel) 不同类型饮料和顾客性别的频数分布 2.1.2 定性数

20、据的图示 2.1 用图表展示定性数据 2 - 23 统计学 STATISTICS (第四版 ) 2021-1-23 条形图 (bar Chart) 1. 用宽度相同的条形的高度或长短来表示各类别数据 2. 各类别可放在纵轴 , 称为 条形图 , 可以放在横轴 , 称为 柱 形图 (column chart) 2 - 24 统计学 STATISTICS (第四版 ) 2021-1-23 复式条形图 (bar Chart) 饮料类型和顾客性别的条形图 (SPSS的输出 ) 2 - 25 统计学 STATISTICS (第四版 ) 2021-1-23 帕累托图 (pareto chart) 1. 按

21、各类 别数据 出现的 频数多 少排序 后绘制 的柱形 图 2. 用于展 示分类 数据的 分布 2 - 26 统计学 STATISTICS (第四版 ) 2021-1-23 用 SPSS绘制饼图 (Pie) 第 1步: 选择 【 Graphs】 【 Interactive-Pie-Clustered】 , 进入主对话框 第 2步: 如果绘制简单饼图,将某个分类变量 (如“饮料类 型” )选入 【 Slice】 (部分,片 );点击 【 Pies】 ,选择在 饼图中要展示的内容,如 【 Category】 、 【 Count】 、 【 Percen】 等。点击 【 确定 】 如果要绘制复式饼图,将

22、某个分类变量 (如“饮料类型” )选入 【 Slice】 ;将另一个分类变量 (如“顾客性别” )选入 【 Cluster】 ;点击 【 Pies】 ,选择在饼图中要展示的内 容,如 【 Category】 、 【 Count】 、 【 Percen】 等。点 击 【 确定 】 绘制饼图 2 - 27 统计学 STATISTICS (第四版 ) 2021-1-23 简单饼图 (pie Chart) 用圆形及圆内 扇形的角度来 表示数值大小 的图形 , 主要 用于表示一个 样本 (或总体 ) 中各组成部分 的数据占全部 数据的比例 用于研究结构 问题 2 - 28 统计学 STATISTICS

23、(第四版 ) 2021-1-23 复式饼图 (pie Chart) 主要用于展 示两个或多 个分类变量 的构成比较 , 比如 , 在男 女分类的基 础上又增加 了饮料类型 的分类 。 2 - 29 统计学 STATISTICS (第四版 ) 2021-1-23 环形图 (doughnut chart) 1. 环形图中间有一个 “ 空洞 ” , 样本或 总体中的每一部分数据用环中的一段 表示 2. 与饼图类似 , 但又有区别 饼图只能显示一个总体各部分所占的比 例 环形图则可以同时绘制多个样本或总体 的数据系列 , 每一个样本或总体的数据 系列为一个环 3. 用于结构比较研究 2 - 30 统计

24、学 STATISTICS (第四版 ) 2021-1-23 环形图 (doughnut chart) 【 例 2-2】 2006年北京 、 上海和天津地区按收入法 计算的地区生产总值 (按当年价格计算 )数据 。 绘制 环形图比较三个地区的生产总值构成 2 - 31 统计学 STATISTICS (第四版 ) 2021-1-23 环形图 (doughnut chart ) 44% 15% 16% 25% 32% 18% 14% 36% 36% 16% 17% 31% 劳动者报酬 生产税净额 固定资产折旧 营业盈余 北京、上海和天津地区按收入法计算的地区生产总值 2 - 32 统计学 STATI

25、STICS (第四版 ) 2021-1-23 复式条形图 北京、上海和天津地区按收入法计算的地区生产总值 2 - 33 统计学 STATISTICS (第四版 ) 2021-1-23 环形图 (doughnut chart) 【 例 】 在第 29届北京奥运会上 , 获得金牌和奖牌前三名的 国家及奖牌数如下 。 绘制环形图比较三个国家的奖牌构成 排名 国家 金 银 铜 总 1 中国 51 21 28 100 2 美国 36 38 36 110 3 俄罗斯 23 21 28 72 2 - 34 统计学 STATISTICS (第四版 ) 2021-1-23 环形图 (doughnut chart

26、 ) 中国、美国、俄罗斯奥运会奖牌构成 51% 21% 28% 33% 34% 33% 32% 29% 39% 金 银 铜 2 - 35 统计学 STATISTICS (第四版 ) 2021-1-23 复式条图 中国、美国、俄罗斯奥运会奖牌比较 2 - 36 统计学 STATISTICS (第四版 ) 2021-1-23 复式条图 中国、美国、俄罗斯奥运会奖牌比较 2.2 用图表展示定量数据 2.2.1 生成频数分布表 2.2.2 定量数据的图示 第 2 章 用图表展示数据 2.2.1 生成频数分布表 2.2 用图表展示定量数据 2 - 39 统计学 STATISTICS (第四版 ) 202

27、1-1-23 生成频数分布表 (例题分析 ) 【 例 2-3】 某电 脑公司 120天的 销售额数据 (单 位:万元 ) 。 生 成一张频数分 布表观察销售 额分布的特征 2 - 40 统计学 STATISTICS (第四版 ) 2021-1-23 生成频数分布表 (例题分析 ) 1. 确定组数:组数的确定应以能够显示数据的分布特征 为目的 。 在实际分组时 , 组数一般为 5K 15。 本例 中由于数据较多 , 可考虑分为 10组 2. 确定组距:组距 (Class Width)是一个组的上限与下限 之差 , 可根据全部数据的最大值和最小值及所分的组 数来确定 , 即 组距 ( 最大值 -

28、最小值 ) 组数 例如 , 本例最大值为 237, 最小值为 141, 组距 =(237-141) 10 9.6。 为便于计算 , 组距宜取 5或 10 的倍数 , 且第一组的下限应低于最小变量值 , 最后一 组的上限应高于最大变量值 , 因此组距可取 10 3. 统计出各组的频数 。 每个组的数据满足 axb(上限值 不在内 (Excel的计数规则是 axb) 2 - 41 统计学 STATISTICS (第四版 ) 2021-1-23 分组中的几个概念 1. 下限 (lower limit) : 一个组的最小值 2. 上限 (upper limit) : 一个组的最大值 3. 组距 (cl

29、ass width) : 上限与下限之差 4. 组中值 (class midpoint) : 下限与上限之 间的中点值 下限值 +上限值 2 组中值 = 制作频数分布 2 - 42 统计学 STATISTICS (第四版 ) 2021-1-23 生成频数分布表 (例题分析 ) 某电脑公司销售额的频数分布 2 - 43 统计学 STATISTICS (第四版 ) 2021-1-23 使用 Excel频数函数 (FREQUENCY) Excel的 【 直方图 】 工具的缺陷是:频数分布及直方 图没有与数据链接 , 当改变任何一个数据时 , 频数 分布表和直方图不会跟着改变 使用统计函数 【 FRE

30、QUENCY】 创建频数分布表和 直方图可解决这一问题 。 具体步骤是 选择与接受区域相临近的单元格区域 , 作为频数分布表 输出的区域 选择统计函数中的 【 FREQUENCY】 函数 在对话框 【 Date-array】 后输入数据区域 , 在 【 Bins- array】 后输入接受区域 同时按下 “ ctrl-shift-Enter”组合键 , 即得到频数分布 统计函数 FREQUENCY 2.2.2 定量数据的图示 2.2 用图表展示定量数据 Excel 2 - 45 统计学 STATISTICS (第四版 ) 2021-1-23 分组数据看分布 直方图 (histogram) 1.

31、 用于展示分组数据分布的一种图形 2. 用矩形的宽度和高度来表示频数分布 本质上是用矩形的 面积 来表示频数分布 3. 在直角坐标中 , 用横轴表示数据分组 , 纵 轴表示频数或频率 , 各组与相应的频数就 形成了一个矩形 , 即直方图 4. 直方图下的总面积等于 1 2 - 46 统计学 STATISTICS (第四版 ) 2021-1-23 用 SPSS绘制直方图 第 1步: 选择 【 Graphs】 菜单,并选择 【 histogram】 选项进入主对话框 第 2步: 在主对话框中将变量选入 【 Variables】 ,点击 【 OK】 绘制直方图 2 - 47 统计学 STATISTI

32、CS (第四版 ) 2021-1-23 分组数据看分布 直方图 (SPSS绘制的直方图 ) 2 - 48 统计学 STATISTICS (第四版 ) 2021-1-23 分组数据看分布 直方图 (直方图与条形图的区别 ) 1. 条形图中的每一矩形表示一个类别 , 其宽 度没有意义 , 而直方图的宽度则表示各组 的组距 2. 由于分组数据具有连续性 , 直方图的各矩 形通常是连续排列 , 而条形图则是分开排 列 3. 条形图主要用于展示定性数据 , 而直方图 则主要用于展示定量数据 2 - 49 统计学 STATISTICS (第四版 ) 2021-1-23 未分组数据看分布 茎叶图 (stem

33、-and-leaf plot) 1. 用于显示未分组的原始数据的分布 2. 由 “ 茎 ” 和 “ 叶 ” 两部分构成 , 其图形是由数字组 成的 3. 以该组数据的高位数值作树茎 , 低位数字作树叶 4. 树叶上只保留最后一位数字 5. 茎叶图类似于横置的直方图 , 但又有区别 直方图可观察一组数据的分布状况 , 但没有给出具体的 数值 茎叶图既能给出数据的分布状况 , 又能给出每一个原始 数值 , 保留了原始数据的信息 直方图适用于大批量数据 , 茎叶图适用于小批量数据 2 - 50 统计学 STATISTICS (第四版 ) 2021-1-23 用 SPSS绘制茎叶图和箱线图 (包括直方

34、图 ) 第 1步: 选择 【 Analyze】 菜单,并选择 【 Descriptive statistics-Explore】 选项进入主对话框 第 2步: 在主对话框中将变量选入 【 Variables】 , 点击 【 Plots】 ,在对话框中选择 【 Stem- and-leaf】 (根据需要可选 【 Histogram】 以 给出直方图 )。点击 【 Continue】 回到主对话 框。点击 【 OK】 绘制茎叶图 2 - 51 统计学 STATISTICS (第四版 ) 2021-1-23 未分组数据看分布 茎叶图 (例题分析 ) 某电脑公司销售额分布的茎叶图 2 - 52 统计学

35、 STATISTICS (第四版 ) 2021-1-23 未分组数据看分布 茎叶图 (例题分析 ) 第一列给出每个 茎上叶子的频数 第二列是 “ 茎 ” , 第三列是 “ 叶 ” 下面标出了 1个 极端值 237、 茎 的宽度 10、 每个 叶代表一个数据 (案例 ) SPSS自动将每 个茎重复了一次 , 使分布的细节看 的更清楚一些 。 当然 , 在数据较 少时茎的数值也 可以不重复 2 - 53 统计学 STATISTICS (第四版 ) 2021-1-23 未分组数据看分布 点图 (例题分析 ) 某电脑公司销售额分布的点图 2 - 54 统计学 STATISTICS (第四版 ) 202

36、1-1-23 未分组数据看分布 箱线图 (box plot) 1. 用于显示未分组的原始数据的分布 2. 箱线图是由一组数据的最大值 (maximum)、 最小值 (minimum)、 中位数 (median)、 两个四分位数 (quartiles)这 5个值绘制而成的 中位数是一组数据排序后处于中间位置上的变量值 四分位数是一组数据排序后处在数据 25%位置和 75%位 置上的两个分位数值 3. 绘制方法 首先找出一组数据的 5个特征值 , 即 最大值 、 最小值 、 中 位数 Me和两个 四分位数 (下四分位数 QL和上四分位数 QU) 连接两个四分位数画出箱子 , 再将两个极值点与箱子相

37、 连接 2 - 55 统计学 STATISTICS (第四版 ) 2021-1-23 未分组数据看分布 箱线图 (箱线图的构成 ) 中位数 4 6 8 10 12 Q 75% Q 25% X Max X Min Median/Quart./Range箱线图 2 - 56 统计学 STATISTICS (第四版 ) 2021-1-23 未分组数据看分布 箱线图 (例题分析 ) 最小值 141 最大值 237 中位数 182 25%四分位数 170.25 75%四分位数 197 140 150 160 170 180 190 200 210 220 230 240 某电脑公司销售额数据的 Medi

38、an/Quart./Rang箱线图 2 - 57 统计学 STATISTICS (第四版 ) 2021-1-23 分布的形状与箱线图 不同分布的箱线图 对称分布 Bell-shaped distribution Left-skewed distribution 左偏分布 右偏分布 Right-skewed distribution 2 - 58 统计学 STATISTICS (第四版 ) 2021-1-23 未分组数据看分布 多批数据箱线 图 (例题分析 ) 【 例 2-4】 从 某大学经济管 理专业二年级 学生中随机抽 取 11人 , 对 8 门主要课程的 考试成绩进行 调查 , 所得结 果

39、如表 。 试绘 制各科考试成 绩的批比较箱 线图 , 并分析 各科考试成绩 的分布特征 11名学生各科的考试成绩数据 课程名称 学生编号 1 2 3 4 5 6 7 8 9 10 11 英语 经济数学 西方经济学 市场营销学 财务管理 基础会计学 统计学 计算机应用基础 76 65 93 74 68 70 55 85 90 95 81 87 75 73 91 78 97 51 76 85 70 92 68 81 71 74 88 69 84 65 73 95 70 78 66 90 73 78 84 70 93 63 79 80 60 87 81 67 86 91 83 77 76 90 70

40、 82 83 82 92 84 81 70 69 72 78 75 78 91 88 66 94 80 85 71 86 74 68 79 62 81 81 55 78 70 75 68 71 77 2 - 59 统计学 STATISTICS (第四版 ) 2021-1-23 用 SPSS绘制多批数据箱线图 第 1步: 选择 【 Graphs】 下拉菜单,并选择 【 Boxplot】 第 2步: 在出现的对话框中选择 【 Simple】 ,在 【 Data in Chat Are】 中选择 【 Summaries of separate variables】 ,点击 【 Define】 返回主

41、对话框 第 3步: 在主对话框将所有变量 (这里是 11个学生 )选入 【 Boxes Represent】 , 将“课程名称”选入 【 Label Cases by】 。点击 【 OK】 绘制箱线图 2 - 60 统计学 STATISTICS (第四版 ) 2021-1-23 未分组数据 多批数据箱线图 (例题分析 Median/Quart./Range) 8门课程考试成绩的箱线图 2 - 61 统计学 STATISTICS (第四版 ) 2021-1-23 11名学生考试成绩的 Median/Quart./Range箱线图 未分组数据 多批数据箱线图 (SPSS绘制的箱线图 ) 2 - 6

42、2 统计学 STATISTICS (第四版 ) 2021-1-23 未分组数据 多批数据箱线图 (上证指数 K线图 ) 2 - 63 统计学 STATISTICS (第四版 ) 2021-1-23 1. 垂线图可用于展示多个变量或多个样本取值的分布状况 2. 将属于同一样本或类别的多个取值的散点用一条垂线连 接起来 , 用垂线的长度及垂线上的各个点来反映某个样 本或类别取值的差异及其变动状况 未分组数据 垂线图 (drop-line) 用 SPSS制作垂线图 第 1步:选择 【 Graphs】 菜单 , 并选择 【 Line】 第 2步:在出现的对话框中选择 【 Drop-line】 , 在

43、【 Data in Chart Are】 中选择 【 Values of individual cases】 , 点击 【 Define】 返回主对话框 第 3步:在主对话框中将所有变量选入 【 Points Represent】 。 在 【 Category Labels】 下选择 【 Variable】 , 并将相应的类别 选入框内 。 点击 【 OK】 绘制垂线图 2 - 64 统计学 STATISTICS (第四版 ) 2021-1-23 未分组数据 垂线图 (例题分析 ) 11名学生 8门课程考试成绩的垂线图 2 - 65 统计学 STATISTICS (第四版 ) 2021-1-2

44、3 1. 误差图是以均值为中心 , 加减一定倍数的标准差 (也可以是加 减一定倍数的标准误差 )绘制而成的 (该图也可以绘制均值的一 定置信水平的置信区间 ) 2. 用于展示多个样本或分类的不同取值的分布状况和离散状况 未分组数据 误差图 (error bar ) 用 SPSS制作垂线图 第 1步:选择 【 Graphs】 菜单,并选择 【 Error Bar】 。 第 2步:在出现的对话框中选择 【 Simple】 ,在 【 Data in Chart Are】 中选择 【 Summaries of separate variables】 ,点击 【 Define】 返回主对话框。 第 3步

45、:在主对话框中将所有变量选入 【 Error Bars】 。在 【 Bars Represent】 下选择 【 Standard deviations】 ,在 【 Multiplier】 框内输入所需的标准差倍数。点击 【 OK】 。 绘制误差图 2 - 66 统计学 STATISTICS (第四版 ) 2021-1-23 未分组数据 误差图 (例题分析 ) 11名学生 8门课程考试成绩的误差图 (均值加减 2倍的标准差 ) 2 - 67 统计学 STATISTICS (第四版 ) 2021-1-23 两个变量间的关系 二维散点图 (2D Scatter plots) 1. 展示两个变量之间的

46、关系 2. 用横轴代表变量 x, 纵轴代表变量 y, 每 组数据 (xi , yi)在坐标系中用一个点表 示 , n组数据在坐标系中形成的 n个点称 为散点 , 由坐标及其散点形成的图 3. 有 2维 、 3维 、 矩阵等形式 2 - 68 统计学 STATISTICS (第四版 ) 2021-1-23 两个变量间的关系 二维散点图 (2D Scatter plots) 【 例 2-5】 表 2 12是 我国 31 个 地区 2006 年的固定资 产投资额 、 地区生产总 值 (GDP)和 最终消费支 出数据 。 绘 散点图并观 察它们之间 的关系 2 - 69 统计学 STATISTICS

47、(第四版 ) 2021-1-23 用 SPSS绘制重叠散点图 (Overlay Scatter) 第 1步: 选择 【 Graphs】 菜单,并选择 【 Scatter/Dot】 第 2步: 如果绘制两个变量的简单散点图,点击 【 Simple Scatter】 ,点击 【 Define】 ,将两个变量分别选入 【 Y Pairs】 和 【 X Pairs】 ,点击 【 OK】 如果要绘制重叠散点图,点击 【 Overlay Scatter】 ,点击 【 Define】 ,将所要配对的数据依次选入 【 Y-X Pairs】 (本例 为“固定资产投资额 -地区生产总值”和“固定资产投资额 -最

48、终消费支出” ),点击 【 OK】 如果要绘制矩阵散点图,点击 【 Matrix Scatter】 ,将几个变量 (本 例为“固定资产投资额”、“地区生产总值”和“固定资产 投资额” )同时选入 【 Matrix Variables】 ,将区分坐标轴的样 本 (本例为“地区” )选入 【 Label Cases by】 ,点击 【 OK】 绘制重叠散点图 2 - 70 统计学 STATISTICS (第四版 ) 2021-1-23 两个变量间的关系 二维散点图 (2D Scatter plots) 2 - 71 统计学 STATISTICS (第四版 ) 2021-1-23 1. 如果想比较几

49、个变量之间的关系 , 也可以把它 们的散点图绘制在同一张图里 , 绘制成重叠散 点图 (Overlay Scatter)(注意:绘制重叠散点图 时 , 变量值之间的数值差异不能过大 , 否则不 便于比较 ) 2. 比如 , 如果想比较固定资产投资额与地区生产 总值和最终消费支出的关系 , 可以把固定资产 投资作为共同的一个坐标轴 , 地区生产总值和 最终消费支出作为另一个坐标轴 3. 也可以绘制散点图矩阵 (Matrix Scatter) 两个变量间的关系 重叠散点图 (用 SPSS绘制重叠散点图 ) 2 - 72 统计学 STATISTICS (第四版 ) 2021-1-23 两个变量间的关

50、系 重叠散点图 (Overlay Scatter) 2 - 73 统计学 STATISTICS (第四版 ) 2021-1-23 两个变量间的关系 矩阵散点图 (Matrix Scatter) 2 - 74 统计学 STATISTICS (第四版 ) 2021-1-23 比较多个样本的相似性 雷达图 (radar chart) 1. 也称为蜘蛛图 (spider chart) 2. 从一个点出发 , 用每一条射线代表一个变量 , 多个变 量的数据点连接成线 , 即围成一个区域 , 多个样本围 成多个区域 , 就是雷达图 3. 可用于研究多个样本在多个变量上的相似程度 4. 当多个变量的取值相差

51、较大或量纲不同时 , 可进行变 换处理后再做图 。 线性变换: 对数变换: ii ii xx xxy m inm a x m in )log( ixy s xxz i 2 - 75 统计学 STATISTICS (第四版 ) 2021-1-23 多变量数据 雷达图 (例题分析 ) 【 例 2-6】 2006年我国东部 、 中部 、 西部及东北地区城镇居民的生 活消费支出数据如表 2 8所示 。 绘制雷达图 , 比较不同地区的消费 支出构成 2 - 76 统计学 STATISTICS (第四版 ) 2021-1-23 多变量数据 雷达图 (例题分析 原始数据 ) 1. 四个地区城镇 居民消费支出

52、 中 , 食品支出 额都是最多的 , 杂项商品与服 务支出额则是 最少的 2. 东部地区城镇 居民的各项支 出额普遍高于 其他三个地区 , 而中部 、 西部 和东北地区的 各项支出则相 差不大 3. 四个地区各项 支出额的结构 具有很大的相 似性 2 - 77 统计学 STATISTICS (第四版 ) 2021-1-23 多变量数据 雷达图 (例题分析 标准化变换 ) 1. 更适宜分析 多个样本在 多个变量上 的差异 2. 东部地区城 镇居民的各 项支出额普 遍高于其他 三个地区 , 而中部 、 西 部和东北地 区的各项支 出则相差不 大 3. 四个地区各 项支出额的 结构具有很 大的相似性

53、 2 - 78 统计学 STATISTICS (第四版 ) 2021-1-23 1. 20世纪 90年代初由 Inselberg和 Dimsdale 提出的展示多元数据的图示方法 2. 将各变量用一系列平行的横坐标轴表示 , 变量值对应纵轴上的位置 3. 可用于研究多个样本在多个变量上的相 似程度或变量间的相互关系 比较多个样本的相似性 平行坐标图 (轮廓图 ) 2 - 79 统计学 STATISTICS (第四版 ) 2021-1-23 多变量数据 轮廓线图 (例题分析 比较样本:地区 ) 1. 四个地区城镇 居民消费支出 中 , 食品支出 额都是最多的 , 杂项商品与服 务支出额则是 最少

54、的 2. 东部地区城镇 居民的各项支 出额普遍高于 其他三个地区 , 而中部 、 西部 和东北地区的 各项支出则相 差不大 3. 四个地区各项 支出额的结构 具有很大的相 似性 2 - 80 统计学 STATISTICS (第四版 ) 2021-1-23 多变量数据 轮廓线图 (例题分析 比较变量:各项支出 ) 1. 四个地区城镇 居民消费支出 中 , 食品支出 额都是最多的 , 杂项商品与服 务支出额则是 最少的 2. 东部地区城镇 居民的各项支 出额普遍高于 其他三个地区 , 而中部 、 西部 和东北地区的 各项支出则相 差不大 3. 四个地区各项 支出额的结构 具有很大的相 似性 2.3

55、 合理使用图表 第 2 章 用图表展示数据 2 - 82 统计学 STATISTICS (第四版 ) 2021-1-23 1. 一张好的图表应包括以下基本特征 显示数据 让读者把注意力集中在图表的内容上 , 而不是制作图表的 程序上 避免歪曲 强调数据之间的比较 服务于一个明确的目的 有对图表的统计描述和文字说明 2. 5种鉴别图表优劣的准则:一张好的图表应当 精心设计 、 有助于洞察问题的实质 使复杂的观点得到简明 、 确切 、 高效的阐述 能在最短的时间内以最少的笔墨给读者提供最大量的信息 是多维的 表述数据的真实情况 鉴别图表优劣的准则 2 - 83 统计学 STATISTICS (第四版 ) 2021-1-23 本章小结 定性数据的频数分布表 定性数据的图示方法 定量数据的频数分布表 定量数据的图示方法 用 Excel和 SPSS作 频数分布表和 图 形 合理使用图表 结 束

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!