生物统计学第一章
《生物统计学第一章》由会员分享,可在线阅读,更多相关《生物统计学第一章(108页珍藏版)》请在装配图网上搜索。
1、生 物 统 计 学生 命 科 学 学 院 王 志 高 为 什 么 要 学 统 计 学 ? n 1. 采 用 统 计 学 方 法 , 发 现 不 确 定 现 象 背 后 隐 藏 的 规律 。n 变 异 ( variation) 是 社 会 和 生 物 医 学 中 的 普 遍 现 象 。许 多 个 体 之 所 以 能 汇 集 成 一 个 总 体 , 必 定 存 在 共 同的 特 征 , 共 同 的 特 征 是 他 们 的 同 质 性 , 但 个 体 之 间又 不 是 完 全 相 同 的 , 这 种 个 体 之 间 的 差 异 就 是 变 异 。n 变 异 使 得 实 验 或 观 察 的 结 果 具
2、 有 不 确 定 性 , 如 每 个人 的 身 高 、 体 重 、 血 压 等 各 有 不 同 。 最 大 值 =6.18, 最 小 值 =3.29, 极 差 =2.89 算 术 均 数 =4.72, 标 准 差 =0.57。 2. 用 统 计 学 思 维 方 式 考 虑 有 关 生 物 学研 究 中 的 问 题 “ 阳 性 ” 结 果 是 否 是 虚 假 联 系 ? 某 感 冒 药 治 疗 1周 后 , 治 愈 率 为 90%, 能 否 说 该 感 冒 药 十 分有 效 ? “ 阴 性 ” 结 果 是 否 是 样 本 含 量 不 足 ? 有 人 曾 对 发 表 在 Lancet, N Eng
3、l J Med, JAMA等 著 名 医 学杂 志 上 的 71篇 阴 性 结 果 的 论 文 作 过 分 析 , 发 现 其 中 有 62篇( 93%) 可 能 是 由 于 样 本 含 量 不 足 造 成 的 假 阴 性 。 什 么 是 生 物 统 计 学 ?n 生 物 统 计 学 是 应 用 数 理 统 计 的 原 理 和 方 法 来 分析 和 解 释 生 物 界 数 量 现 象 的 科 学 , 也 可 以 说 是数 理 统 计 在 生 物 学 研 究 中 的 应 用 。n 它 是 现 代 生 物 学 研 究 不 可 缺 少 的 工 具 , 不 论 是传 统 学 科 还 是 现 代 分 子
4、 生 物 学 , 时 时 刻 到 都 会与 数 字 打 交 道 。 为 了 揭 示 生 物 体 内 在 规 律 或 生物 与 环 境 之 间 的 关 系 , 都 离 不 开 因 素 分 析 、 待别 是 多 元 分 析 。 n 设 计 统 计 原 理 , 阐 述 统 计 理 论 和 有 关 公 式 , 以 满 足 统 计 方法 的 需 要 统 计 方 法 的 应 用 , 旨 在 对 客 观 事 物 得 出 本 质 的 和规 律 性 的 认 识 。n 人 们 在 从 事 科 学 研 究 时 , 总 是 通 过 事 物 一 部 分 ( 样 本 ) 来 估 计 事 物 全 体 ( 总 体 ) 的 性
5、 质 特 征 , 即 从 样 本 推 断 总 体 ,从 特 殊 推 导 一 般 , 从 而 对 所 研 究 的 总 体 得 出 正 确 的 结 论 。n 在 生 物 科 学 研 究 中 , 我 们 期 望 知 道 总 体 不 是 样 本 。 可 是 在实 际 问 题 调 查 和 试 验 中 , 我 们 所 得 到 的 却 只 是 样 本 资 料 。n 生 物 统 计 学 从 本 质 来 看 , 实 际 上 是 研 究 如 何 从 样 本 推 断 总体 的 一 门 科 学 。 课 程 特 点 与 学 习 方 法( 一 ) 课 程 特 点 与 要 求n 本 课 程 重 点 介 绍 基 本 概 念
6、、 基 本 方 法 , 主 要从 应 用 角 度 理 解 , 简 化 推 证 过 程 。n 掌 握 生 物 统 计 的 基 本 方 法 , 熟 悉 常 用 实 验 设 计 方 法 。 二 ) 建 议 学 习 方 法1. 掌 握 生 物 统 计 学 的 基 本 原 理 和 公 式 , 理解 公 式 的 含 义 和 应 用 条 件 , 不 深 究 推 导过 程 ;2. 培 养 科 学 的 统 计 思 维 方 法 。 结 合 专 业 ,了 解 统 计 方 法 的 实 际 应 用 。3.学 会 使 用 常 用 的 统 计 软 件 。 教 学 内 容第 1章 统 计 数 据 的 收 集 与 整 理第 2
7、章 概 率 分 布 与 抽 样 分 布第 3章 统 计 推 断 与 参 数 估 计第 4章 拟 合 优 度 检 验第 5章 方 差 分 析第 6章 一 元 回 归 及 简 单 相 关 分 析第 7章 实 验 设 计 第 一 章 统 计 数 据 的 收 集 与 整 理 1.1 总 体 与 样 本 总 体 、 样 本 、 样 本 含 量 、 抽 样 ( 方 法 ) 1.2 数 据 类 型 与 频 数 ( 率 ) 分 布 数 据 的 类 型 、 频 数 表 与 频 数 图 的 编 绘 1.3 样 本 的 几 个 特 征 数 平 均 数 、 标 准 差 、 方 差 、 变 异 系 数 几 个 常 用
8、术 语n 变 量 与 常 数n 误 差 与 错 误n 准 确 与 精 确n 测 量 与 测 量 尺 度 对 随 机 变 量 的 取 值 过 程 为 测 量 。 取 值 所采 用 的 标 准 为 测 量 尺 度 。测 量 和 测 量 尺 度 采 用 统 一 的 标 准 化 的 尺 度 进 行 测 量 , 其 测量 结 果 一 般 是 稳 定 的 和 一 致 的 , 例 如 身 高 、 胸围 等 形 态 指 标 的 测 量 均 采 用 统 一 的 测 量 尺 度(全 国 统 一 研 制 的 身 高 计 、 胸 围 尺 均 以 厘 米 为记 录 单 位 , 体 重 以 公 斤 为 记 录 单 位 ,
9、 肺 活 量 以毫 升 为 单 位 等 ) 变 量 可 以 测 量 的 任 何 特 征 或 属 性 Any characteristic or attribute that can be measured。 ( 不 同 个 体 结 果 可 能 不 同 )随 机 变 量 在 概 率 论 中 称 变 量 为 随 机 变 量观 测 值 ( observed value) 、 变 量 值 ( value of variable) 、 资 料 ( data) 变 量 的 测 得值 。 变 量 可 是 定 量 的 , 也 可 以 是 定 性 的 。定 量 变 量 ( quantitative variab
10、le) : 亦 称 为 数值 变 量 , 变 量 值 是 定 量 的 , 表 现 为 数 值 大 小 ,一 般 有 度 量 衡 单 位 。 e.g. 身 高 、 体 重 。定 性 变 量 ( qualitative variable) : 亦 称 为 分 类变 量 , 其 变 量 值 是 定 性 的 , 表 现 某 个 体 属 于几 种 互 不 相 容 的 类 型 中 的 一 种 。 e.g. 血 型 ,豌 豆 花 的 颜 色 。常 数 ( constant) : 是 不 能 给 予 不 同 数 值 的 变量 , 代 表 事 物 特 征 和 性 质 的 数 值 。 e.g.样 本 平均 数 ,
11、 标 准 差 。 误 差 ( Error)测 量 值 =真 实 值 +随 机 误 差 +非 随 机 误差1 随 机 误 差 ( 随 机 抽 样 误 差 ) : 由 于 试 验 中 许 多 无 法 控 制 的 偶 然 因 素 所 造 成 的 试 验 结 果 与 真 实结 果 之 间 产 生 的 误 差 , 是 不 可 避 免 的 , 不 能 消 除 的 。2 系 统 误 差 受 确 定 因 素 影 响 , 大 小 变 化 有 方 向 性 。 某 种 程 度 上 可以 控 制 。3 非 系 统 误 差 ( 错 误 ) 研 究 者 偶 然 失 误 而 造 成 的 误 差 。 准 确 度 与 可 靠
12、度n 准 确 度 (accuracy)或 真 实 性 ( validity) :观 察 值 与 真 值 的 接 近 程 度 , 受 系 统 误 差的 影 响 。n 可 靠 度 ( reliabiliy) 也 称 精 确 度(precision)或 重 复 性 ( repeatability) :重 复 观 察 时 观 察 值 与 其 均 值 的 接 近 程 度 ,受 随 机 误 差 的 影 响 。 1.1 总 体 与 样 本n 一 、 总 体n 总 体 ( population) 是 我 们 研 究 的 全 部 对 象 。 总 体又 分 为 无 限 总 体 ( infinite populat
13、ion ) 和 有 限总 体 ( finite population ) 。 例 如 , 研 究 在 某 种 条 件 下 生 长 小 麦 的 株 高 , 因 为 无法 估 计 出 在 这 种 条 件 下 生 长 的 小 麦 数 量 , 可 以 设 想这 一 总 体 是 无 限 的 。 如 果 研 究 每 个 地 块 小 麦 的 株 高 ,这 一 总 体 就 是 有 限 总 体 。 n 构 成 总 体 的 每 个 成 员 称 为 个 体 ( individual) 。 二 、 样 本n 从 总 体 中 抽 取 的 一 部 分 个 体 则 构 成 样 本 ( sample) 。 样 本 内 包 含
14、 的 个 体 数 目 称 为 样 本 容 量 ( sample size) ,常 以 n表 示 。由 于 样 本 容 量 不 同 , 一 般 又 分 大 样 本 ( n30) 和 小样 本 ( n 30) 。n 统 计 分 析 的 核 心 在 于 由 样 本 的 信 息 推 断 总 体 的 信 息 。因 此 , 获 得 样 本 仅 是 一 种 手 段 , 而 推 断 总 体 才 是 真 正 的目 的 。 参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为、。固定的常数 样 本抽 取 部 分 观 察 单 位 推断inference样本统计量:样本的统计指标,如样本均数、标准差,采用英
15、文字母分别记为 。 参数附近波动的随机变量 。SX、 三 、 抽 样n 从 总 体 中 获 得 样 本 的 过 程 称 为 抽 样 ( samlping) 。抽 样 的 目 的 是 希 望 通 过 对 样 本 的 研 究 , 推 断 其 总 体 。例 如 , 希 望 由 100株 “ 三 尺 三 ” 高 梁 的 株 高 推 断在 这 种 条 件 下 生 长 的 该 品 种 的 株 高 , 这 就 要 求 样 本应 能 在 最 大 程 度 上 代 表 总 体 的 情 况 。 为 此 , 在 从 总体 中 抽 取 样 本 时 , 总 体 中 的 每 一 个 个 体 被 抽 中 的 机会 必 须 都
16、 一 样 , 不 能 带 有 偏 见 。 n 又 如 , 在 小 麦 育 种 工 作 中 , 我 们 常 常 希 望 得 到矮 秆 品 种 。 为 了 满 足 个 人 愿 望 , 在 抽 样 时 便 多 抽 矮 秆 的 , 这 样 得 到 的 样 本 没 有 代 表 性 , 属 于偏 性 抽 样 , 不 能 代 表 总 体 的 情 况 。n 样 本 应 该 是 一 个 总 体 的 缩 影 。 为 达 到 这 个 目 的 , 需 要 用 随 机 抽 样 ( random sampling)方 法 获 得 样 本 。 ( 一 ) 随 机 抽 样 的 方 法n 1 抽 签 -筷 子 ; 2 抓 阄
17、-纸 条 ; 3 随 机 数 字 表 -P322( 附 表 1)例 如 : 需 要 从 包 含 4728个 个 体 的 总 体 中 , 抽 出 一 个 含 量 为 20的 样 本 。因 为 个 体 总 数 4728是 一 个 四 位 数 , 所 以 总 体 中 每 一 个 个 体 的 编 号 都应 是 四 位 数 , 即 从 0001号 到 4728号 。n 第 一 步 , 闭 上 眼 睛 用 铅 笔 在 随 机 数 字 表 上 任 意 点 上 一 点 , 假 若 点 到 奇 数 上 , 就 用 第 一 页 表 ; 点 到 偶 数 上 , 就 用 第 二 页 表 。 n 第 二 步 , 在 选
18、 定 的 那 一 页 上 再 点 一 次 , 决 定 从 哪 个 字 开 始 。 决 定 了 起 点 以 后 , 开 始 以 四 位 数 字 为 一 节 连 续 读 下 去 , 不 用 考 虑 数 字 间 的 间隙 。 可 以 正 读 、 倒 读 、 横 向 读 、 纵 向 读 , 也 可 以 沿 对 角 线 方 向 读 。 选出 小 于 等 于 4728的 数 字 , 大 于 4728的 则 舍 弃 , 直 到 取 满 20个 数 为止 。 这 20个 数 所 对 应 的 个 体 , 即 为 我 们 选 中 的 样 本 。 ( 二 ) 随 机 抽 样 的 方 式1 放 回 式 抽 样n 从
19、总 体 中 抽 出 一 个 个 体 , 记 下 它 的 特 征 后 放 回 总 体 中 , 再做 第 二 次 抽 样 。 这 种 抽 样 方 式 可 能 会 重 复 抽 中 某 一 个 体 。2 非 放 回 式 抽 样n 从 总 体 中 抽 出 个 体 后 不 再 放 回 。n 在 上 述 的 例 子 中 , 若 保 留 重 复 的 随 机 数 字 , 则 为 放 回 式 抽样 ; 若 舍 弃 重 复 的 数 字 , 则 为 非 放 回 式 抽 样 。 n 对 于 无 限 总 体 来 说 , 放 回 式 抽 样 和 非 放 回 式 抽 样 , 实 际 上没 有 区 别 。 样 本 的 含 量
20、越 大 越 有 代 表 性 。 但 是 , 太 大 的 样本 研 究 起 来 是 很 困 难 的 。 因 此 , 样 本 的 含 量 必 须 合 适 。 1.2 数 据 类 型 与 频 数 ( 率 ) 分 布n 1.2.1 连 续 型 数 据 和 离 散 型 数 据n 生 物 统 计 学 中 经 常 遇 到 的 数 据 有 两 种 类 型 : 即 连 续型 数 据 和 离 散 型 数 据 。n 用 量 测 方 式 所 得 到 的 数 据 称 为 连 续 型 数 据( continuous data) , 又 称 为 度 量 数 据( measurement data) 。 例 如 , 长 度
21、、 时 间 、 质量 、 OD值 、 血 压 值 等 。 这 类 数 据 通 常 是 非 整 数 。 虽然 有 时 记 载 的 是 整 数 , 如 身 高 的 厘 米 数 , 但 是 当 提高 精 确 度 后 , 总 会 出 现 小 数 。 对 连 续 型 数 据 进 行 分析 的 方 法 通 常 称 为 变 量 的 方 法 ( method of variable) 。 n 用 计 数 方 式 所 得 到 的 数 据 称 为 离 散 型 数 据( discrete data) , 又 称 为 计 数 数 据 ( count data ) 。 例 如 , 某 一 类 别 动 物 的 头 数 ,
22、 具 有 某 一特 征 的 种 子 粒 数 , 血 液 中 不 同 类 型 的 细 胞 数 目 等 。所 有 这 些 数 据 全 都 是 整 数 , 而 且 不 能 再 细 分 , 也 不能 进 一 步 提 高 它 们 的 精 确 度 。 对 离 散 型 数 据 进 行 分析 的 方 法 通 常 称 为 属 性 的 方 法 ( method of attribute) 。n 描 述 数 据 变 化 规 律 的 最 简 单 方 法 是 将 这 些 数 据 列 成n 频 数 表 ( frequency table) 或 绘 成 频 数 图( frequency graph) , 根 据 频 数 分
23、 布 进 行 研 究 。 1.2.2 频 数 ( 率 ) 表 与 频 数 ( 率 ) 图 的 编 绘一 、 离 散 型 数 据 频 数 ( 率 ) 表 与 频 数 ( 率 ) 图 的 编 绘例 1.1 调 查 每 天 出 生 的 10名 新 生 儿 中 , 体 重 超 过 3千 克 的 人数 , 共 调 查 120天 。 每 天 的 10名 新 生 儿 中 体 重 超 过 3千 克 的 人数 , 可 能 有 11种 情 况 : 1名 也 没 有 , 有 1名 , 有 2名 , , 10名 都 是 , 如 表 1-1的 第 一 列 所 示 , 这 一 列 称 为 组 值 ( class valu
24、e) 。 表 1-1的 第 2列 所 记 载 的 是 调 查 结 果 。 全 部 调 查 完毕 , 累 加 各 行 结 果 填 入 频 数 一 栏 ( 第 3列 ) , 或 者 将 各 行 的 结果 除 以 总 数 而 得 出 频 率 ( 第 4列 ) 。所 谓 频 率 , 即 将 某 一 类 别 的 数 目 除 以 总 数 所 得 到 的 分 数 。 把频 数 或 频 率 按 超 过 3千 克 的 人 数 的 顺 序 排 列 起 来 , 便 得 到 了 频数 分 布 ( frequencydistribution) 或 百 分 率 分 布percentage distribution ) 。
25、 编 制 连 续 型 数 据 的 频 数 ( 率 ) 表的 方 法 步 骤n 从 原 始 数 据 表 中 找 出 最 大 值 和 最 小 值 , 并 求 出极 差 。n 决 定 划 分 的 组 数 , 分 组 数 是 由 数 据 的 多 少 决 定的 , 在 数 据 较 少 时 , 如 50 100个 数 , 可 以 分为 7 10组 。 数 据 较 多 时 , 可 分 为 15 20组 。n 根 据 极 差 与 决 定 划 分 的 组 数 , 确 定 组 限 。n 在 频 数 表 中 列 出 全 部 组 限 、 组 界 及 中 值 。 n 将 原 始 数 据 表 中 数 据 , 用 唱 票
26、的 方 式 填 入 频 数表 中 , 计 算 出 各 组 的 频 数 和 频 率 。 n 极 差 ( range) : 数 据 中 最 大 值 和 最 小 值 之差 , 又 称 全 距 。n 组 限 ( class limit) : 各 组 的 最 大 值 与 最 小值 称 为 组 限 , 最 小 值 称 为 下 限 , 最 大 值 称 为上 限 。n 中 值 ( midvalue) : 每 一 组 的 中 点 值 , 一 般是 每 一 组 的 两 个 组 限 的 平 均 值 。 在 横 轴 上 标 明 各 组 的 组 界 , 纵 轴 标 明 频 数 ,然 后 以 每 一 组 的 组 界 为
27、一 个 边 ,相 应 的 频 数 为 另 一 个 边 作 矩 形 , 构成 直 方 图 ( histogram) ( 图 1-2) 。 若纵 轴 改 为 频 率 则 得 到 频 率 直 方 图 。 直 方 图又 称 组 织 图 。 n 2 多 边 形 图 在 横 轴 上 标 出 各 组 的 中 值 , 纵 轴 上 标 出 频 数 ( 率 ) , 在 坐 标平 面 内 标 出 相 应 的 每 个 点 ( 以 中 值 为 横 坐 标 , 以 该 中 值 对 应的 频 数 ( 率 ) 为 纵 坐 标 ) , 用 线 段 连 接 各 点 。 最 低 一 组 非 零频 数 的 点 , 应 该 直 接 与
28、 相 邻 的 零 频 数 中 值 相 连 ; 最 高 一 组非 零 频 数 点 , 亦 应 该 与 相 邻 的 零 频 数 中 值 点 相 连 。 最 后 得 到一 个 多 边 形 图 ( polygon) ( 图 1-3) 。 累 计 频 数 图 的 意 义 ?横 坐 标 与 多 边 形图 有 何 差 异 ?3 累 积 频 数 图经 常 使 用 的 第 三 种 频 数 图 称 为累 积 频 数 图 cumulativefrequency graph) 。 作 图 法 为 : 首 先 根 据表 1-3制 成 累 积 频 数 表 ( 表 1-4) 、在 横 轴 上 标 出 各 级 的 中 值 ,
29、 纵 轴上 标 出 累 积 频 数 ( 率 ) 。 在 坐 标平 面 内 标 出 相 应 的 点 ( 以 中 值 为横 坐 标 , 以 该 中 值 对 应 的 累 积 频数 ( 率 ) 为 纵 坐 标 ) , 连 接 各 点 ,从 而 得 到 累 积 频 数 ( 率 ) 图 研 究 频 数 ( 率 ) 分 布 的 意 义1. 根 据 频 数 ( 率 ) 分 布 , 可 以 看 出 数 据 的 集 中 情 况( 重 心 ) 。n 平 均 值 ( average value, mean)n 算 术 平 均 数 ( arithmetic mean) 、 中 位 数 ( median)和 众 数 (
30、mode) 。2. 从 频 数 ( 率 ) 表 或 频 数 ( 率 ) 图 中 , 可 以 直 观 地 看出 数 据 的 变 异 情 况 。3. 可 以 直 观 看 出 频 数 ( 率 ) 图 的 变 化 形 状 。 还 可 显 示一 些 不 规 则 的 情 况 。 频 数 ( 率 ) 分 布 的 不 恒 定 性n 当 用 随 机 抽 样 方 法 获 得 样 本 时 , 由 于 偶 然 性 ,有 时 在 一 个 样 本 中 抽 到 的 数 值 偏 高 , 而 另 一 个样 本 中 数 值 偏 低 , 使 两 个 样 本 的 频 数 分 布 出 现不 同 。 由 于 样 本 分 布 的 不 恒
31、定 性 , 当 用 样 本 去推 断 总 体 时 , 推 断 的 结 果 也 会 有 所 不 同 。 这 就需 要 考 察 当 用 某 一 样 本 去 推 断 总 体 时 所 得 结 果与 真 正 总 体 之 间 有 多 大 , 结 果 的 可 信 度 有多 高 。 1.3 样 本 的 几 个 特 征 数100 87 79 10099 58 77 99100 67 75 10080 47 74 8089 88 34 8975 67 83 7521 89 68 2183 56 82 8524 86 72 6491 64 73 96某班某次考试的成绩 频 数 表 和 频 数 图 只 能 定 性 地
32、 描 述 一 组 数 据 。 对 于 生 物统 计 学 来 说 , 这 种 描 述 远 远 不 够 。 为 了 更 客 观 地 描 述这 些 数 据 , 需 要 借 助 于 以 下 分 析 工 具 的 帮 助 。它 们 是 数 据 集 中 点 的 度 量 平 均 数 , 数 据 变 异 程 度的 度 量 极 差 、 方 差 、 标 准 差 和 变 异 系 数 。 这 些 数字 是 描 述 样 本 频 率 分 布 特 征 的 , 称 为 样 本 数 字 特 征 或简 称 为 样 本 特 征 数 ( samp1e characteristics) ( 总体 称 参 数 ) 。 平 均 数 ( me
33、an) 平 均 数 是 统 计 学 中 最 常 用 的 统 计 量 , 用来 表 明 资 料 中 各 观 测 值 相 对 集 中 较 多 的 中 心位 置 。 主 要 包 括 :n 算 术 平 均 数 ( arithmetic mean)n 中 数 ( 中 位 数 ) ( median)n 众 数 ( mode)n 几 何 平 均 数 ( geometric mean) n 调 和 平 均 数 ( harmonic mean) 算 术 平 均 数n ( 一 ) 算 术 平 均 数 定 义n 算 术 平 均 数 是 指 资 料 中 各 观 测 值 的 总 和除 以 观测 值 个 数 所 得 的
34、商 , 简 称 平 均 数 或 均 数 。( 二 ) 算 术 平 均 数 计 算1 直 接 法主 要 用 于 样 本 含 量 n30以 下 、 未 经 分 组资 料 平 均 数 的 计 算 。 生 物 统 计 学 中 , 使 用 最 多 的 是 算 术 平 均 数 x 2 加 权 法n 对 于 样 本 含 量 n30以 上 , 且 已 分 组 的资 料 , 可 以 在 次 数 分 布 表 的 基 础 上 采 用加 权 法 计 算 平 均 数 : 算 数 平 均 数 的 基 本 特 征n 算 术 平 均 数 的 计 算 与 样 本 内 的 每 个 值 都 有 关 , 它 的大 小 受 每 个 值
35、 的 影 响 。n 若 每 个 xi都 乘 以 相 同 的 数 k, 则 平 均 数 亦 应 乘 以 k。n 若 每 个 xi都 加 上 相 同 的 数 A, 则 平 均 数 亦 应 加 上 A。n 如 果 是 n1个 数 的 平 均 数 , 是 n2个 数 的 平 均 数 , 那么 全 部 n1 n2个 数 的 算 术 平 均 数 是 加 权 平 均 数( weighted mean) : 平 均 数 的 计 算 方 法n 离 散 型 数 据 频 数 资 料 :注 意 记 住 所有 字 母 符 号的 含 义 例 1.1 新 生 儿 体 重作 表 计 算 是 个 好 习 惯 连 续 型 数 据
36、 频 数 资 料 : 例 1.2 “三 尺 三 ” 株 高 二 、 中 ( 位 ) 数n 将 资 料 内 所 有 观 测 值 从 小 到 大 依 次 排 列 , 位 于 中 间 的 那 个 观 测 值 称 为 中 位 数 。n 当 观 测 值 的 个 数 是 偶 数 时 , 则 以 中 间 两 个 观 测 值 的 平 均 数 作 为 中 位 数 。n 当 所 获 得 的 数 据 资 料 呈 偏 态 分 布 时 , 中 位 数 的 代 表 性 优 于 算 术 平 均 数 。 三 、 众 数n 具 有 最 高 频 数 的 组 值 或 中 值 称 为 众 数 。n 具 有 两 个 分 开 的 高 频
37、 率 分 布 称 双 众 数( bimodal) 。n 表 1-5 100听 罐 头 净 重 的 次 数 分 布 表 变 异 程 度 的 度 量n 对 于 数 据 的 变 异 程 度 , 经 常 使 用 的 度 量 方 法 有 三 种 ,它 们 是 : 范 围 ( range) 或 称 为 极 差 , 平 均 离 差( mean deviation, MD) 和 标 准 差 ( Standard deviation, s or SD) 或 称 为 标 准 离 差 。 其 中 最 重 要 的是 标 准 差 。 平 均 离 差 ( mean deviation, MD)表 1 6中 数 据 的 M
38、D: 除 得 的 商 称 为 样 本 方 差 ( sample variance) , 用 符 号 s2表 示 。n 离 差 平 方 和( sum of square of deviations) 标 准 差 ( s, SD)方 差 的 缺 点 :n 方 差 s2是 离 均 差 平 方 的 平 均 数 。 虽 然 方差 在 实 际 应 用 中 用 得 最 广 泛 , 但 它 还 不能 直 接 地 指 出 某 个 数 x与 平 均 数 之 间 的偏 离 究 竟 达 到 什 么 程 度 。 n s要 比 MD要 大 一 些 。n 如 果 数 据 分 布 曲 线 是 平 滑 且 对 称 的 ,那 么
39、 大 约 57 的 数 据 落 在 平 均 数 MD内 ;n 如 果 数 据 分 布 曲 线 是 平 滑 且 对 称 的 ,那 么 大 约 68 的 数 据 落 在 平 均 数 s内 。 n 总 之 , 衡 量 数 据 离 散 程 度 时 , 三 种 方 法都 可 以 使 用 。 用 抽 样 理 论 可 以 证 明 : 用标 准 差 估 计 总 体 离 散 程 度 最 可 靠 , 平 均离 差 次 之 。 标 准 差 的 计 算 方 法1. 非 频 数 资 料 的 计 算 方 法 不 要 求 公 式 推 导 。 例 1 3 从 两 个 小 区 分 别 随 机 抽 取 20株 小 麦 ,测 其
40、单 穗 粒 数 , 结 果 如 下 表 , 计 算 其 标 准差 。 列 出 下 表 计算 但 是 若 将 上 述 数 据 进 行 编 码 , 则 可 明 显 看 出 用 ( 1. 12)式 计 算 极 为 便 利 。 具 体 做 法 是 任 选 一 个 数 C, 求 每 一 个数 与 C的 差 , 利 用 差 值 计 算 离 差 平 方 和 。 结 果 与 未 编 码所 得 的 值 是 一 样 的 。 C最 好 选 接 近 平 均 数 的 一 个 数 , 这样 编 出 的 数 码 最 容 易 计 算 。 现 仅 对 例 1.3中 的第 一 个 小 区 进 行计 算 , 取 C 25,于 是
41、x x 25。根 据 ( 1.12) 式 编 码 和 列 表 都 是 好 习 惯 。 1. 频 数 资 料 的 计 算 方 法 n 对 于 连 续 型 数 据 , 可 以 用 中 值 代 替 离 散 型 数据 中 的 组 值 做 近 似 的 计 算 , 但 是 连 续 型 数 据中 的 中 值 一 般 都 较 大 , 必 须 编 码 后 再 计 算 。可 用 下 式 : 偏 斜 度 和 峭 度n 度 量 数 据 围 绕 众 数 呈 不 对 称 的 程 度 , 即 通 常所 称 的 偏 斜 度 ( skewness) 。 虽 然 有 几 种 不同 的 度 量 偏 斜 的 方 法 。 但 是 鉴
42、于 三 阶 中 心 矩( third central moment) 的 方 法 有 最 好 的 特性 , 因 而 使 用 得 最 广 泛 。 三 阶 中 心 矩 的 定 义为 : n 下 面 用 4、 11、 12和 13这 四 个 数 示 意 性 地 说 明 三 阶中 心 矩 并 计 算 出 m3 。 从 下 表 中 可 以 看 出 , 当 我 们 将离 差 立 方 后 , 其 中 有 一 个 负 数 , 它 远 远 超 过 另 外 三个 正 数 , 其 代 数 和 为 负 数 , 因 此 m3n 负 数 说 明 在 平 均 数 左 侧 的 离 差 大 于 右 侧 的 离 差 。 因此 分
43、 布 是 不 对 称 的 。 n 若 频 数 分 布 是 对 称 于 平 均 数 的 , 则 三 阶 中 心矩 等 于 0。n 当 曲 线 在 大 于 平 均 数 的 一 侧 有 一 个 “ 长 尾 ”时 ( 图 1 5A) , m3 0; 正 偏 。n 当 曲 线 在 小 于 平 均 数 的 一 侧 有 一 “ 长 尾 ” 时( 图 1 5B) , m3 0。 负 偏 。 m3 0 m3 0 m3的 两 个 严 重 缺 点n ( l) 它 的 单 位 为 物 理 学 单 位 的 立 方 ,因 此 在 不 同 类 型 数 据 之 间 不 易 比 较 。n ( 2) 因 为 它 没 有 计 算
44、数 据 变 异 的 性质 , 因 此 没 有 一 个 绝 对 的 含 义 。 为了 解 决 这 一 问 题 , 制 定 了 一 个 没 有任 何 单 位 的 量 。 g1 0 g1 0 n 第 二 个 度 量 曲 线 形 状 的 量 是 g2, 称 为 峭 度( kurtosis) 不 要 求 推 导 。 了 解 对 于 频 数 资 料 , 可 用 类 似 计 算 标 准 差 的 方 法 ,将 中 值 编 码 后 再 计 算 。 可 以 使 用 以 下 公 式 :了 解 例 1.2 “三 尺 三 ” 株 高 分 布 的 g1和 g2。 将 表 1-3中 的 数 据 用 C 157编 码 后 ,
45、 列 成 下 表 g1和 g2值 与 “ 正 态 ” 曲 线 的 值 差 异 都 不 大 。 g1 -0.105与正 态 的 0很 接 近 , 但 稍 微 有 些 负 偏 。 g2 0.295略 高 于 正 态的 0, 即 曲 线 的 峰 略 突 起 。 所 以 两 者 均 可 被 认 为 接 近 “ 正态 ” 曲 线 。 在 做 曲 线 形 状 判 断 时 , 必 须 是 一 个 大 的 样 本 , g1 和 g2 才 可 靠 。 判 断 g1 时 , 样 本 含 量 至 少 要 200以 上 , g2需 l000以 上 。 以 上 各 阶 矩 都 是 由 样 本 计 算 得 到 的 , 因 此 称 为 样 本矩 ( sample moment) 。 变 异 系 数 ( coefficient of variability, CV)n 假 若 两 组 数 据 的 标 准 差 相 等 , 但 是 平 均 数 不等 , 那 么 平 均 数 大 的 样 本 , 比 平 均 数 小 的 样本 相 对 来 说 更 整 齐 。n 为 了 客 观 地 比 较 两 者 的 变 异 程 度 , 引 入 变 异系 数 ( coefficient of variability, CV) 这 一 概念 。 变 异 系 数 的 公 式 为 :
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。