计算机系统结构第15讲

上传人:san****019 文档编号:21530375 上传时间:2021-05-03 格式:PPT 页数:99 大小:662.10KB
收藏 版权申诉 举报 下载
计算机系统结构第15讲_第1页
第1页 / 共99页
计算机系统结构第15讲_第2页
第2页 / 共99页
计算机系统结构第15讲_第3页
第3页 / 共99页
资源描述:

《计算机系统结构第15讲》由会员分享,可在线阅读,更多相关《计算机系统结构第15讲(99页珍藏版)》请在装配图网上搜索。

1、计 算 机 系 统 结 构 ( 第 15讲 ) 计算机系统结构第一章 基本概念第二章 指令系统第三章 存储系统第四章 输入输出系统第五章 标量处理机第六章 向量处理机第七章 互连网络第八章 并行处理机和 多处理机 第五章标量处理机5.1 指令的重叠执行方式5.2 流水线技术5.3 超标量处理机5.4 超流水线处理机5.5 超标量超流水线处理机 只 有 标 量 数 据 表 示 和 标 量 指 令 系 统 的 处 理 机 称为 标 量 处 理 机提 高 指 令 执 行 速 度 的 主 要 途 径 :(1) 提 高 处 理 机 的 工 作 主 频(2) 采 用 更 好 的 算 法 和 设 计 更 好

2、 的 功 能 部 件(3) 采 用 指 令 级 并 行 技 术三 种 指 令 级 并 行 处 理 机 :(1) 流 水 线 处 理 机 和 超 流 水 线 (Super- pipelining)处 理 机(2) 超 标 量 (Superscalar)处 理 机(3) 超 长 指 令 字 (VLIW: Very Long Instruction Word)处 理 机 5.1 指令的重叠执行方式1、顺序执行方式执 行 n条 指 令 所 用 的 时 间 为 :如 果 每 段 时 间 都 为 t, 则 执 行 n条 指 令 所 用的 时 间 为 : T=3nt ni iii tttT 1( )执 行分

3、 析取 指 令取指令k分析k执行k取指令k+1分析k+1执行k+1 主 要 优 点 :控 制 简 单 , 节 省 设 备 。主 要 缺 点 :执 行 指 令 的 速 度 慢 , 功 能 部 件 的 利 用 率很 低 。2、一次重叠执行方式一 种 最 简 单 的 流 水 线 方 式如 果 两 个 过 程 的 时 间 相 等 , 则 执 行 n条 指 令的 时 间 为 : T=(1+2n)t 取指分析执行取指分析执行取指分析执行主 要 优 点 :指 令 的 执 行 时 间 缩 短功 能 部 件 的 利 用 率 明 显 提 高主 要 缺 点 :需 要 增 加 一 些 硬 件控 制 过 程 稍 复 杂

4、 3、二次重叠执行方式如 果 三 过 程 的 时 间 相 等 , 执 行 n条 指 令 的 时间 为 : T=(2+n)t理 想 情 况 下 同 时 有 三 条 指 令 在 执 行处 理 机 的 结 构 要 作 比 较 大 的 改 变 , 必 须 采用 先 行 控 制 方 式取指k+2分析k+2执行k+2取指k+1分析k+1执行k+1取指k分析k执行k 先 行 控 制 方 式 的 原 理1、 采 用 二 次 重 叠 执 行 方 式 , 必 须 解 决 两 个 问 题 : (1) 有 独 立 的 取 指 令 部 件 、 指 令 分 析 部 件 和 指 令 执 行 部 件 独 立 的 控 制 器

5、: 存 储 控 制 器 、 指 令 控 制 器 、 运 算 控 制 器 (2) 要 解 决 访 问 主 存 储 器 的 冲 突 问 题 取 指 令 、 分 析 指 令 、 执 行 指 令 都 可 能 要 访 问 存 储 器2、 解 决 访 存 冲 突 的 方 法 : (1) 采 用 低 位 交 叉 存 取 方 式 : 这 种 方 法 不 能 根 本 解 决 冲 突 问 题 。取 指 令 、 读 操 作 数 、 写 结 果 。 (2) 两 个 独 立 的 存 储 器 : 独 立 的 指 令 存 储 器 和 数 据 存 储 器 。 如 果 再 规 定 , 执 行 指 令 所 需 要 的 操 作 数

6、 和 执 行 结 果 只写 到 通 用 寄 存 器 , 那 么 , 取 指 令 、 分 析 指 令 和 执 行 指 令 就可 以 同 时 进 行 。 在 许 多 高 性 能 处 理 机 中 , 有 独 立 的 指 令 Cache和 数 据Cache。 这 种 结 构 被 称 为 哈 佛 结 构 。 (3) 采 用 先 行 控 制 技 术 。 先 行 控 制 技 术 的 关 键 是 缓 冲 技 术 和 预 处 理 技 术 。 缓 冲 技 术 是 在 工 作 速 度 不 固 定 的 两 个 功 能 部 件 之 间 设置 缓 冲 栈 , 用 以 平 滑 它 们 的 工 作 。 在 采 用 了 缓 冲

7、 技 术 和 预 处 理 技 术 之 后 , 运 算 器 能 够 专心 于 数 据 的 运 算 , 从 而 大 幅 度 提 高 程 序 的 执 行 速 度 。 (2) 两 个 独 立 的 存 储 器 : 独 立 的 指 令 存 储 器 和 数 据 存 储 器 。 如 果 再 规 定 , 执 行 指 令 所 需 要 的 操 作 数 和 执 行 结 果 只写 到 通 用 寄 存 器 , 那 么 , 取 指 令 、 分 析 指 令 和 执 行 指 令 就可 以 同 时 进 行 。 在 许 多 高 性 能 处 理 机 中 , 有 独 立 的 指 令 Cache和 数 据Cache。 这 种 结 构 被

8、 称 为 哈 佛 结 构 。 (3) 采 用 先 行 控 制 技 术 。 先 行 控 制 技 术 的 关 键 是 缓 冲 技 术 和 预 处 理 技 术 。 缓 冲 技 术 是 在 工 作 速 度 不 固 定 的 两 个 功 能 部 件 之 间 设置 缓 冲 栈 , 用 以 平 滑 它 们 的 工 作 。 在 采 用 了 缓 冲 技 术 和 预 处 理 技 术 之 后 , 运 算 器 能 够 专心 于 数 据 的 运 算 , 从 而 大 幅 度 提 高 程 序 的 执 行 速 度 。 计 算 机 系 统 结 构 ( 第 16讲 ) 第五章标量处理机5.1 先行控制技术5.2 流水线技术5.3

9、超标量处理机5.4 超流水线处理机5.5 超标量超流水线处理机 5.2 流水线技术5.2.1 流水线工作原理5.2.2 流水线的分类5.2.3 线性流水线的性能分析5.2.4 非线性流水线的调度技术 5.2 流水线技术空 间 并 行 性 :设 置 多 个 独 立 的 操 作 部 件多 操 作 部 件 处 理 机超 标 量 处 理 机时 间 并 行 性 :采 用 流 水 线 技 术 。不 增 加 或 只 增 加 少 量 硬 件 就 能 使 运 算速 度 提 高 几 倍流 水 线 处 理 机超 流 水 线 处 理 机 5.2.1 流水线工作原理1、简单流水线流 水 线 的 每 一 个 阶 段 称

10、为 流 水 步 、 流 水步 骤 、 流 水 段 、 流 水 线 阶 段 、 流 水 功能 段 、 功 能 段 、 流 水 级 、 流 水 节 拍 等 。分析器分析k+1流水锁存器执行部件执行k流水锁存器输入输出t1 t2 在 每 一 个 流 水 段 的 末 尾 或 开 头 必 须 设 置一 个 寄 存 器 , 称 为 流 水 寄 存 器 、 流 水锁 存 器 、 流 水 闸 门 寄 存 器 等 。 会 增 加指 令 的 执 行 时 间 。为 了 简 化 , 在 一 般 流 水 线 中 不 画 出 流 水锁 存 器 。2、一种指令流水线取指形成操作数地址译码取操作数执行保存结果 一 般 4至

11、12个 流 水 段 , 等 于 及 大 于 8个 流水 段 的 称 为 超 流 水 线 处 理 机3、流水线的时空图一 条 简 单 流 水 线 的 时 空 图 :分析k分析k+1分析k+2分析k+3执行k执行k+1执行k+2执行k+3时间空间0 t1 t2 t3 t4 t5 一 个 浮 点 加 法 器 流 水 线 的 时 空 图 (由 求 阶 差 、对 阶 、 尾 数 加 和 规 格 化 4个 流 水 段 组 成 ):ED1时间空间0 t1 t2 t3 t4 t5ED2 ED3 ED4 ED5EA1 EA2 EA3 EA4 EA5MA1MA2MA3MA4MA5NL1 NL2 NL3 NL4 N

12、L5t6 t7 t8NL:规格化MA:尾数加EA:对阶ED:求阶差 4、流水线的主要特点只 有 连 续 提 供 同 类 任 务 才 能 充 分 发 挥 流水 线 的 效 率 :对 于 指 令 流 水 线 : 要 尽 量 减 少 因 条 件分 支 造 成 的 “ 断 流 ”对 于 操 作 部 件 : 主 要 通 过 编 译 技 术 ,尽 量 提 供 连 续 的 同 类 操 作在 流 水 线 的 每 一 个 流 水 线 段 中 都 要 设 置一 个 流 水 锁 存 器时 间 开 销 : 流 水 线 的 执 行 时 间 加 长是 流 水 线 中 需 要 增 加 的 主 要 硬 件 之 一 各 流 水

13、 段 的 时 间 应 尽 量 相 等流 水 线 处 理 机 的 基 本 时 钟 周 期 等 于 时间 最 长 的 流 水 段 的 时 间 长 度流 水 线 需 要 有 “ 装 入 时 间 ” 和 “ 排 空 时间 ” 5.2.2 流水线的分类1、线性流水线与非线性流水线流 水 线 的 各 个 流 水 段 之 间 是 否 有 反 馈 信 号线 性 流 水 线 (Linear Pipelining)每 个 流 水 段 都 流 过 一 次 , 且 仅 流 过 一 次非 线 性 流 水 线 (Nonlinear Pipelining)在 流 水 线 的 某 些 流 水 段 之 间 有 反 馈 回 路或

14、 前 馈 回 路线 性 流 水 线 能 够 用 流 水 线 连 接 图 唯 一 表 示非 线 性 流 水 线 必 须 用 流 水 线 连 接 图 流 水线 预 约 表 等 共 同 表 示 S1输入S2 S3输出前馈回路反馈回路一种简单的非线性流水线 计 算 机 系 统 结 构 ( 第 17讲 ) 2、按照流水线的级别来分处 理 机 级 流 水 线 , 又 称 为 指 令 流 水 线 (Instruction Pipelining)例 如 : 在 采 用 先 行 控 制 器 的 处 理 机 中 ,各 功 能 部 件 之 间 的 流 水 线先行指令缓冲栈输入先行控制方式中的指令流水线先行指令分析器

15、先行读数栈先行操作栈取指译码取操作数指令执行部件后行写数栈输出执行写结果 部 件 级 流 水 线 ( 操 作 流 水 线 ) , 如 浮 点 加法 器 流 水 线处 理 机 之 间 的 流 水 线 称 为 宏 流 水 线 (Macro Pipelining)每 个 处 理 机 对 同 一 个 数 据 流 的 不 同 部 分分 别 进 行 处 理求阶差输入输出t1对阶尾数加规格化t2 t3 t4P1输入任务1 M M P2任务2 MP3任务3输出 3、单功能流水线与多功能流水线单 功 能 流 水 线 :只 能 完 成 一 种 固 定 功 能 的 流 水 线Cray-1计 算 机 中 有 12条

16、; YH-1计 算 机 有 18条 ; Pentium有 一 条 5段 的 定 点 和 一 条 8段的 浮 点 流 水 线 ; Pentium 有 三 条 指 令 流水 线 , 其 中 两 条 定 点 指 令 流 水 线 , 一 条 浮点 指 令 流 水 线 。 多 功 能 流 水 线 :流 水 线 的 各 段 通 过 不 同 连 接 实 现 不 同 功 能 Texas公 司 的 ASC计 算 机 中 的 8段 流 水 线 ,能 够 实 现 : 定 点 加 减 法 、 定 点 乘 法 、 浮 点加 法 、 浮 点 乘 法 、 逻 辑 运 算 、 移 位 操 作 、数 据 转 换 、 向 量 运

17、 算 等 。 A B A B A B A B输 入 输 入 输 入 输 入求 阶 差 求 阶 差 求 阶 差 求 阶 差 对 阶 对 阶 对 阶 对 阶尾 数 加 尾 数 加 尾 数 加 尾 数 加 规 格 化 规 格 化 规 格 化 规 格 化尾 数 乘 尾 数 乘 尾 数 乘 尾 数 乘 累 加 累 加 累 加 累 加输 出 输 出 输 出 输 出 g= f(A ,B) 定 点 乘 浮 点 加 浮 点 点 积(a)功 能 段 间 的 互 连 (b)定 点 乘 法 (c)浮 点 加 法 (d)浮 点 点 积 4、静态流水线与动态流水线静 态 流 水 线 :同 一 段 时 间 内 , 多 功

18、能 流 水 线 中 的 各 个功 能 段 只 能 按 照 一 种 固 定 的 方 式 连 接 ,实 现 一 种 固 定 的 功 能 。只 有 连 续 出 现 同 一 种 运 算 时 , 流 水 线 的效 率 才 能 得 到 充 分 的 发 挥 。动 态 流 水 线 :在 同 一 段 时 间 内 , 多 功 能 流 水 线 中 的 各段 可 以 按 照 不 同 的 方 式 连 接 , 同 时 执 行多 种 功 能 。 1时间空间0 2 3 n1 2 3 n1 2 3 n1 2 3 n1 2 3 n1 2 3 n 1 2 3 4 1 2 3 1 2 1输入求阶差对阶尾数加规格化尾数乘累加输出静态流

19、水线时空图浮点加法定点乘法 1时间空间0 2 3 n1 2 3 n1 2 3 n1 2 3 n1 2 3 n1 2 3 n输入求阶差对阶尾数加规格化尾数乘累加输出动态流水线时空图1 2 3 54 61 2 3 541 2 3 41 2 3 浮点加法定点乘法 5、流水线的其他分类方法按 照 数 据 表 示 方 式 :标 量 流 水 线 和 向 量 流 水 线按 照 控 制 方 式 : 同 步 流 水 线 和 异 步 流 水 线顺 序 流 水 线 与 乱 序 流 水 线 :乱 序 流 水 线 又 称 为 无 序 流 水 线 、 错 序 流水 线 或 异 步 流 水 线 等S1就绪回答S2就绪回答S

20、3就绪回答输出就绪回答输入 5.2.3 线性流水线的性能分析衡 量 流 水 线 性 能 的 主 要 指 标 有 :吞 吐 率 、 加 速 比 和 效 率1、吞吐率(Though Put)求 流 水 线 吞 吐 率 的 最 基 本 公 式 : TP = n / Tkn为 任 务 数 , Tk为 完 成 n个 任 务 所 用 时 间各 段 执 行 时 间 相 等 , 输 入 连 续 任 务 情 况 下完 成 n个 连 续 任 务 需 要 的 总 时 间 为 :Tk= (k+n-1) t k为 流 水 线 的 段 数 , t为 时 钟 周 期 1时间空间S1 2 3 n-1 nS2S3S4 1 2

21、3 n-1 n1 2 3 n-1 n1 2 3 n-1 nkt (n-1) tnt (k-1)tT 吞 吐 率 :最 大 吞 吐 率 为 :各 段 执 行 时 间 不 相 等 、 输 入 连 续 任 务 情 况 下 :吞 吐 率 为 :最 大 吞 吐 率 为 : tnk nTP )1( nTP Lim nk n t t max ( )1 1 ),max()1( 211 kki i tttnt nTP ),max( 1 21 ktttTP 流 水 线 各 段 执 行 时 间 不 相 等 的 解 决 办 法S1输入t1=t S2t2=3t S3t3=t S4t4=t输出1时间空间S1S2S3S4

22、t i (n-1)t2Tk2 3 n1 2 3 n1 2 3 n1 2 3 n 一 是 将 “ 瓶 颈 ” 流 水 段 细 分 (如 果 可 分 的 话 ):二 是 将 “ 瓶 颈 ” 流 水 段 重 复 设 置 :S1输入输出t S2-1t S2-2t S2-3t S3t S4tS2(3t)S1输入输出t1=t S2-1S2-1S2-1 S3 S4t3=t t4=tt 2=3t 1时间空间2 3 nS1流水段重复设置的流水线S2-1 4 5 6 1 4 -2-1n-22 5 n-13 6 n1 2 3 n4 5 6 -2-11 2 3 n4 5 6 -2-1S2-2S2-3S3S4 2、加速

23、比(Speedup)计 算 流 水 线 加 速 比 的 基 本 公 式 :S = 顺 序 执 行 时 间 T0 / 流 水 线 执 行 时 间 Tk各 段 执 行 时 间 相 等 , 输 入 连 续 任 务 情 况 下加 速 比 为 : 最 大 加 速 比 为 :各 段 执 行 时 间 不 等 , 输 入 连 续 任 务 情 况 下实 际 加 速 比 为 : 1)1( nk nktnk tnkS S Lim k nk n k nmax 1 计 算 机 系 统 结 构 ( 第 18讲 ) 5.2.3 线性流水线的性能分析衡 量 流 水 线 性 能 的 主 要 指 标 有 :吞 吐 率 、 加 速

24、 比 和 效 率1、吞吐率(Though Put)求 流 水 线 吞 吐 率 的 最 基 本 公 式 : TP = n / Tkn为 任 务 数 , Tk为 完 成 n个 任 务 所 用 时 间各 段 执 行 时 间 相 等 , 输 入 连 续 任 务 情 况 下完 成 n个 连 续 任 务 需 要 的 总 时 间 为 :Tk= (k+n-1) t k为 流 水 线 的 段 数 , t为 时 钟 周 期 1时间空间S1 2 3 n-1 nS2S3S4 1 2 3 n-1 n1 2 3 n-1 n1 2 3 n-1 nkt (n-1) tnt (k-1)tT 吞 吐 率 :最 大 吞 吐 率 为

25、 :各 段 执 行 时 间 不 相 等 、 输 入 连 续 任 务 情 况 下 :吞 吐 率 为 :最 大 吞 吐 率 为 : tnk nTP )1( nTP Lim nk n t t max ( )1 1 ),max()1( 211 kki i tttnt nTP ),max( 1 21 ktttTP 2、加速比(Speedup)计 算 流 水 线 加 速 比 的 基 本 公 式 :S = 顺 序 执 行 时 间 T0 / 流 水 线 执 行 时 间 Tk各 段 执 行 时 间 相 等 , 输 入 连 续 任 务 情 况 下加 速 比 为 : 最 大 加 速 比 为 :各 段 执 行 时 间

26、 不 等 , 输 入 连 续 任 务 情 况 下实 际 加 速 比 为 : 1)1( nk nktnk tnkS S Lim k nk n k nmax 1 S n tt n t t tiikiik k 11 1 21( ) max( , , , )K=6K=10任务个数加速比1024681 1 2 4 8 16 3264128 3、效率(Efficiency)计 算 流 水 线 效 率 的 一 般 公 式 :各 流 水 段 执 行 时 间 相 等 , 输 入 n个 连 续 任 务流 水 线 的 效 率 为 : 流 水 线 的 最 高 效 率 为 :各 流 水 段 执 行 时 间 不 等 ,

27、输 入 n个 连 续 任 务流 水 线 的 效 率 为 : kTkTknE 0个 流 水 段 的 总 的 时 空 区个 任 务 占 用 的 时 空 区 1)1( nk ntnkk tnkE 11 max nk nLimE n 流 水 线 各 段 的 设 备 量 或 各 段 的 价 格 不 相 等 时 :流 水 线 的 效 率 为 :即 :其 中 , ai k, 且 ),max()1 211 1 kki i ki i tttntk tnE ( 空 区个 流 水 段 的 总 的 加 权 时 区个 任 务 占 用 的 加 权 时 空knE ),max()1 21 11 1 nki iikiI i k

28、i ii tttntaa tanE ( kaki i 1 流 水 线 的 吞 吐 率 、 加 速 比 与 效 率 的 关 系 :因 为因 此 : E=TP t , S=kE5、流水线性能分析举例对 于 单 功 能 线 性 流 水 线 , 输 入 连 续 任 务 的 情况 , 通 过 上 面 给 出 的 公 式 很 容 易 计 算 出流 水 线 的 吞 吐 率 、 加 速 比 和 效 率 。例5.2:用 一 条 4段 浮 点 加 法 器 流 水 线 求 8个浮 点 数 的 和 :Z A B C D E F G Htnk nTP )1( 1 nk nkS 1 nk nE 解:Z = (A+B) +

29、 (C+D) + (E+F) + (G+H)1时间空间2 3求阶差4 5 6 71 2 3 4 5 6 71 2 3 4 5 6 71 2 3 4 5 6 7对阶尾数加规格化加数A C E G A+BE+FB D F H C+DG+H A+B+C+DE+F+G+H结果A+BC+DE+FG+H A+B+C+DE+F+G+H 7个 浮 点 加 法 共 用 了 15个 时 钟 周 期 。流 水 线 的 吞 吐 率 为 :流 水 线 的 加 速 比 为 :流 水 线 的 效 率 为 : ttTnTP k 1470157 87115740 ttTTS k 470154 740 ttTkTE k 第五章标

30、量处理机5.1 先行控制技术5.2 流水线技术5.3 超标量处理机5.4 超流水线处理机5.5 超标量超流水线处理机 5.3 超标量处理机5.3.1 基本结构5.3.2 单发射与多发射 超 标 量 处 理 机 :Intel公 司 的 i860, i960, Pentium处 理 机Motolora公 司 的 MC88110IBM公 司 的 Power 6000SUN公 司 的 SuperSPARC等 。超 流 水 线 处 理 机 :SGI公 司 的 MIPS R4000, R5000, R10000等 。超 标 量 超 流 水 线 处 理 机 :DEC公 司 的 Alpha等 。 k段流水线基

31、准标量处理机m度超标量n度超流水线(m,n)度超标量超流水机器类型机器流水线周期同时发射指令条数指令发射等待时间指令级并行度ILP 1个时钟周期1条1个时钟周期1 1m1m 1/n11/nn 1/nm1/nmn超 标 量 、 超 流 水 、 超 标 量 超 流 水 处 理 机 的 主 要 性 能 5.3.1 基本结构一 般 流 水 线 处 理 机 :一 条 指 令 流 水 线 ,一 个 多 功 能 操 作 部 件 , 每 个 时 钟 周 期平 均 执 行 指 令 的 条 数 小 于 1。多 操 作 部 件 处 理 机 :一 条 指 令 流 水 线 ,多 个 独 立 的 操 作 部 件 , 操

32、作 部 件 可 以采 用 流 水 线 , 也 可 以 不 流 水 。 多 操 作部 件 处 理 机 的 指 令 级 并 行 度 小 于 1。 超 标 量 处 理 机 典 型 结 构 :多 条 指 令 流 水 线先 进 的 超 标 量 处 理 机 有 : 定 点 处 理 部件 CPU, 浮 点 处 理 部 件 FPU,图 形 加 速部 件 GPU大 量 的 通 用 寄 存 器 , 两 个 一 级 高 速Cache超 标 量 处 理 机 的 指 令 级 并 行 度 大 于 1 Motorola公 司 的 MC88110:10个 操 作 部 件两 个 寄 存 器 堆 : 整 数 部 件 通 用 寄

33、存 器堆 , 32个 32位 寄 存 器 ; 浮 点 部 件 扩 展 寄 存器 堆 , 32个 80位 寄 存 器 。 每 个 寄 存 器 堆 有8个 端 口 , 分 别 与 8条 内 部 总 线 相 连 接 , 有一 个 缓 冲 深 度 为 4的 先 行 读 数 栈 和 一 个 缓冲 深 度 为 3的 后 行 写 数 栈 。两 个 独 立 的 高 速 Cache中 , 各 为 8KB,采 用 两 路 组 相 联 方 式 ,转 移 目 标 指 令 Cache, 在 有 两 路 分 支时 , 存 放 其 中 一 路 分 支 上 的 指 令 计 算 机 系 统 结 构 ( 第 19讲 ) Moto

34、rola公 司 的 MC88110:10个 操 作 部 件两 个 寄 存 器 堆 : 整 数 部 件 通 用 寄 存 器堆 , 32个 32位 寄 存 器 ; 浮 点 部 件 扩 展 寄 存器 堆 , 32个 80位 寄 存 器 。 每 个 寄 存 器 堆 有8个 端 口 , 分 别 与 8条 内 部 总 线 相 连 接 , 有一 个 缓 冲 深 度 为 4的 先 行 读 数 栈 和 一 个 缓冲 深 度 为 3的 后 行 写 数 栈 。两 个 独 立 的 高 速 Cache中 , 各 为 8KB,采 用 两 路 组 相 联 方 式 ,转 移 目 标 指 令 Cache, 在 有 两 路 分

35、支时 , 存 放 其 中 一 路 分 支 上 的 指 令 整数部件整数部件位操作浮点加乘法部件除法部件图形部件图形部件内部总线读数存数部件通用寄存器堆扩展寄存器堆目标指令指令分配转移部件数据Cache (8KB)指令Cache (8KB)系统总线32位地址总线32位数据总线超 标 量 处 理 机 MC88110的 结 构 5.3.2 单发射与多发射单 发 射 处 理 机 :每 个 周 期 只 取 一 条 指 令 、 只 译 码 一条 指 令 , 只 执 行 一 条 指 令 , 只 写 回 一 个运 算 结 果取 指 部 件 和 译 码 部 件 各 设 置 一 套可 以 只 设 置 一 个 多

36、功 能 操 作 部 件 ,也 可 以 设 置 多 个 独 立 的 操 作 部 件操 作 部 件 中 可 以 采 用 流 水 线 结 构 ,也 可 以 不 采 用 流 水 线 结 构设 计 目 标 是 每 个 时 钟 周 期 平 均 执 行一 条 指 令 , ILP的 期 望 值 1 IF时钟周期指令I1I2I3 ID EX WRIF ID EX WRIF ID EX WR1 2 3 4 5 6单发射处理机的指令流水线时空图 IF ID FA1 FA2 FA3MD1MD2MD3ALLS浮点加法部件乘除法部件定点ALU部件取数存数部件WR来自指令Cache通用寄存器后行写数栈 多 发 射 处 理

37、机 :每 个 周 期 同 时 取 多 条 指 令 、 同 时 译码 多 条 指 令 , 同 时 执 行 多 条 指 令 , 同 时写 回 多 个 运 算 结 果需 要 多 个 取 指 令 部 件 , 多 个 指 令 译码 部 件 和 多 个 写 结 果 部 件设 置 多 个 指 令 执 行 部 件 , 复 杂 的 指令 执 行 部 件 一 般 采 用 流 水 线 结 构设 计 目 标 是 每 个 时 钟 周 期 平 均 执 行多 条 指 令 , ILP的 期 望 值 大 于 1 IF时钟周期指令I1I2I3 ID EX WR1 2 3 4 5 6多发射处理机的指令流水线时空图I4I5I6 IF

38、 ID EX WRI7I8I9 IF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WR IF ID FA1 FA2 FA3MD1MD2MD3ALLS浮点加法部件乘除法部件定点ALU部件取数存数部件WRIF ID WR 超 标 量 处 理 机 :一 个 时 钟 周 期 内 能 够 同 时 发 射 多 条 指令 的 处 理 机 称 为 超 标 量 处 理 机必 须 有 两 条 或 两 条 以 上 能 够 同 时 工 作的 指 令 流 水 线先 行 指 令 窗 口 :能 够 从 指 令 Cache中

39、预 取 多 条 指 令能 够 对 窗 口 内 的 指 令 进 行 数 据 相 关 性分 析 和 功 能 部 件 冲 突 的 检 测窗 口 的 大 小 : 一 般 为 2至 8条 指 令采 用 目 前 的 指 令 调 度 技 术 , 每 个 周 期发 射 2至 4条 指 令 比 较 合 理 例 如 : Intel公 司 的 i860、 i960、 Pentium处 理机 , Motolora公 司 的 MC88110处 理 机 ,IBM公 司 的 Power 6000处 理 机 等 每 个 周 期都 发 射 两 条 指 令TI公 司 生 产 的 SuperSPARC处 理 机 以及 Intel的

40、 Pentium III处 理 机 等 每 个 周 期 发射 三 条 指 令操 作 部 件 的 个 数 多 于 每 个 周 期 发 射 的指 令 条 数 。 4个 至 16个 操 作 部 件超 标 量 处 理 机 的 指 令 级 并 行 度 : 1ILP m; m为 每 个 周 期 发 射 的 指 令 条 数 。 IF ID FA1 FA2 FA3MD1MD2MD3ALLS浮点加法部件乘除法部件定点ALU部件取数存数部件WRIF ID WRIF ID先行指令窗口 第五章标量处理机5.1 先行控制技术5.2 流水线技术5.3 超标量处理机5.4 超流水线处理机5.5 超标量超流水线处理机 5.4

41、 超流水线处理机两 种 定 义 :一 个 周 期 内 能 够 分 时 发 射 多 条 指令 的 处 理 机 称 为 超 流 水 线 处 理 机指 令 流 水 线 有 8个 或 更 多 功 能 段 的流 水 线 处 理 机 称 为 超 流 水 线 处 理 机提 高 处 理 机 性 能 的 不 同 方 法 :超 标 量 处 理 机 是 通 过 增 加 硬 件 资源 为 代 价 来 换 取 处 理 机 性 能 的超 流 水 线 处 理 机 则 通 过 各 硬 件 部件 充 分 重 叠 工 作 来 提 高 处 理 机 性 能 两 种 不 同 并 行 性 :超 标 量 处 理 机 采 用 的 是 空 间

42、 并 行 性超 流 水 线 处 理 机 采 用 的 是 时 间 并 行 性 5.4.1 指令执行时序每 隔 1/n个 时 钟 周 期 发 射 一 条 指 令 , 流 水线 周 期 为 1/n个 时 钟 周 期在 超 标 量 处 理 机 中 , 流 水 线 的 有 些 功 能段 还 可 以 进 一 步 细 分例 如 : ID功 能 段 可 以 再 细 分 为 译 码 、 读第 一 操 作 数 和 读 第 二 操 作 数 三 个 流 水段 。 也 有 些 功 能 段 不 能 再 细 分 , 如 WR功 能 段 一 般 不 再 细 分 。 因 此 有 超 流 水线 的 另 外 一 种 定 义 : 有

43、 8个 或 8个 以 上流 水 段 的 处 理 机 称 为 超 流 水 线 处 理 机 IF时钟周期指令I1I2I3 ID EX WR1 2 3 4 5 6每个时钟周期分时发送3条指令的超流水线I4I5I6 IF ID EX WRI7I8I9 IF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WR 5.4.2 典型处理机结构MIPS R4000处 理 机 每 个 时 钟 周 期 包 含 两个 流 水 段 , 是 一 种 很 标 准 的 超 流 水 线处 理 机 结 构 。 指 令 流 水 线 有

44、 8个 流 水 段有 两 个 Cache, 指 令 Cache和 数 据 Cache的容 量 各 8KB, 每 个 时 钟 周 期 可 以 访 问Cache两 次 , 因 此 在 一 个 时 钟 周 期 内 可以 从 指 令 Cache中 读 出 两 条 指 令 , 从 数据 Cache中 读 出 或 写 入 两 个 数 据 。主 要 运 算 部 件 有 整 数 部 件 和 浮 点 部 件 译 码 数 据C a c h e 标 志 标 志 指 令C a c h e 译 码 存 入缓 冲 对 准 器 IB U S 写 入 缓 冲 器 数 据 标 志 地 址 D B U S 系 统 控 制 浮 点

45、 存 储 管 理 部 件寄 存 器 堆 指 令 快 表 浮 点 流 水 线 专 用 通 路 指 令 C ache 控 制 快 表 TL B 浮 点 控 制 寄 存 器 D V A IV A浮 点 乘 法 部 件 地 址 部 件 浮 点 除 法 部 件 数 据 C ache 控 制 程 序 计 数 器 浮 点 加 法 部 件 流 水 线 通 用 寄 存 器 堆 转 换 部 件 控 制 算 术 逻 辑 部 件 A L U 求 平 方 根 部 件 装 入 对 准 器 / 存 入 驱 动 器 整 数 乘 法 除 法 部 件 M I P S R 4 0 0 0 超 流 水 线 处 理 机 结 构 指令C

46、acheMIPS R4000处 理 机 的 流 水 线 操 作IF: 取 第 一 条 指 令 IS: 取 第 二 条 指 令RF: 读 寄 存 器 堆 , 指 令 译 码EX: 执 行 指 令 DF: 取 第 一 个 数 据DS: 取 第 二 个 数 据 TC: 数 据 标 志校 验 ; WB: 写 回 结 果指令译码读寄存器堆ALU数据Cache标志检验寄存器堆IF IS RF EX DF DS WBTC IF流水线周期当前CPU周期IS RF EX DF DS TCWBIF IS RF EX DF DS TCWBIF IS RF EX DF DS TCWBIF IS RF EX DF DS

47、 TCWBIF IS RF EX DF DS TCWBIF IS RF EX DF DS TCWBIF IS RF EX DF DS TCWBIF IS RF EX DF DS TCWB主时钟周期MIPS R4000正常指令流水线工作时序 如 果 在 LOAD指 令 之 后 的 两 条 指 令 中 ,任 何 一 条 指 令 要 在 它 的 EX流 水 级 使用 这 个 数 据 , 则 指 令 流 水 线 要 暂 停 一个 时 钟 周 期采 用 顺 序 发 射 方 式 暂停IF IS RF EX DF DS TC WBMIPS R4000正常指令流水线工作时序IS RF EX DF DS TC

48、WBRF EX DF DS TC WBEX DF DS TC WBEX DF DS TC WBDF DS TC WBIFISRFI1I2I3I4I5I6运行运行Load指令使用Load数据 5.4.3 超流水线处理机性能指 令 级 并 行 度 为 (1,n)的 超 流 水 线 处 理 机 ,执 行 N条 指 令 所 的 时 间 为 :超 流 水 线 处 理 机 相 对 于 单 流 水 线 普 通 标量 处 理 机 的 加 速 比 为 : tnknT N )(),( 11 tnNk tNknTTnS )1( )1(),1( )1,1(),(1 即 :超 流 水 线 处 理 机 的 加 速 比 的

49、 最 大 值 为 :S(1,n)MAX = n 1)1(),1( Nnk NknnS 第五章标量处理机5.1 先行控制技术5.2 流水线技术5.3 超标量处理机5.4 超流水线处理机5.5 超标量超流水线处理机 5.5 超标量超流水线处理机把 超 标 量 与 超 流 水 线 技 术 结 合 在 一起 , 就 成 为 超 标 量 超 流 水 线 处 理 机5.5.1 指令执行时序5.5.2 典型处理机结构5.5.3 超标量超流水线处理机性能5.5.4 三种指令级并行性处理机性能比较 5.5.1 指令执行时序超 标 量 超 流 水 线 处 理 机 在 一 个 时 钟 周期 内 分 时 发 射 指

50、令 n次 , 每 次 同 时 发射 指 令 m条 , 每 个 时 钟 周 期 总 共 发 射指 令 m n条 。 IF时钟周期指令I1I2I3 ID EX WR1 2 3 4 5I4I5I6I7I8I9 IF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRIF ID EX WRI10I 11I12 每时钟周期发射3次,每次3条指令 5.5.2 典型处理机结构DEC公 司 的 Alpha处 理 机 采 用 超 标 量 超 流水 线

51、 结 构 。 主 要 由 四 个 功 能 部 件 和 两个 Cache组 成 : 整 数 部 件 EBOX、 浮 点部 件 FBOX、 地 址 部 件 ABOX和 中 央控 制 部 件 IBOX。中 央 控 制 部 件 IBOX可 以 同 时 从 指 令Cache中 读 入 两 条 指 令 , 同 时 对 读 入的 两 条 指 令 进 行 译 码 , 并 且 对 这 两 条指 令 作 资 源 冲 突 检 测 , 进 行 数 据 相 关性 和 控 制 相 关 性 分 析 。 如 果 资 源 和 相 关 性 允 许 , IBOX就 把 两 条 指 令 同 时 发射 给 EBOX、 ABOX和 FB

52、OX三 个 指 令执 行 部 件 中 的 两 个 。指 令 流 水 线 采 用 顺 序 发 射 乱 序 完 成 的 控制 方 式 。 在 指 令 Cache中 有 一 个 转 移历 史 表 , 实 现 条 件 转 移 的 动 态 预 测 。在 EBOX内 还 有 多 条 专 用 数 据 通 路 ,可 以 把 运 算 结 果 直 接 送 到 执 行 部 件 。Alpha 21064处 理 机 共 有 三 条 指 令 流 水 线整 数 操 作 流 水 线 和 访 问 存 储 器 流 水 线分 为 7个 流 水 段 , 其 中 , 取 指 令 和 分 析 指 令 为 4个 流 水 段 , 运 算 2

53、个 流 水 段 ,写 结 果 1个 流 水 段 。 浮 点 操 作 流 水 线分 为 10个 流 水 段 , 其 中 , 浮 点 执 行 部件 FBOX的 延 迟 时 间 为 6个 流 水 段 。所 有 指 令 执 行 部 件 EBOX、 IBOX、ABOX和 FBOX中 都 设 置 由 专 用 数 据通 路 。 指 令 Cache( 8KB) 转 移 历 史 表 区 号 指 令 地 址 总 线 EBO X IBO X FBO X 3 4 位 乘 法 器 预 取 器 乘 法 器 / 加 法 器 资 源 冲 突 检 测 加 法 器 移 位 器 P C 计 算 数 据 总 线 逻 辑 单 元 指

54、令 快 表 除 法 器 1 2 8 位 流 水 线 控 制定 点 寄 存 器 堆 ( 3 2 6 4 ) 浮 点 寄 存 器 堆 ( 3 2 6 4 ) ABO X 总 线 接 口 部 外 部 Cache 写 数 缓 冲 器 地 址 发 生 器 数 据 快 表 读 数 缓 冲 器 控 制 件 数 据 Cache( 8KB) 区 号 数 据 Alpha 21064 处 理 机 结 构 除 法 器 析 指 令 为 4个 流 水 段 , 运 算 2个 流 水 段 ,写 结 果 1个 流 水 段 。 浮 点 操 作 流 水 线分 为 10个 流 水 段 , 其 中 , 浮 点 执 行 部件 FBOX的

55、 延 迟 时 间 为 6个 流 水 段 。所 有 指 令 执 行 部 件 EBOX、 IBOX、ABOX和 FBOX中 都 设 置 由 专 用 数 据通 路 。Alpha 21064处 理 机 的 三 条 指 令 流 水 线 的平 均 段 数 为 8段 , 每 个 时 钟 周 期 发 射两 条 指 令 。 因 此 , Alpha 21064处 理 机是 超 标 量 超 流 水 线 处 理 机 。 SWAPIF 取 值SWAP 交 换 双 发 射 指 令 、 转 移 预 测I0 指 令 译 码I1 访 问 通 用 寄 存 器 堆 , 发 射 校 验A1 计 算 周 期 1, IBOX计 算 新

56、的 PC值A2 计 算 周 期 2, 查 指 令 快 表WR 写 整 数 寄 存 器 堆 , 指 令 Cache命 中 检 测17个流水段的整数操作流水线IF I0 I1 A0 A1 WR2 3 4 5 60 SWAPIF 取 值SWAP 交 换 双 发 射 指 令 、 转 移 预 测I0 指 令 译 码I1 访 问 通 用 寄 存 器 堆 , 发 射 校 验AC ABOX计 算 有 效 数 据 地 址TB 查 数 据 快 表HM 写 读 数 缓 冲 栈 , 数 据 Cache命 中 /不 命 中 检 测17个流水段的访问存储器流水线IF I0 I1 AC TB HM2 3 4 5 60 SW

57、APIF 取 值SWAP 交 换 双 发 射 指 令 、 转 移 预 测I0 指 令 译 码I1 访 问 通 用 寄 存 器 堆 , 发 射 校 验F1-F5 浮 点 计 算 流 水 线FWR 写 回 浮 点 寄 存 器 堆110个流水段的浮点操作流水线IF I0 I1 F1 F2 FWR2 3 4 5 60 F3 F4 F57 8 9 5.5.3 超标量超流水线处理机性能指 令 级 并 行 度 为 (m,n)的 超 标 量 超 流 水 线处 理 机 , 连 续 执 行 N条 指 令 所 需 要 的时 间 为 :超 标 量 超 流 水 线 处 理 机 相 对 于 单 流 水 线标 量 处 理 机 的 加 速 比 为 :T m n k N mm n t( , ) ( ) t mnmNk tNknmSSnmS )( )1(),( )1,1(),( 在 理 想 情 况 下 , 超 标 量 超 流 水 线 处 理 机加 速 比 的 最 大 值 为 :S(m, n)MAX m nmNknm NknmnmS )1(),( 本 章 重 点1、指令的重叠执行方式及时空图表示方法2、线性流水线的性能分析及计算3、超标量处理机的指令执行时序及性能4、超流水线处理机的指令执行时序及性能5、超标量超流水线处理机的指令执行时序 及性能 练习题:5.2 5.6 5.7 5.8 5.15

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!