计算机系统结构实验报告讲解

上传人:ba****u6 文档编号:173485389 上传时间:2022-12-11 格式:DOCX 页数:24 大小:493.28KB
收藏 版权申诉 举报 下载
计算机系统结构实验报告讲解_第1页
第1页 / 共24页
计算机系统结构实验报告讲解_第2页
第2页 / 共24页
计算机系统结构实验报告讲解_第3页
第3页 / 共24页
资源描述:

《计算机系统结构实验报告讲解》由会员分享,可在线阅读,更多相关《计算机系统结构实验报告讲解(24页珍藏版)》请在装配图网上搜索。

1、计算机系统结构实验报告3.1流水线中的相关、实验目的1. 掌握WinDLX模拟器的操作和使用,熟悉DLX指令集结构及其特点;2. 加深对计算机流水线基本概念的理解;3. 进一步了解DLX基本流水线各段的功能以及基本操作;4. 加深对数据相关、结构相关的理解,了解这两类相关对CPU性能的影响;5. 了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂 停。二、实验平台WinDLX模拟器。三、实验内容、步骤及实验结果1. 用WinDLX模拟器执行下列三个程序:求阶乘程序fact.s求最大公倍数程序gcm.s求素数程序prim.s分别以步进、连续、设置断点的方式运行程序,观察程序在流水

2、线中的执行情 况,观察CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。结果总结:三种方式:步进的方式是按快捷键F7或者选择菜单栏Execute中的Single Cycle;连续的方式是按快捷键F5或者选择Execute中的Run;设置断点是通过选择window菜单栏中的code,然后在菜单栏中多出一项code 项,选中你想要插入的指令,在多出来的code项中找到set breakpoint,即可插 入断点,然后按F5执行即可。以fact.s为例Pipeline图指出了每个功能段所进行的具体指令,点击指令还可以看到指令的具体相关的其 他方面的内容。addi r1 jO.OxIOO

3、Ojsl InputUrisignedmovi2fp f10j1溯 SaveR2(r OJj2sw SaveR4(r OJj4sw SaveRJfr 0)j3Instructions i Cycle时空图更加直观的形式显示出了在某个时间周期某个功能段所执行的具体的指令。网 W1NDLX - Registe. S File PC- IMAR = IR =AHI- B-BHT- HTA-AX.U = ALUHI- FF5R = DMAR- SDR = SDRHI= LDR = LDRHI=Window ExecuteMemoryConfiguration Register7o-y1RRRR0H00

4、LIIJLI148 0 hslc U 3 10 9 8 UhOUUUUUUU UxOUUUUUUU OscOOOOOOOO OscOOOOOOOO szOOnnonno szOOnnonno UOUUUUUUUOh00UUOU00 Oh0 0 Li Li 0 0 0 0 UhOUUUUUUU l:lHU U UU U UU Uo O n- n- o o oo oo Doooo oo Doooo oo o ooooo oo Doooo oo Doooo oo o ooooo o n- n- n- n- o H Ho o n- n- o o o-=- -0 12 3 4S6789O1 2 a 4

5、5 6 7=H-9O.4567991111111111222222222 2 3FFFFFFFFFFFFFFFFFFFFFFFFFFFn- u o o o n- n- n- n- u u o o n- n- n- n- o Register图指出了各个寄存器和存储器的值,如执行完了第一条加法指令之后 R1=OX00001000。St ja-fc isizicsTo t-=. 1 :b Cycles| executed.ID B:-:cuted by 4 In st ruction I :e:|.4 Iristructioril/E: currenthr1 in Pipeline.coii f

6、i t i on :M emo ry -izc: 327C0 Bytes _ faddEX G tages: 1. required Cycles: 2 fn-iulE:!j:rtage5: 1. required Cycles: 5 hdivEX Gtages: 1. required Cycles: 19 Forwdrding ci i-abled.S o. 11。:RAW stills: U 0.005:-: of HAW sballs W mils:I l:ri nriz-: of all Q.icle:s:l Structural stalls: n (nii本 of -all Cy

7、cles Control stalls: 1 (1G.G7S: of all Cycles:) T rap stalls: of all Cuclesl Total: 1 S talla (I 6.67 at all Cpclea)Coiid i t i oii-s. 1 Bx-s.nolies ):Total: 0of all I nstruction. thereof:t j ken: 0 O-OO of all co nd. Branchese口t taken: U IU.UlJ5i of all ennd. Br-dncheeJStatistics图指出了指令的相关分析数据,例如,执行

8、了6个cycles,4条指令在流水线中等 相关的总结信息。 UU-S+undBrJ-I/O二空二;* ifjte3sr ltaIuc 白 Eactarial ?20-ndTote102 印 Hb(;EI ewpjfldID diaoliacI by E72 Icrxr硕砰:jinELao-dvare odilI i-?u-a.t iczi:iwldEX-SIfluw 1.顷蠕 2irid-EX-EigH-: l,.rA4Lifwd 诉虹 为1,. it-jtdCjdEs: 13FoiMfdnD enabled.5t-!5115HAW1 nO.BKd JI DwhA ihfliKlLDJisan

9、nrid F5U hX=|Eh占nchiduF口 /血 2 |2LL0Qix d Al*/ Ao-slrg peri sials: G G0lC4% ot RAW stiklW顽i: OPWdall顷yi “AWdMg 0 |0叫:寸如国 CtfiiOi :U$: 1。|3 河乏。5 由*$1 口中: 12Hl 而密dElwl K 32 由 21 m & NU忐iCtonditicEMl Branches J :Trt-st 0 (11nl -J ln?Jn*:Jic:tid Braidw.,j执行结果图gcm.s、prim.s类似,所以只给出运行的结果图WNLX- LCI&ckCyde 筋昭

10、由mlExecuteIrsbucbo/brez r3j1 GreeterIF I ID | 桢EH | MEM | WB |sub i2.f2j1j gem Leapsub il.rlseq i3.rl/2brez rS.Re&ullW 3j1j2brez r3j1 Greyersub i2,r2/1sub H.rl/2I gn-n.Lrapsw PnnNai 归(rQj.nseq t-3.r1 j2bnea r3.ReBj|lsgl r3.ilar2e PnnllVdi.4erO|.rlgcm.s结果图seqiijl.jl际或“bfa(国EMaddidjUCwliidfii1Qd.2aei1

11、1.i10j9trr:rlUirs4i国m nif |r e| id I inrex: | mem | wb |- I I口 | kitEX | MEM | WE= |First Nurriter : A 5Feriorid Nunter: 18InMucbans X QKkssm i mi inIF |abnitedPrim.s结果图2. 用WinDLX运行程序structure_d.s,通过模拟找出存在资源相关的指令对 以及导致资源相关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时 钟周期数占总执行周期数的百分比;论述资源相关对CPU性能的影响,讨论解决 资源相关的方法。B Clo

12、ck Cjcle Piagraalh:r.C:O.:u:|:; i !r . ! . -I |11 . I I” . I .| IJ . :hd_ : :| IF |dLu eJliliiiji.| IF | i | HEX | F H | WEI-iimi.- .:| IF ID,隹虬WB |eddd I0J0J4| IF | I口 下fai(EX|1 | MEH | WB |MddI2J0/2:| IF | SW | ID 匣-汩l闭E:1| MEM | W厂|i2.i2.nxB :IF | SMIi I ID | HEX | 启 | MEhd | WBHdirliS.OxB !I IF

13、I Id I Std |I 购 I$ub母4.丘:| IF | St| ID fh的 MEM | 洲bdKi5,M中 :| IF |克5闭| ID | inlEE | MEH | WB -IrspOkCI;|IF占 bcrlrd结果图资源相关的指令: addd f0,f0,f4addd f2,f0,f2(发生先写后读的数据相关导致消除了资源相关)由图可知是因为只有一个faddEX的运算部件,而它需要两个时钟周期,当第 一条addd指令执行EX段时,第二条指令势必要等一个周期等faddEX部件空闲 了才能够使用。但是,同时由于这两条指令存在先写后读数据相关,暂停一个周 期之后没有了资源相关add

14、d I0,f0,f4:| IF | ID-StallP faddEX(1 | MEM | V/B |:.- 土.,addd l2.fCiJ2!I IF I Stall | ID |RSWIFmddEX I MEM I WB IInfomation about addd 2j f Oj f 2addd T2J0J2IFIDAdr.: loop+Oxc Code: 004021004Iermirutecl successfullyFirsl Cpcle: -26Last Cycle: -1 9T 胳I Cycles: 8Cycles: -26(2)Temnirated successfullyIM

15、AFK-PC=1口叩 +0kc旧 -MemIMAR (=0x04021 004PC-PC+4 (=loop+0x10)1 Glallfs because of structural Hazard!Cycles: -242)T erminated successfullyA-D0 =9B-D2=721 Stall(s because of RAW-Hazard with addd IDJClJAfaddEXflMEMWBCycles: -22(2)Terminated successfullyALU-A+B (=90A=18, B=72No Stalls: required.Forwarding

16、 applicated;A-OhO (sddd fO,l=OJ4)AHk-Ox40320000 (addd I0J0J4)Cycles: -20(1)T ermirated successfullyNothing to de.Na Stall? required.Cycles: -191)T erminated successfullyD2- n.i ize: 327GB BytesfaddE:= :i i 22: ofall Cycles:!Coned i t i :i n a 1 Br-amolies ):T otal: 1 口 1 1 .日白左 tsF 昌II I natructiu-n

17、i. thereof: taken: 9 (90 i h i:5 of all cond- Branchesj i-it takeri: 1 11 Q.CIDS; W all crid. Brarn-:hfcfi)工utm己一.-!=i t cd are I n_s tme: t i c=tn.s :T mtml: ZO Z3.ZB or ll I nstructlcnsj= thereor:Loads: 20 ( I . 口F Load-ZGlore-l natruefcions) Stor&s: 0.00 or Load-/Store -IristructlonsFos tt: 11 n-

18、t st-aige 1_n.etT?u.ct. lone :T otal: 2C (22.2GS; tsf 昌II I natructiu-ni) thereof:Additions: _Z0 I DCLCiD芯 or Floatlrio point stage In st. J M ul tipli catio na: D |:厂1. 口口* of Floating po irtinat. |Divisions: .溶 or Floating point mtm口m Inst.)T3251 IDS :T raps: 1 f I _1 GS; of all Inatruotiorifi)Sta

19、tistics数据分析图资源相关降低CPU性能,并行运算的速度降低,解决资源相关的方法有停顿几个 时钟周期法(针对访存冲突和设备资源冲突(轮流单个使用)或者是增加硬件 设备(解决设备资源冲突)。3. 在不采用定向技术的情况下(去掉Configuration菜单中Enable Forwarding 选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟 周期数以及程序执行的总时钟周期数,计算暂停时钟周期数占总执行周期数的百 分比。在采用定向技术的情况下(勾选Enable Forwarding),用WinDLX再次运行 程序data_d.s。重复上述3中的工作,并计算

20、采用定向技术后性能提高的倍数。1、不定向技术:总时钟周期二202数据相关引起的暂停时钟周期二104暂停时钟周期数占总执行周期数的百分比二51.48%1202 CJcJhIsI e:5=tage:E:: 1. rGquired CycdE-E:: 5:fdivEX Stages: 1. required Drcls: 1 9-F ur.-sarding snbled.l戒 aik:Branch.-Ui.-irnpi stall: 1 0 (32.22:t- of R.W.-1戒mll|Floating point stalls: 0 (0.00 of RAW stallsWAW 云巨 0匚I.口

21、匚i:M oF Qli CyclesS trijctural stalls: 0 (U. 0U:-: oF all 匚:#匚;Im掌Coijl:rnl stalls: 9 7.of dll LyclesT rap stalls: 3 (2.34S: oF oil CyclesTotal: 42 StalllXl (32.01 =: ofall CyclesCoiid i + i oil a. 1 Sr=o.ide3 ):T otal: 10 (1 1 .7C=-o of -sll I ristructiciris. thereof:taken: 9of all corid. Br.riches

22、i _inI: takeij: 1 (1 U.0U:-: oF all ccirid. Dr.nches |定向技术的加速比=202/128 = 1.578四、心得体会通过使用WinDlX对指令模拟与分析,我们对流水线的执行过程更加熟悉,也对执行时 出现的问题,如资源相关,数据相关等产生原因有了清晰的认识,进一步加深了使我们对流 水线的理解。3.2循环展开及指令调度一、实验目的1. 加深对循环级并行性、指令调度技术、循环展开技术以及寄存器换名技术的 理解;2. 熟悉用指令调度技术来解决流水线中的数据相关的方法;3. 了解循环展开、指令调度等技术对CPU性能的改进。二、实验平台WinDLX模拟器

23、。三、实验内容、步骤及实验结果1. 用指令调度技术解决流水线中的结构相关与数据相关(1) 用DLX汇编语言编写代码文件*.s,程序中应包括数据相关与结构相关(假设:加法、乘法、除法部件各有2个,延迟时间都是3个时钟周期)(2) 通过Co时谊泅姑菜单中的“FZbmimg point stages选项,把加法、乘法、除法部件的个数设置为2个,把延迟都设置为3个时钟周期;(3) 用WinDLX运行程序。记录程序执行过程中各种相关发生的次数、发生相关的指令组合,以及程序执行的总时钟周期数;(4) 采用指令调度技术对程序进行指令调度,消除相关;(5) 用WinDLX运行调度后的程序,观察程序在流水线中的

24、执行情况,记录程 序执行的总时钟周期数;(6) 根据记录结果,比较调度前和调度后的性能。论述指令调度对于提高CPU 性能的意义。1)代码:divf f2,f5,f6divf f1,f2,f6divf f3,f1,f5divf f0,f4,f7addf f14,f0,f6addf f15,f5,f7multf f20,f4,f6multf f21,f5,f72)设置运算部件个数以及运算时钟周期数EIT!曲 F11汹 r2.jD QU球凶iiI F | ID |顿n gdwfBtfiJ?ddtfll侦廊rii.nr?侦 izrs is| IF |1 ID 1R汹|MhExJlI NEM | 诞:|

25、1 l1-0| 1| R 同|-W1J KM IMivEMeI以下为出现的数据相关Pipeline图IDCycles: -1 8(3T erminated successful IpAC-F2 =132B-F6 (=1282 Stall(s) because of RAW-Hazard withdivff2J5J6| WB| MEM|fdivE(l)I IDR-Stall |先写后读相关由于只有两个除法部件,所以出现了功能部件的冲突。总的执行周期是38指令调度后代码:将无关指令放在一起执行,相关指令分开尽量避免数据相关divf f2,f5,f6multf f20,f4,f6multf f21,

26、f5,f7 divf f1,f2,f6 addf f15,f5,f7 divf f3,f1,f5 divf f0,f4,f7addf f14,f0,f6炒iW.问nasii2lpf1 1j2cMSIEJU5松妲nagFIlQF2JTIJhIIZJSiEI IF I口 |lunaiMJE而 I21J5J7心 I曲I MWFFH 2 Iadd 115,1517曲I fiLH用IKhfrrPipeline图Total:35 Cy cl es =;可口ID executed bj3 Instrucdonfs2 I nstructicin(s currentlij in Pipeline.Ha.r d

27、wcoiiliiro. t i oitl :M emoriJ sizze: 3Z760 BvtesfaddEX-Stages: 7. required Cycles: 3 frrnjIEX-S tages: 2_. required Cc-lef: 3 hdivEX Stages: L!. required Cycles: 3 For,ardina en-bled.Stal Is::RAW stalls: 3 B.57 of all Cclesl. thereof:LD stolls: 0 (O.OO of RAW 3talk|B rancH.-Jurnp stolh: LI 0. UUS o

28、f RAW stallsFloating point stalls : (1 Cin nn:-: of FiAW stalls WAW stalls: 0 (0. 00 of all Cycles Structural stalk:: U |JJ. IJU:_= oF all Cjrcls&J Control $toll$: 0 (0.00 of oil Cycles Trap stalls: 7 20.00fe of .ll Cycles Total: 1 0 S talla (28.57 of all Cycles)Co n d i 11 oitsl 1 Br ei.tiches ):To

29、lal. (0. 00% dF all Instructions, thereof: taken: n (n nn;: of all cond. Branches not taken: D ri.00 of all aarid. BrancHeEStatistics图总执行时钟周期为35个。(6)指令调度后,数据相关减少了,总时钟周期数减少了,效能提高了。调度 前的时钟周期数为38,调度后的时钟周期数减少为35,加速比二38/35= 1.082. 用循环展开、寄存器换名以及指令调度提高性能(1)用DLX汇编语言编写代码文件*.s,程序中包含一个循环次数为4的整数倍 的简单循环;(2)用WinD

30、LX运行该程序。记录执行过程中各种相关发生的次数以及程序执 行的总时钟周期数;(3)将循环展开3次,将4个循环体组成的代码代替原来的循环体,并对程序做 相应的修改。然后对新的循环体进行寄存器换名和指令调度;(4)用WinDLX运行修改后的程序,记录执行过程中各种相关发生的次数以及 程序执行的总时钟周期数;(5)根据记录结果,比较循环展开、指令调度前后的性能。带循环指令代码:求四个1相加的和,结果存在r2中.text.global mainmain:addi r1,r0,#4addi r2,r0,#0Loop:sgt r3,r1,r0bnez r3,Sub1trap 0Sub1:addi r2,

31、r2,#1subi r1,r1,#1j Loop结果:总时钟周期是42个,5 raw stalls,循环了 4次,结果r2 = 4循环展开:代码:.text.global mainmain:addi r1,r0,#4 addir2,r0,#0addir2,r2,#1subir1,r1,#1addir2,r2,#1subir1,r1,#1addir2,r2,#1subir1,r1,#1addir2,r2,#1subir1,r1,#1trap0结果:总时钟周期是15个,0 raw stalls,执行了 4次,结果r2 = 4原因对比:是因为LOOP指令执行完后会有一个nop指令的延迟。四、实验总结

32、a)指令调度技术可以明显的优化指令执行的效率,通过指令调度使得功能部件被尽可 能的充分使用,从而进一步加强指令执行的效率;b)循环在执行时会出现不同循环次数的执行过程中出现相关,导致数量增加,通过寄 存器换名等方法,使得这种相关性数量下降。3.3 Cache性能分析一、实验目的1. 加深对C ache的基本概念、基本组织结构以及基本工作原理的理解;2. 了解Cache的容量、相联度、块大小对Cache性能的影响;3. 掌握降低C ache失效率的各种方法,以及这些方法对Cache性能提高的好 处;4. 理解Cache失效的产生原因以及C ache的三种失效;5. 理解LRU与随机法的基本思想,

33、及它们对Cache性能的影响;二、实验平台SimpleScalar 模拟器。三、实验内容及步骤1.在基本配置情况下运行程序(请指明所选的测试程序),统计Cache总失 效次数、三种不同种类的失效次数;配置好了环境之后,用hello.c生成的a.out文件来进行模拟演示。rooWlocalhost root# cd simplescalarrooWlacalhost simplescalaz . /simplesiiu-S . Q/siin-cache a. outTil.accessesill.hits汩.1 .missesill.replacements .writebacksill.inv

34、alidations111.miss_rateill.repl_ratedll.wb_rateill.inv_rate42073749455202LS30.108&.04800.0459total total total total total totaluiunb ex numl) er numb er imml) er nmnb er nimlj erQ of of of of ofaccesseshitsreplacementswritebacks invalidationse., misses/ref)miss rate (i replaceirient rate (1 .e . ,

35、repls/ref) writeback rate (i . e . , wrbks/ref) invali-datian rate (i . e . , invs/ref)由图可知:Cache的总失效次数为458,容量失效和冲突失效都发生了替换总 共为202,那么强制性冲突就为256。2. 改变Cache容量(*2, *4, *8, *64),运行程序(指明所选的测试程序), 统计各种失效的次数,并分析Cache容量对Cache性能的影响;测试程序为test-math。Cache参数设定举例:-cache:dl1 dll: 2:32:4:r第一个参数为集合数,第二 个参数为块的大小,第三个参

36、数为相联度,最后一个参数为策略。改变集合数, 设定块大小为32B,相联度为4路,采取LRU策略,来考虑容量对cache性能的影 响。*2:设定容量为264:设定容量为64*32*4B时,结果如下:32*4B时,结果如下:dll.accessesdl_.hitsdll.missesdll.replacements dll.writebacksdlr nnvalidati ons dll .niiss_Tate dll.repl_rate dl.wb_vate dll.inv_rate57466 罪 total number of accesses5U2U1 3total number of hi

37、ts7265 # total number of misses7257 # total number of replacements4598 点 total number of writebackstotal mimbernf nnvaln.dations0.1264 洋 miss rate (i.e., itiisses/ref)0.1263 洋 replacement rate (i.e., repls/ref)0.0800 A WTitebark rate (i . e. , wrbks/ref)0.0000 # invalidation rate (i.e., invs/ref)*4:

38、设定容量为4*32*4B时,结果如下:dll.accesses57466 # total number of accessesdll.h_ts53189 弃 total iiuiuber uf liltsdll.misses4277 # total number of rissesdll.replacements4261 # total number of replacementsdll.writebacks2692 弃 total iiuiutier uf wriiebacksdll.invalidations0 # total number of invalidationsdll.miss

39、_rate.0744 # miss rate (i.e. , misses/ref)dll.repl_ate. 0741 弃 i splacement r,ate (1. e. , repls/LHef)dll.wb_rate.046S # writeback rate (i.e. , wrbks/ref)dll.inv_rate.0000 # invalidation rate (i.e., invs/ref)*8:设定容量为8*32*4B时,结果如下:of accessesof hitsf misses replacementsof writebacksof invalidations0.

40、0380 # miss rate (1.e . , raisses/ref)0375 # replacement rate (i.e. , repls/ref)0260 祥 writeback rate (i . e. , wrbks/ref)0000 # invalidation rate (i. e., invs/ref)dll.accessesdll.hitsdll.missesdll.replacements dll.writebacks dll.invalidations dl l .,miss-rate dll.repl_rate dll.wb_rate dll.inv_rate5

41、7466 # total immbeT35280 弃 total number2186 # total number2154 # total number1493 # total number 并 total numberdll.accessesdll .Tiltsdll.missesdll.replacements dll.writebacks dll.invalidations dll. inlss_rate dll.repl_ratedll. wb_rate dll.inv_rate57466 # 56891 弃 575 # 319 # 307 # 井 0.010 0 弃 0.0056

42、# CK 00 53 鼻 0.0000 #total total total total total totalnumber number number number number number f Of f off ofaccesses hits misses replacements writebacks invalidationsmiss rate (1.e.B misses/ref) replacement rate (i.e.B repls/ref) writeback rate (1.e.s wrbks/ref) invalidation rate (i.e-P invs/ref)

43、从上面的数据中提取出有用的数据信息,制作下面的表。容量大小总失效率总失效数容量失效和冲 突失效数强制性失效数*20.1264726572578*40.07444277426116*80.03802180215426*640.0100575319256结论:随着cache容量的增大,总失效率减小,总失效数也减少,容量失效和 冲突失效数也减小,但是强制性失效数反而升高。3. 改变Cache的相联度(1路,2路,4路,8路,64路),运行程序(指明所 选的测试程序),统计各种失效的次数,并分析相联度对Cache性能的影响;测试程序为test-printf.参数dl1:2:32:1(2,4,8,64)

44、:l,固定其他的参数,只 改变相联度的参数,观察相联度对cache性能的影响。1路:dll.accesses531424# total numberof accessesdll.hits308L40# total numberof hitsdll.misses2232S4# total numberf missesdll.replacements2Z3ZS2弃 total numberat replacementsdll.writebacks83743# total numberof writebacksdll.invalidations# total numberf invalidation

45、sdllrmiss rateD.42O2寿 miss rate (t.e, , inisses/ref)dll.repl_rate0.4202# replacement icate (i.e., repls/ref)dll.wb_rate0.1576# writeback rate (i.e., wrbks/ref)dll.inv_rateo.oaoo# invalidationrate (i.e., invs/ref)2路:dll.accessesdll.hitsdll.missesdll.replacements dll.writebacks dll.invalidations dll.m

46、iss_ratedll.repl_rate dll,wb rate dll.inv_ratei ii 1 叩 口Luogoa53142439520813621613G212623300.25630.2563nPii83O.OCOO4路total nunber total nuiibcr total nuiiber total nuiiber total nunber total nunber miss rate (iof accessesof hitaof missesof replacemetitsof writebacksof invalidationse., misses/ref)rep

47、lacement rate (i.e., repls/ref) writeback rate U . e. , wrbks/ref) invalidation rate (i.e., invs/ref) mni at ini -F QLLqnoqodll.accesses531424 # total number of accessesdll.hits4776S0 # total nuitiber of hitsdll.nisses53744 # total nuitiber of missesdll.replacements53736 # total number of replacemen

48、tsdll.writebacks26084 # total number of writebacksdll.invalidations # total number of invalidationsdll.niss_rate0.1011 # miss rate (i.e., misses/ref)dll.yepl_rate0.1011 # replacement rate (i.e., repls/ref)dll.wb_rate0.0491 # wiiteback rate (i.e., wrbks/ref)dll.inv_rate0.0000 # invalidation rate (i.e

49、. , invs/ref)8路:dll.accesses531424 # total number of accessesdll.hits506397 # total number of hitsdll.misses24527 弃 total nuitiber of missesdll.replacements24511 # total number of replacementsdll .writebacks12367 # total number of writebacksdll.invalidations0 # total number of invalidationsdll.miss_

50、rate0.0462 # miss rate (i.e., misses/ref)dll .repl_rateO.O461 # replacement rate (i.e., rcpls/ref)dll.wb_rate0.0233 # writeback rate (i.e., wrbks/ref)dll.inv_rate0.0000 # invalidation rate (i.e., invs/ref)64路:dll.accesses531424 # total number of accessesdll.hits530B21 # total number of hitsdll. jnls

51、ses003 弃 total jiuiEiber of iiiissesdl 1.replacerents47 5 # total nimibev nf repl acementsdll.writebacks420 # total number of writebacksdll.invalidations0 # total number of invalidationsdll.miss_rate0.uuil # niss rate (i.e.H misses/ref)dll.repl_rateD.0009 # replacement rate (i.e., rcpls/ref)dll.wb_r

52、ateD.OOO8 # writeback rate (i.e., wrbks/ref)dll.inv_ateD.0300 # invalidation rate (i.e., invs/ref)相联度总失效率总失效数容量失效和冲 突失效数强制性失效数1路0.420222328422328222路0.256313621613621244路0.1011537445373688路0.046224527245111664路0.0011603475128结论:随着相联度的增大,总失效率减小,但减小的幅度减小,总失效数也 减少,容量失效和冲突失效数也减小,但是强制性失效数反而升高。4. 改变Cache块大小(*2, *4, *8, *64),运行程序(指明所选的测试程序), 统计各种失效的次数,并分析Cache块大小对Cache性能的影响;测试程序:test-fmath参数:dl1:64:8(16,32,64):1:l(块大小8B)dll.accessesdll.hits

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!