欢迎来到装配图网! | 帮助中心 装配图网zhuangpeitu.com!
装配图网
ImageVerifierCode 换一换
首页 装配图网 > 资源分类 > DOCX文档下载
 

计算机系统结构实验报告讲解

  • 资源ID:173485389       资源大小:493.28KB        全文页数:24页
  • 资源格式: DOCX        下载积分:20积分
快捷下载 游客一键下载
会员登录下载
微信登录下载
三方登录下载: 微信开放平台登录 支付宝登录   QQ登录   微博登录  
二维码
微信扫一扫登录
下载资源需要20积分
邮箱/手机:
温馨提示:
用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

计算机系统结构实验报告讲解

计算机系统结构实验报告3.1流水线中的相关、实验目的1. 掌握WinDLX模拟器的操作和使用,熟悉DLX指令集结构及其特点;2. 加深对计算机流水线基本概念的理解;3. 进一步了解DLX基本流水线各段的功能以及基本操作;4. 加深对数据相关、结构相关的理解,了解这两类相关对CPU性能的影响;5. 了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂 停。二、实验平台WinDLX模拟器。三、实验内容、步骤及实验结果1. 用WinDLX模拟器执行下列三个程序:求阶乘程序fact.s求最大公倍数程序gcm.s求素数程序prim.s分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情 况,观察CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。结果总结:三种方式:步进的方式是按快捷键F7或者选择菜单栏Execute中的Single Cycle;连续的方式是按快捷键F5或者选择Execute中的Run;设置断点是通过选择window菜单栏中的code,然后在菜单栏中多出一项code 项,选中你想要插入的指令,在多出来的code项中找到set breakpoint,即可插 入断点,然后按F5执行即可。以fact.s为例Pipeline图指出了每个功能段所进行的具体指令,点击指令还可以看到指令的具体相关的其 他方面的内容。addi r1 jO.OxIOOOjsl InputUrisignedmovi2fp f10j1溯 SaveR2(r OJj2sw SaveR4(r OJj4sw SaveRJfr 0)j3Instructions i Cycle时空图更加直观的形式显示出了在某个时间周期某个功能段所执行的具体的指令。网 W1NDLX - Registe. S File PC- IMAR = IR =AHI- B-BHT- HTA-AX.U = ALUHI- FF5R = DMAR- SDR = SDRHI= LDR = LDRHI=Window ExecuteMemoryConfiguration Register7o'-'y1RRRR0H00LIIJLI148 0 hslc U 3 10 9 8 UhOUUUUUUU UxOUUUUUUU OscOOOOOOOO OscOOOOOOOO szOOnnonno szOOnnonno UOUUUUUUUOh00UUOU00 Oh0 0 Li Li 0 0 0 0 UhOUUUUUUU l:lHU U UU U UU Uo O n- n- o o oo oo Doooo oo Doooo oo o ooooo oo Doooo oo Doooo oo o ooooo o n- n- n- n- o H Ho o n- n- o o o-=- -0 12 3 4S6789O1 2 a 4 5 6 7=H-9O.4567991111111111222222222 2 3FFFFFFFFFFFFFFFFFFFFFFFFFFFn- u o o o n- n- n- n- u u o o n- n- n- n- o Register图指出了各个寄存器和存储器的值,如执行完了第一条加法指令之后 R1=OX00001000。St ja-fc isizicsTo t-=«. 1 :b Cycles| executed.ID B:-:©cuted by 4 In st ruction I :e:|.4 Iristructioril/E: currenthr1 in Pipeline.coii f i t i on :M emo ry -izc: 327C0 Bytes _ faddEX G tages: 1. required Cycles: 2 fn-iulE:!j:r£tage5: 1. required Cycles: 5 hdivEX Gtages: 1. required Cycles: 19 Forwdrding ci i-abled.S o. 11。:RAW stills: U 0.005< oJ all Cycles!, thereof:LD stalls: U 0.00% of RAW stallsBranch/Jump stalls: n(ri nn:-:-: of HAW stalls Floadno point: stalls n (n nn>:-: of HAW sballs W" mils:I l:ri nriz-: of all Q.icle:s:l Structural stalls: n (nii本 of -all Cycles Control stalls: 1 (1G.G7S: of all Cycles:) T rap stalls: of all Cucles'l Total: 1 S talla (I 6.67 at all Cpclea)Coiid i t i oii-s. 1 Bx-s.nolies ):Total: 0of all I nstruction®. thereof:t j ken: 0 O-OO of all co nd. Branchese口t taken: U IU.UlJ5i' of all ennd. Br-dncheeJStatistics图指出了指令的相关分析数据,例如,执行了6个cycles,4条指令在流水线中等 相关的总结信息。 UU-S+undBrJ-I/O二空二;* ifjte>3sr ltaIuc 白 Eactarial ° ?20-ndTote102 印 Hb(;EI ewpjfldID diaoliacI by E72 Icrxr硕砰:jinELao-dvare odilI i-?u£-a.t iczi:iwldEX-SIfluw 1.顷蠕 2irid-EX-EigH-: l,.rA4Lifwd 诉虹 为1,. it-jtdCjdEs: 13FoiMfdnD enabled.5t-!5115HAW1 nO.BKd JI DwhA ihfliKlLDJisannrid F5U hX=|Eh占nchiduF口 /血 2 |2LL0Qix d Al*/ Ao-slrg peri sials: G G0lC4% ot RAW stik'lW"顽i: OPWdall顷yi “AWdMg 0 |0叫:寸如国 CtfiiOi :U$: 1。|3 河乏。5 由*$1 口中: 12Hl 而密dElwl K 32 由® £21 m & NU忐iCtonditicEMl Branches J :Trt-st 0 (11nl -J ln?Jn*:Jic<i3|. thflwli:An: 2|DD!id d o>:tid Braidw.,j执行结果图gcm.s、prim.s类似,所以只给出运行的结果图WN>LX- LCI&ckCyde 筋昭由mlExecuteIrsbucbo/brez r3j1 GreeterIF I ID | 桢EH | MEM | WB |sub i2.f2j1j gem Leapsub il.rlseq i3.rl/2brez rS.Re&ullW «'3j1j2brez r3j1 Greyersub i2,r2/1sub H.rl/2I gn-n.Lrapsw PnnNai 归(rQj.nseq t-3.r1 j2bnea r3.ReBj|lsgl r3.ilar2e PnnllVdi.4erO|.rlgcm.s结果图seqiijl.jl际或“bfa(国EMaddidjUCwliidfii1Qd.2aei11.i10j9trr:rlUirs4i国m nif |r e| id I inrex: | mem | wb |- I I口 | kitEX | MEM | WE= |First Nurriter : A 5Feriorid Nunter: 18InMucbans X QKkssm i mi inIF |abnitedPrim.s结果图2. 用WinDLX运行程序structure_d.s,通过模拟找出存在资源相关的指令对 以及导致资源相关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时 钟周期数占总执行周期数的百分比;论述资源相关对CPU性能的影响,讨论解决 资源相关的方法。B Clock Cjcle Piagraalh:r.C:O.':u:|:; i !r . '!' . -'I |11 . I I” . I " .| IJ . :hd_ : :| IF |dLu eJliliiiji.| IF | i | HEX | F H | WEI-iimi.- .:| IF ID,隹虬WB |eddd I0J0J4| IF | I口 下fai(EX|1 | MEH | WB |MddI2J0/2:| IF | SW | ID 匣-汩l闭E:1| MEM | W厂|i2.i2.nxB :IF | SMIi I ID | HEX | £启 | MEhd | WBHdirliS.OxB !I IF I Id I Std |I 购 I$ub母4.丘:| IF | St| ID fh的 MEM | 洲bdKi5,M中 :| IF |克5闭| ID | inlEE | MEH | WB -IrspOkCI;|IF占 bcrlrd结果图资源相关的指令: addd f0,f0,f4addd f2,f0,f2(发生先写后读的数据相关导致消除了资源相关)由图可知是因为只有一个faddEX的运算部件,而它需要两个时钟周期,当第 一条addd指令执行EX段时,第二条指令势必要等一个周期等faddEX部件空闲 了才能够使用。但是,同时由于这两条指令存在先写后读数据相关,暂停一个周 期之后没有了资源相关addd I0,f0,f4:| IF | ID-StallP" faddEX(1 | MEM | V/B |:.- 土.,addd l2.fCiJ2!I IF I Stall | ID |RSWIFmddEX I MEM I WB IInfomation about addd ±2j f Oj f 2addd T2J0J2IFIDAdr.: loop+Oxc Code: 004021004Iermirutecl successfullyFirsl Cpcle: -26Last Cycle: -1 9T 胳I Cycles: 8Cycles: -26(2)Temnirated successfullyIMAFK-PC=1口叩 +0kc旧 <-MemIMAR (=0x04021 004PC<-PC+4 (=loop+0x10)1 Glallfs because of structural Hazard!Cycles: -242)T erminated successfullyA<-D0 =9B<-D2=721 Stall(s because of RAW-Hazard with addd IDJClJAfaddEXflMEMWBCycles: -22(2)Terminated successfullyALU<-A+B (=90A=18, B=72No Stalls: required.Forwarding applicated;A<-OhO (sddd fO,l=OJ4)AHk-Ox40320000 (addd I0J0J4)Cycles: -20(1)T ermirated successfullyNothing to de.Na Stall? required.Cycles: -191)T erminated successfullyD2<-ALU =90Nq Stall? required.单条指令的详细资源冲突图 因为Statistics图中的分析数据没有看见structural stall,但是根据图知道这 个存在addd f2,f0,f2时的资源冲突,大概循环了6次,总共时钟周期是139个, 所以资源相关引起的暂停的时钟周期的个数是6个,暂停时钟周期数占总执行周 期数的百分比为6/139 = 4.3%Efl WJIM OLX - Stat i stiesFil e-A/in cdciw Ete-fulre-a iryCo nfi g u ra*ti o nc sTc-t a. 1 £1 39 Cjcle(s eMec=iJted.ID eMecuted bii QG InfitrueHonfs).2 Instruct io ns"l currently in Pipeline.HmHcdwmzrw conf i g-nr-eit-ion :M erri>- n.i ±ize: 327GB BytesfaddE:=< S(ages: 1 . re-quired Cycles: 2fmi jIE> < S la 1 required Cydta: 5fdiEX-Staoes: 1. required Cycles: 1 9F orv-jardina 巴c昌Ld巴日.S-ta. 1 1/ :RAW stalls: :-:i i 21.5S of all Cycle&L thereof:LD £talk: ID _J3. 23S; eF RAW stalls)Eranch/Jump stalls: 11J (:-:-: 33% of RAW stalls) Floating poirit stalls: 1 (33.33S: of RAA/ atallV-7AV/ stalls: H (I:i in i:顼 mil Cycles:!G trueti iral stalls: I'O.IZID of all CucIes'IControl stalls: 9 (6.47 of mil Cycles)T rap mlM 3 (2.1 GM of all CucleslTotal: 42 Stall(s:l (>:i i 22: ofall Cycles:!Coned i t i :i n a 1 Br-amolies ):T otal: 1 口 1 1 .日白左 tsF 昌II I natructiu-ni. thereof: taken: 9 (90 i h i:5 of all cond- Branchesj i-it takeri: 1 11 Q.CIDS; W all crid. Brarn-:hfcfi)工utm己一.-'!=i t cd are I n_s tme: t i c=tn.s :T mtml: ZO Z3.ZB or ll I nstructlc"nsj= thereor:Loads: 20 ( I . 口F Load-ZGlore-l natruefcions) Stor&s: 0.00 or Load-/Store -IristructlonsF±os tt": 11 n-t st-aige 1_n.etT?u.ct. lone :T otal: 2C (22.2GS; tsf 昌II I natructiu-ni) thereof:Additions: _Z0 I DCLCiD芯 or Floatlrio point stage In st. J M ul tipli catio na: D |:厂1. 口口* of Floating po ir«tinat. |Divisions: .溶 or Floating point mtm口m Inst.)T3251 IDS :T raps: 1 f I _1 GS; of all Inatruotiorifi)Statistics数据分析图资源相关降低CPU性能,并行运算的速度降低,解决资源相关的方法有停顿几个 时钟周期法(针对访存冲突和设备资源冲突(轮流单个使用)或者是增加硬件 设备(解决设备资源冲突)。3. 在不采用定向技术的情况下(去掉Configuration菜单中Enable Forwarding 选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟 周期数以及程序执行的总时钟周期数,计算暂停时钟周期数占总执行周期数的百 分比。在采用定向技术的情况下(勾选Enable Forwarding),用WinDLX再次运行 程序data_d.s。重复上述3中的工作,并计算采用定向技术后性能提高的倍数。1、不定向技术:总时钟周期二202数据相关引起的暂停时钟周期二104暂停时钟周期数占总执行周期数的百分比二51.48%1202 C'JcJhI'sI e:<i=!r:ijFRi-|ID executed by :E:5 In5:tn.iction|'s'|.2 ln$trijcl:inris currency in Pipeline.StaJ 1Ha-r-dvya.re conE igurat ion : Memory size: 32760 Bytes fdddEK-Stages:: 1. required Cycles: 2 fmulEX-Eitages: 1. required Cycles:: 5 fdivEX-Stages: 1_. required Qr'cdes: 19 Furwardirig disabled.L_ 顽/新歹 侦51.43号奇 mil Eynlrs 1 WAW stalls: 00.00% of all Cycles) Structural stalls: 0 0.00 of all Cycles) Control stalls: 9 (4.46 of all Cycles) Trap stalls: 3 1.40 of all Cycles) Total: 116 S tall(s (57.4葵 cf all Cycles)Ccuid i t-i Ona. 1 Br anches ):Total: 1 0 (11.76 of all Instructions thereof: taken: 9 90.OUS: of all cond. Branches not taken: 1 (1 LLLIU: of all co mi E: ranches:)Lcia.d-Store In:st ruet ions :Total: 30 (35.29 of all Instructions thereof:i -I- rr- r-l i i jt-l i. . l. .l:2、定向技术:总时钟周期二128数据相关引起的暂停时钟周期二30暂停时钟周期数占总执行周期数的百分比二23.44%StatisticsTo .-:TKecutedI:iqn(c.t2 In&tructiunljs curreritLf! in Pipeline.-IHs.zr ds.zr e c o n £ it i dm :-M&rrniiPf! size: 327E8 Btes:faddEX S tag es: 1 . required 匚:士1 匚:Ie:m: 2frrnjlE>5=£tage:E:: 1. rGquired CycdE-E:: 5:fdivEX Stages: 1. required Dr'cls®: 1 9-F ur'.-s'arding snbled.l戒 aik:Branch.-'Ui.-irnpi stall®: 1 0 (32.22:t- of R.W.-1'戒mll£|Floating point stalls: 0 (0.00 of RAW stallsWAW 云巨 0匚I.口匚i:M oF Qli Cycles'S trijctural stalls: 0 (U. 0U:-<: oF all 匚:#匚;Im掌Coijl:rnl stalls: 9 7.of dll LyclesT rap stalls: 3 (2.34S: oF oil CyclesTotal: 42 Stall'lXl (32.01 <=: of'all CyclesCoiid i + i oil a. 1 Sr=o.i±d±e3 ):T otal: 10 (1 1 .7C=-o of -sll I ristructiciris. thereof:taken: 9of all corid. Br.richesi _inI: takeij: 1 (1 U.0U:-<: oF all ccirid. Dr.nches |定向技术的加速比=202/128 = 1.578四、心得体会通过使用WinDlX对指令模拟与分析,我们对流水线的执行过程更加熟悉,也对执行时 出现的问题,如资源相关,数据相关等产生原因有了清晰的认识,进一步加深了使我们对流 水线的理解。3.2循环展开及指令调度一、实验目的1. 加深对循环级并行性、指令调度技术、循环展开技术以及寄存器换名技术的 理解;2. 熟悉用指令调度技术来解决流水线中的数据相关的方法;3. 了解循环展开、指令调度等技术对CPU性能的改进。二、实验平台WinDLX模拟器。三、实验内容、步骤及实验结果1. 用指令调度技术解决流水线中的结构相关与数据相关(1) 用DLX汇编语言编写代码文件*.s,程序中应包括数据相关与结构相关(假设:加法、乘法、除法部件各有2个,延迟时间都是3个时钟周期)(2) 通过Co时谊泅姑菜单中的“FZbmimg point stages"选项,把加法、乘法、除法部件的个数设置为2个,把延迟都设置为3个时钟周期;(3) 用WinDLX运行程序。记录程序执行过程中各种相关发生的次数、发生相关的指令组合,以及程序执行的总时钟周期数;(4) 采用指令调度技术对程序进行指令调度,消除相关;(5) 用WinDLX运行调度后的程序,观察程序在流水线中的执行情况,记录程 序执行的总时钟周期数;(6) 根据记录结果,比较调度前和调度后的性能。论述指令调度对于提高CPU 性能的意义。1)代码:divf f2,f5,f6divf f1,f2,f6divf f3,f1,f5divf f0,f4,f7addf f14,f0,f6addf f15,f5,f7multf f20,f4,f6multf f21,f5,f72)设置运算部件个数以及运算时钟周期数EIT!曲 F11汹 r2.jD Q<U球凶iiI F | ID |顿n gdwfBtfiJ?ddtfll侦廊rii.nr?侦 izrs is| IF |1 ID 1R汹|MhExJlI NEM | 诞:|1 l1-0| 1| R 同|-W1J KM IMivEMeI以下为出现的数据相关Pipeline图IDCycles: -1 8(3T erminated successful IpAC-F2 =132B<-F6 (=1282 Stall(s) because of RAW-Hazard withdivff2J5J6| WB| MEM|fdivE(l)I IDR-Stall |先写后读相关由于只有两个除法部件,所以出现了功能部件的冲突。总的执行周期是38指令调度后代码:将无关指令放在一起执行,相关指令分开尽量避免数据相关divf f2,f5,f6multf f20,f4,f6multf f21,f5,f7 divf f1,f2,f6 addf f15,f5,f7 divf f3,f1,f5 divf f0,f4,f7addf f14,f0,f6炒iW.问nasii2lpf1 1j2cMSIEJU5松妲nagFIlQF2JTIJhIIZJSiEI IF I口 |lunaiMJE而 I21J5J7心 I曲I MWFFH 2 Iadd 115,1517曲I fiLH用IKhfrrPipeline图Total:35 Cy cl es =;可口ID executed bj3 Instrucdonfs2 I nstructicin(s currentlij in Pipeline.Ha.r d wcoii£liiro. t i oitl :M emoriJ sizze: 3Z760 BvtesfaddEX-Stages: 7. required Cycles: 3 frrnjIEX-S tages: 2_. required Cc-lef: 3 hdivEX Stages: L!. required Cycles: 3 For',ardina en-bled.Stal Is::RAW stalls: 3 B.57 of all Cclesl. thereof:LD stolls: 0 (O.OO of RAW 3talk<|B rancH.'-Jurnp stolh: LI 0. UUS< of RAW stallsFloating point stalls : (1 Cin nn":-: of FiAW stalls WAW stalls: 0 (0. 00 of all Cycles Structural stalk:: U |JJ. IJU:_=< oF all Cjr'cls&J Control $toll$: 0 (0.00 of oil Cycles Trap stalls: 7 20.00fe of .ll Cycles Total: 1 0 S talla (28.57 of all Cycles)Co n d i 11 oitsl 1 Br ei.tiches ):Tolal. (0. 00% dF all Instructions, thereof: taken: n (n nn;<: of all cond. Branches not taken: D ri.00 of all aarid. BrancHeEStatistics图总执行时钟周期为35个。(6)指令调度后,数据相关减少了,总时钟周期数减少了,效能提高了。调度 前的时钟周期数为38,调度后的时钟周期数减少为35,加速比二38/35= 1.082. 用循环展开、寄存器换名以及指令调度提高性能(1)用DLX汇编语言编写代码文件*.s,程序中包含一个循环次数为4的整数倍 的简单循环;(2)用WinDLX运行该程序。记录执行过程中各种相关发生的次数以及程序执 行的总时钟周期数;(3)将循环展开3次,将4个循环体组成的代码代替原来的循环体,并对程序做 相应的修改。然后对新的循环体进行寄存器换名和指令调度;(4)用WinDLX运行修改后的程序,记录执行过程中各种相关发生的次数以及 程序执行的总时钟周期数;(5)根据记录结果,比较循环展开、指令调度前后的性能。带循环指令代码:求四个1相加的和,结果存在r2中.text.global mainmain:addi r1,r0,#4addi r2,r0,#0Loop:sgt r3,r1,r0bnez r3,Sub1trap 0Sub1:addi r2,r2,#1subi r1,r1,#1j Loop结果:总时钟周期是42个,5 raw stalls,循环了 4次,结果r2 = 4循环展开:代码:.text.global mainmain:addi r1,r0,#4 addir2,r0,#0addir2,r2,#1subir1,r1,#1addir2,r2,#1subir1,r1,#1addir2,r2,#1subir1,r1,#1addir2,r2,#1subir1,r1,#1trap0结果:总时钟周期是15个,0 raw stalls,执行了 4次,结果r2 = 4原因对比:是因为LOOP指令执行完后会有一个nop指令的延迟。四、实验总结a)指令调度技术可以明显的优化指令执行的效率,通过指令调度使得功能部件被尽可 能的充分使用,从而进一步加强指令执行的效率;b)循环在执行时会出现不同循环次数的执行过程中出现相关,导致数量增加,通过寄 存器换名等方法,使得这种相关性数量下降。3.3 Cache性能分析一、实验目的1. 加深对C ache的基本概念、基本组织结构以及基本工作原理的理解;2. 了解Cache的容量、相联度、块大小对Cache性能的影响;3. 掌握降低C ache失效率的各种方法,以及这些方法对Cache性能提高的好 处;4. 理解Cache失效的产生原因以及C ache的三种失效;5. 理解LRU与随机法的基本思想,及它们对Cache性能的影响;二、实验平台SimpleScalar 模拟器。三、实验内容及步骤1.在基本配置情况下运行程序(请指明所选的测试程序),统计Cache总失 效次数、三种不同种类的失效次数;配置好了环境之后,用hello.c生成的a.out文件来进行模拟演示。rooWlocalhost root# cd simplescalarrooWlacalhost simplescalaz . /simplesiiu-S . Q/siin-cache a. outTil.accessesill.hits汩.1 .missesill.replacements .writebacksill.invalidations111.miss_rateill.repl_ratedll.wb_rateill.inv_rate42073749455202LS30.108&.04800.0459total total total total total totaluiunb ex numl) er numb er imml) er nmn'b er nimlj erQ± of of of of ofaccesseshitsreplacementswritebacks invalidationse., misses/ref)miss rate (i replaceirient rate (1 .e . , repls/ref) writeback rate (i . e . , wrbks/ref) invali-datian rate (i . e . , invs/ref)由图可知:Cache的总失效次数为458,容量失效和冲突失效都发生了替换总 共为202,那么强制性冲突就为256。2. 改变Cache容量(*2, *4, *8, *64),运行程序(指明所选的测试程序), 统计各种失效的次数,并分析Cache容量对Cache性能的影响;测试程序为test-math。Cache参数设定举例:-cache:dl1 dll: 2:32:4:r第一个参数为集合数,第二 个参数为块的大小,第三个参数为相联度,最后一个参数为策略。改变集合数, 设定块大小为32B,相联度为4路,采取LRU策略,来考虑容量对cache性能的影 响。*2:设定容量为264:设定容量为64*32*4B时,结果如下:32*4B时,结果如下:dll.accessesdl_.hitsdll.missesdll.replacements dll.writebacksdl"r nnvalidati ons dll .niiss_Tate dll.repl_rate dl<.wb_vate dll.inv_rate57466 罪 total number of accesses5U2U1 3total number of hits7265 # total number of misses7257 # total number of replacements4598 点 total number of writebackstotal mimbernf nnvaln.dations0.1264 洋 miss rate (i.e., itiisses/ref)0.1263 洋 replacement rate (i.e., repls/ref)0.0800 A WTitebark rate (i . e. , wrbks/ref)0.0000 # invalidation rate (i.e., invs/ref)*4:设定容量为4*32*4B时,结果如下:dll.accesses57466 # total number of accessesdll.h_ts53189 弃 total iiuiuber uf liltsdll.misses4277 # total number of rissesdll.replacements4261 # total number of replacementsdll.writebacks2692 弃 total iiuiutier uf wriiebacksdll.invalidations0 # total number of invalidationsdll.miss_rate.0744 # miss rate (i.e. , misses/ref)dll.repl_£ate. 0741 弃 i splacement r,ate (1. e. , repls/LHef)dll.wb_rate.046S # writeback rate (i.e. , wrbks/ref)dll.inv_rate.0000 # invalidation rate (i.e., invs/ref)*8:设定容量为8*32*4B时,结果如下:of accessesof hitsf misses± replacementsof writebacksof invalidations0.0380 # miss rate (1.e . , raisses/ref)0375 # replacement rate (i.e. , repls/ref)0260 祥 writeback rate (i . e. , wrbks/ref)0000 # invalidation rate (i. e., invs/ref)dll.accessesdll.hitsdll.missesdll.replacements dll.writebacks dll.invalidations dl l .,miss-rate dll.repl_rate dll.wb_rate dll.inv_rate57466 # total immbeT35280 弃 total number2186 # total number2154 # total number1493 # total number 并 total numberdll.accessesdll .Tiltsdll.missesdll.replacements dll.writebacks dll.invalidations dll. inlss_rate dll.repl_ratedll. wb_rate dll.inv_rate57466 # 56891 弃 575 # 319 # 307 # 井 0.010 0 弃 0.0056 # CK 00 53 鼻 0.0000 #total total total total total totalnumber number number number number number f Of f off ofaccesses hits misses replacements writebacks invalidationsmiss rate (1.e.B misses/ref) replacement rate (i.e.B repls/ref) writeback rate (1.e.s wrbks/ref) invalidation rate (i.e-P invs/ref)从上面的数据中提取出有用的数据信息,制作下面的表。容量大小总失效率总失效数容量失效和冲 突失效数强制性失效数*20.1264726572578*40.07444277426116*80.03802180215426*640.0100575319256结论:随着cache容量的增大,总失效率减小,总失效数也减少,容量失效和 冲突失效数也减小,但是强制性失效数反而升高。3. 改变Cache的相联度(1路,2路,4路,8路,64路),运行程序(指明所 选的测试程序),统计各种失效的次数,并分析相联度对Cache性能的影响;测试程序为test-printf.参数dl1:2:32:1(2,4,8,64):l,固定其他的参数,只 改变相联度的参数,观察相联度对cache性能的影响。1路:dll.accesses531424# total numberof accessesdll.hits308L40# total numberof hitsdll.misses2232S4# total numberf missesdll.replacements2Z3ZS2弃 total numberat replacementsdll.writebacks83743# total numberof writebacksdll.invalidations# total numberf invalidationsdllrmiss rateD.42O2寿 miss rate (t.e, , inisses/ref')dll.repl_rate0.4202# replacement icate (i.e., repls/ref)dll.wb_rate0.1576# writeback rate (i.e., wrbks/ref)dll.inv_rateo.oaoo# invalidationrate (i.e., invs/ref)2路:dll.accessesdll.hitsdll.missesdll.replacements dll.writebacks dll.invalidations dll.miss_ratedll.repl_rate dll,wb rate dll.inv_ratei ii "1 叩 口Luogoa53142439520813621613G212623300.25630.2563nPii83O.OCOO4路total nunber total nuiibcr total nuiiber total nuiiber total nunber total nunber miss rate (iof accessesof hitaof missesof replacemetitsof writebacksof invalidationse., misses/ref)replacement rate (i.e., repls/ref) writeback rate U . e. , wrbks/ref) invalidation rate (i.e., invs/ref) mni at" ini -F QLLqnoqodll.accesses531424 # total number of accessesdll.hits4776S0 # total nuitiber of hitsdll.nisses53744 # total nuitiber of missesdll.replacements53736 # total number of replacementsdll.writebacks26084 # total number of writebacksdll.invalidations # total number of invalidationsdll.niss_rate0.1011 # miss rate (i.e., misses/ref)dll.yepl_rate0.1011 # replacement rate (i.e., repls/ref)dll.wb_rate0.0491 # wiiteback rate (i.e., wrbks/ref)dll.inv_rate0.0000 # invalidation rate (i.e. , invs/ref)8路:dll.accesses531424 # total number of accessesdll.hits506397 # total number of hitsdll.misses24527 弃 total nuitiber of missesdll.replacements24511 # total number of replacementsdll .writebacks12367 # total number of writebacksdll.invalidations0 # total number of invalidationsdll.miss_rate0.0462 # miss rate (i.e., misses/ref)dll .repl_rateO.O461 # replacement rate (i.e., rcpls/ref)dll.wb_rate0.0233 # writeback rate (i.e., wrbks/ref)dll.inv_rate0.0000 # invalidation rate (i.e., invs/ref)64路:dll.accesses531424 # total number of accessesdll.hits530B21 # total number of hitsdll. jnlsses003 弃 total jiuiEiber of iiiissesdl 1.replacerents47 5 # total nimibev nf repl acementsdll.writebacks420 # total number of writebacksdll.invalidations0 # total number of invalidationsdll.miss_rate0.uuil # niss rate (i.e.H misses/ref)dll.repl_rateD.0009 # replacement rate (i.e., rcpls/ref)dll.wb_rateD.OOO8 # writeback rate (i.e., wrbks/ref)dll.inv_ateD.0300 # invalidation rate (i.e., invs/ref)相联度总失效率总失效数容量失效和冲 突失效数强制性失效数1路0.420222328422328222路0.256313621613621244路0.1011537445373688路0.046224527245111664路0.0011603475128结论:随着相联度的增大,总失效率减小,但减小的幅度减小,总失效数也 减少,容量失效和冲突失效数也减小,但是强制性失效数反而升高。4. 改变Cache块大小(*2, *4, *8, *64),运行程序(指明所选的测试程序), 统计各种失效的次数,并分析Cache块大小对Cache性能的影响;测试程序:test-fmath参数:dl1:64:8(16,32,64):1:l(块大小8B)dll.accessesdll.hits

注意事项

本文(计算机系统结构实验报告讲解)为本站会员(ba****u6)主动上传,装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知装配图网(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!