计算机系统结构复习题

上传人:新**** 文档编号:58341747 上传时间:2022-02-27 格式:DOCX 页数:11 大小:447.39KB
收藏 版权申诉 举报 下载
计算机系统结构复习题_第1页
第1页 / 共11页
计算机系统结构复习题_第2页
第2页 / 共11页
计算机系统结构复习题_第3页
第3页 / 共11页
资源描述:

《计算机系统结构复习题》由会员分享,可在线阅读,更多相关《计算机系统结构复习题(11页珍藏版)》请在装配图网上搜索。

1、计算机系统结构复习1、从使用语言角度,可将系统按功能划分为多层次机器级结构,层次结构分别是:应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微程序序机器级。2、各机器级的实现主要靠翻译和解释或两者结合进行。翻译是先用转换程序将高一级机器级上的程序整个地变换成低一级机器级上等效的程序,然后再在低一级机器级上实现的技丕。解释则是在低级机器上用它的一串语句或指令来仿真高级机器上的一条语句或指令的功能,是通过对高级的机器级语言程序中的每条语句或指令逐条解释来实现的技术。3、计算机系统结构在计算机系统机器级层次中指传统机器级的系统结构。4、计算机系统结构研究的是软、硬

2、件之间的功能分配以及对传统机器级界面的确定,提供机器语言、汇编语言程序设计或编译程序生成系统为使其设计或生成的程序能在机器上正确运行应看到的遵循的计算机属性。5、计算机系统结构的属性包括:数据表示、寻址方式、寄存器组织、指令系统、存储系统组织、中断机构、系统机器级的管态和用户态的定义和切换、机器级的I/O结构、系统各部分的信息保护方式和保护机构等属性。6、机器透明性:指相对于每一机器级设计人员,都客观存在的功能或属性看不到的现象,称相对于此级设计人员来说,这此功能或属性是具有透明性,即透明的。7、计算机组成指的是计算机系统结构的逻辑实现,包括机器级内部的数据流和控制流的组成以及逻辑设计等。它着

3、眼于机器级内部各事件的排序方式与控制机构、各部件的功能及各部件间的联系。8、计算机组成设计要解决的问题是在所希望达到的性能和价格下,怎样更好、更合理地把各种设备各部件组织成计算机,来实现所确定的系统结构。9、当前,计算机组成设计也要是围绕提高速度.着重从提高操作的并行度、重叠度.以及功能的分散和设置专用功能部件来进行的。10、计算机组成设计要确定的方面一般应包括:数据通路宽路、专用部件的设置、各种操作对部件的共享程度、功能部件的并行度、控制机构的组成方式、缓冲和排队技术、预估预判技术、可靠性技术等。11、计算机实现指计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,器

4、件、模块、插件、底板的划分与连接,专用器件的设计,微组装技术,信号传输,电源、冷却及整机装配技术等。它着眼于器件技术和微组装技术,其中,器件技术在实现技术中起着主导作用。12、计算机系统结构设计的任务是进行软、硬件的功能分配.确定传统机器级的软、硬件界此13、软、硬件取舍的三个基本原则是:第一个基本原则是应考虑在现有硬、器件(主要是逻辑器件和存储器)条件,系统要有高的性能价格比,主要从实现费用、速度和其他性能要求来综合考虑。第二个基本原则是要考虑到准备采用和可能采用的组成技术,使它尽可能不要过多或不合理地限制各种组成、实现技术的采用。第三个基本原则是从“软”的角度考虑如何为编译和操作系统的实现

5、以及为高级语言程序的设计提供更多更好的硬件支持放在首位。14、程序运行的时间应该是衡量机器时间(速度)性能最可靠的标准。15、计算机性能通常用峰值性能及拉续性能来评价。峰值性能是指在理想情况下计算机系统可获得的最高理论性能值,它不能反映出系统的实际性能。16、持续性能的表示有算术性能平均值、调和性能平均值和几何性能平均值三种。17、算术性能平均是通常对系统执行时间评价;调和性能平均值反映运行全部程序所需的时间成反比,比较准确地衡量计算机的时间(速度)性能;几何性能平均值是对不同机器进行性能比较时,可以对性能采取归一化,即可以以某台机器性能作为参考标准,让其他机器的性能与参考标准去比,不论哪台机

6、器作参考机,几何性能平均值均能正确地反映出结果的一致性。18、计算CPU的程序执行时间Tcpu有3个因素,即程序执行的总指令条数IC、平均每条指令的时钟周期数CPL主时钟频率fc。19、MIPS是指每秒执行多少百万条指令数。它与时钟周期数CPI有关,CPI越少,MIPS就越高,一定程度上反映机器的性能越好。MIPS很大程度依赖于机器的指令系统,用它很难准确衡量指令系统不同的机器之间的性能。因此MIPS只能用于比较相同机器指令系统的计算机之间的性能。即使是同一台机器,程序不同,其CPI也不同,其性能的差异会很大。其次MIPS还与机器硬件有关,如浮点运算部件的机器,虽MIPS很低,但浮点运算速度会

7、很高,而在软件实现浮点运算机器上,MIPS虽然很高,但浮点运算速度可能很低。MFLOPS只能反映机器执行浮点操作的性能,并不能反映机器的整体性能。20、简述Amdahl定理答:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。Told:没有采用改进措施前执行某任务的时间Tnew:采用改进措施后执行某任务的时间Sp:加速比Fe计算机执行某个任务的总时间中可被改进部分的时间所占比例。rnew:改进部分采用改进措施后比没有采用改进措施的性能提高倍数。(部件加速比)21、程序访问的局部性包括时间上和空间上的两个局部性。22、什么是时间上的局部

8、性指最近将来要用到的信息很可能就是现在正在使用的信息,这是因为程序存在着循环。23、什么是空间上的局部性指最近将来要用到的信息很可能与现在正在使用的信息在程序位置上是邻近的,这是因为指令通常是顺序存放、顺序执行的,数据也通常是以向量、阵列、树、表等形式簇聚地存放在一起。24、系统结构的差异决定软件的移植工作量,要实现软件移植工量小,常采用三种方法来实现:统一高级语言、采用系列机、模拟和仿真。25、模拟是指仿真是指B机器的每条机器指令用A机器一段机器语言程序解释,如同A机器上也有B机器的指令系统一样,这种用机器语言程序解释实现软件移植的方法称为模拟.进行模拟的A机器称为宿主机,被模拟的B机器称为

9、虚拟机.用微程序直接解释另一种机器指令系统的方法就称为仿真。进行仿真的机器称为宿主机,被仿真的B机器称为目标机。为仿真所写的解释程序称为仿真微程序。26、多级存储体系的采用是依据局部性原理_原理建立,且存储速度提高,但存储体价格下I27、B机上的每条指令都由A机上的一段微程序解释执行称为仿堇28、计算机系统结构设计的任务是讲行软、硬件的功能分配.确定传统机器级的软、硬件界因。29、衡量浮点操作的指标是MFLOPS,衡量指令执行速度的指标是MIPS。30、指令系统设计的两大典型风格是CISC口RISC31、克服流水中的瓶颈段的两种方法是:瓶颈流水段的细分和瓶颈流水段的重复。32、流水线中出现的3

10、种相关是:结构相关,数据相关,控制相关。33、系统结构的差异决定软件的移植工作量,避免软件移植瓶颈,常采用三种方法来解决,三种方法是统一高级语言、采用系列机、模拟和仿真。34、向量的处理三种方式有:(1)横向处理方法;(2)纵向处理方法;(3)纵横向处理方法。35、处理器间采用单向环网时的互连函数是:PM2+0或PM2-0。36、以硬件为基础实现多Cache一致性方法有:写作废法、写更新法、目录表法。37、编址方式常分为三种,它们是隐含编址,独立编址和统一编址。38、阵列处理机的基本结构分为两种:(1)分布式存储器的阵列机;(2)共享存储器的阵列如39、程序并行性相关性有三种,即数据相关、数据

11、反相关、数据输出相关。40、有两台机器,它们对条件转移指令的处理采用不同的设计方案:(1)CPUA采用一条比较指令来设置相应的条件码,由紧随其后的一条转移指令对此条件码进行测试,以确定是否进行转移。因此实现一次条件转移要执行比较和测试两条指令。(2)CPUB采用比较和测试两种能合在一条指令的方法,这样实现条件转移只需一条指令。假设在这两台机器的指令系统中,执行条件转移指令需2个时钟周期,而其他指令只需1个时钟周期。又假设CPUA中,条件转移指令占总执行指令条数20%。由于每条转移指令都需要一条比较指令,所以比较指令也将占20%。由于CPUB在转移指令中含了比较功能,因此它的时钟周期就比CPUA

12、要慢10%。问CPUA和CPUB哪个工作速度要快些解设CPUA的时钟周期长度为tA,CPUB的时钟周期长度为tBCPIA=X2+X1=TcpuA=AXXtACPUB中由于没有比较指令,转移指令由原来占20%上升为20宗80%=25%它需要2个时钟周期,而其余的75%指令只需1个时钟周期,所以CPIB=X2+X1PUB中由于没有比较指令,因此INB=XNAo又因tB=,所以TcpuB=INBXCPIBXtBNAXX=AXtA可见TcpuAvTcpuB,故CPUA比CPUB运行得更快些。41、假设FPSQFB作占整个测试程序执行时间的20%。改进的一种方法是采用FPSQR硬件,使FPSQFB作的速

13、度加快到10倍。另一种方法是使FP指令的速度提高到2倍,FP指令占整个执行时间的50%。比较两个设计方案。解:分别计算出这两种设计方案所能得到的加速比:To1Tn(1Fe)FeSeSFPSQR(10. 2)0. 21 1.220. 8210SFP10. 5(10.5)10. 751.3342、假设要将某一执行部件改进后速度提高10倍,改进后被改进部件执行时间占系统总运行时间的50%.问改进后,获得的加速比Sp是多少解:假设系统在改进前后的执行时间分别为To和Tn ,则1a = To / Tn = (1-Fe)+Fe/Se由(1)式得Tn = (1-Fe) + Fe/SeXT0根据题意:50%

14、Tn = (FeX To ) /10由(2)式-(1)式得50% Tn = ( 1 - Fe ) X ToFe =10XTne - 2 k由(4)、(5)式可得Sp = To / Tn =(1)(2)(3)(4)(5)43、假设Cache的工作速度是主存的 5倍,且Cache被访问命中的概率为 9。%.问:采用Cache 后,能使整个存储系统获得多高的加速比根据加速比的计算公式,SpTo ld avera geTmainTT R T , R .1 o 1 5 o 91 n ew_ a vera g e 1 ma in miss 1 Ca che、h it1 U. 15 D3.5744、为提高某

15、计算机运算速度,决定增加向量处理部件.此时处理向量的速度比其通常的运算速度要快2o倍.现定义向量处理部件运算的时间占总时间的百分比称为可向量化百分比(1)求出加速比和可向量化百分比之间的关系解;由Amdahl定律知:20(1F)+(F/20)20-19米F(2)若要得到加速比为2,可向量化百分比是多少45、某计算机Cache能存放2ooo条指令.假设1o%的指令承担了9o%时间的指令访问,且知这1o%指令中每条指令的执行时间相同.如果要执行的某程序共5oooo条指令(,且已知其中的1o%是频繁使用的.)问:当计算机执行该程序时,在Cache中能访问到的指令会占多少百分比由题意可知:45ooo条

16、指令承担1o%时间的指令访问,5ooo条指令承担9o%时间的指令访问。显然5ooo条指令被频繁使用,设平均使用次数为X;另外45ooo条指令仅使用一次。则有:45ooo:=5oooX:解得X=81所以该程序执行指令的条数为Y=45000+5000X81=450000假设频繁使用的5000条指令均匀分布于程序之中,即每次调入Cache的2000条指令有200条是频繁使用的。另假设每次调入Cache的2000条指令中的1800条均被使用了一次。所以执行该程序时Cache中能访问到的指令的概率为:(450000-(50000/2000)/450000100%46、数据表示指的是能由机器硬件直接识别和

17、引用的数据类型。47、自定义数据表示包括标志符数据表示和数据描述符两类;48、在指令系统设计、发展和改进上,RISC采用:通过减少指令种数和简化指令功能来降低硬件设计的复杂度,提高指令的执行速度。49、在指令系统设计、发展和改进上,CISC采用:进一步增强原有指令的功能以及设置更为复杂的新指令取代原先由软件子程序完成的功能,实现软件功能的硬化。50、经统计,某机器14条指令的使用频度分别为:,,。分别求出用等长码、啥夫曼码、只有两种码长的扩展操作码等3种编方式的操作码平均码长解:等长码:log214向上取整结果为4,即码长为4哈夫曼编码及扩展操作码编码频度哈夫曼编码OP长度扩展码OP长度频率赫

18、夫曼码位扩展码OP长度000300031010051100150013001310101511010501030103101105110115011301131011151110051003100311110511101511031013111110611110511104110005111111611111514PJ=(+*3+*4+*5+*6=i1即哈夫曼码操作码平均码长为;只有两种码长的扩展操作码:14Pili=*3+*5=i1即只有两种码长的扩展操作码平均码长为51、流水线的表示法有三种:连接图法、时空图法、预约表法。52、定向技术法的基本思想:如果后续指令要使用前面指令的运算果值.则

19、通过硬件专门电路将该运算结果提前传送到有关缓冲寄存器,使后续指令得以不停顿地进入流水线。53、衡量流水线性能的主要指标有:吞叶率、加谏比和效率。54、简述软、硬件取舍的三个基本原则答:第一个基本原则是应考虑在现有硬、器件(主要是逻辑器件和存储器)条件,系统要有高的性能价格比,主要从实现费用、速度和其他性能要求来综合考虑。第二个基本原则是要考虑到准备采用和可能采用的组成技术,使它尽可能不要过多或不合理地限制各种组成、实现技术的采用。第三个基本原则是从“软”的角度考虑如何为编译和操作系统的实现以及为高级语言程序的设计提供更多更好的硬件支持放在首位。55、定向流水技术法的基本思想答:如果后续指令要使

20、用前面指令的运算果值,则通过硬件专门电路将该运算结果提前传送到有关缓冲寄存器,使后续指令得以不停顿地进入流水线。56、将下面程序改写成不存在数据相关的形式Z=0DO10I=1,64X(I)=X(I)+Y(I)Z=Z+X(I)10CONTINUE答:Z=0DO10DO2010 I=1, 64D(I)=X(I)+Y(I)ONTINUE10 I=1, 64Z=Z+D(I)ONTINUE57、 答:简述计算机系统结构、计算机组成和计算机实现的定义和相互关系 计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性。所谓外特性, 就是计算机的概念性结构和功能特性。 计算机组成: 计算机组成

21、是计算机系统结构包括机器内部的数据流的组成以及逻辑设计等。计算机实现: 是指计算机组成的物理实现。包括处理机、主存、等部件的物理结构,器件集成度、速度、信号传输等。相同系统结构, 可以有不同的组成; 一种组成可以有多种不同的实现方法; 采用不同的系统结构会使可以采用的组成技术产生差异;组成也会影响结构。58 、 下列5 条指令组成的程序在一台 3 段流水线处理机上执行, 每一流水段上都有相关检测和分解。这3个流水段是取指令IF、取操作数OF (一个或多个)、执行EX (包括写回)。程序中ACC为累加寄存器,请画时时空图说明:的调度方法。M 为存储器。1),在程序执行中所有可能出现的相关情况,2

22、 )避免相关发生INCMVL STR ADD STAR0 ; R0( R0) +1ACC, R0; R1,ACC;ACC,R0 ;M,ACC ;ACC(ACC)*(R0) R1(ACC) ACC(ACC)+(R0)M(ACC)I1SUBR0, R0 ;R00I2LOADR1,#8;R1 向量长度 8I3Loop:LOADR2,A(R1) ;R2?A 向量的第1 个元素I4MULR2, R1;R2(R2)*(R1)I5ADDR0,R2;R0(R0)+(R2)I6DNER1 Loop;R1(R1)-1,若(R1)0 转向 LoopI7STORE R0,M(x);保存结果每条指令都要经过“取指” 、

23、 “译码”、 “执行” 、 “写结果” 4 个流水段,每个流水段延迟59、在一台流水线处理机上执行下面程序。都是 5ns。 但在 “执行”每个流水段延迟流水段LS部件和ALU部件只能其中一个工作,其中LS部件完成LOAD和STORE耨ALU部件完成其他操作。这两个操作部件的输出端和输入端有直接输出通路相互切换连接,且ALU部件产生的条件码也直接送入控制器。假定采用静态分支预测技术,每次都预测转移不成功。要求:(1)画出指出指令流水线的时空图(中间部分可省略,图中可用指令序号表示)ALU 部件的使用效率。(2)计算流水线的吞吐率和加速比,并分别计算译码部件和解:时空图如下:IDIF13A: TT

24、IDWBIDIF15fBLSIDIF16WBALEIDIFVLALUIDB13IFIDLDVBIF5AI.UinIFlo吞吐率P n3559135- 118.644 106 任务 /秒 59 5 109s加速比SToTk4 t 3559 t2.373 ,EID 1 35 t 14.831% , 4 59 t4 59 t8t 10.593% oEALU解;口)禁止向量为d % 6)冲突向量:用:进制表示,长度是禁止向量的最大距离.冲突向量6(QCsCQjCQ突,由禁止向景5=Gi=C币=1,其余位为。,冲突向量为c-(101010)0(2)画出调度流水线的状态图工)由冲突向电构造将C放到个MYi

25、矍孙右移移位姓,与从嵇位次仃移阳0.川移位器中的世。初始冲突向量做,*按税或*得到一个新的冲完向量.寸移位器移出1.小做任何处理.重复这个小疆.对产生的年一个新的绅突向at做同科处理。在初始冲臾向中和所形成的冲宛向量之间,箭头连j酊Him 101111 / I 当小馨2. * 6倚.53时移出位为1.表示m)这四用功胪离蓟入游后巾; ,任先要就受冲突.不T ) i /地任何处理,当右(M.3、5和大于粤F7亚时,移出也是0,收示用这小0动即图输入新亦料不幺发才叶突.(3)求流水线的最小启动循环和最小启动距离;(4)求平均启动距离最小的恒定循环。(5)按最小启动距离调度任务时,有10个任务进入流

26、水,画出时空图,计算实际吞吐率。61、在一个5段的流水线处理机上需经9拍才能完成一个任务,其预约表为:流水法tot1t2t3t4t5t6t7t8S1VVS2VVS3VVVS4VVS5VV分别写出禁止表,冲突向量C;画出流水线状态转移图,求出最小平均延迟及流水线的最大吞吐率、调度方案。按此流水调度方案输入6个任务,求实际吞吐率。解:1、禁止表F=(8,4,3,1),由禁止表可得出初始冲突向量:Q=(),然后运算最优调度策略是状态有向图:(2,5),流水线的最大吞吐率就是最优调度策略的最大吞吐率,有TPmax=1/1TP =(2)按最优调戊策略策入6个任务.流水线的实际吞叶率和加速比分别为:Q+5

27、+2+5+2+9)225A/S号耳由图327所示时空图可见,8个任务在流水线中确实不发生段争用冲突,6个任务的 执行时间为25A/D由时空图可计算出瘫水线的效率为;E=6*11/5*125=62、向量流水处理的三种方式:1 .横向处理方式,又称为水平处理方式,横向加工方式等。向量计算是按行的方式从 左至右横向地进行。2 .纵向处理方式,又称为垂直处理方式,纵向加工方式等。向量计算是按列的方式自 上而下纵向地进行。3 .纵横处理方式,又称为分组处理方式,纵横向加工方式等。横向处理和纵向处理相 结合的方式。4 3、向量链接技术:结果寄存器可能成为后继指令的操作数寄存器,指令并行执行,这种技术称为两

28、条流水线的链接技术64、实现链接的条件(1)没有向量寄存器冲突和运算部件冲突。(2)只有第一个结果送入向量寄存器的那一个周期可以链接。(3)先行的两条指令产生运算结果的时间必须相等。(4)两条向量指令的向量长度必须相等。65、向量处理机上用 4条向量指令完成如下计算:E:=A*(B+C)+D两条有数据相关的向量LDADDVMULVADDVV0, M(A);V0存储器A向量V3, V1, V2 ; V3V1+V2V4,V0,V3 ;V4V0*V3V6,V4,V5 ;V6V4+V5假设VI、V2、V5向量寄存器已分别存放向量B、C、D,向量长度 N=32,两个浮点功能部件执行时间为加法6拍,乘法7

29、拍;存储器取数6拍;数据进入和流出功能部件(包括寄存器)为1拍。(1)分析指令序列,如果能链接,画出向量链接图。(2)计算指令组全部完成所需的时间。66、PM2I单级网络的互连函数:。67、处理器间采用单向环网时的互连函数是:PM2+0或PM2二0。68、处理器间采用双向环网时的互连函数是:PM2+0和PM2-0。69、以硬件为基础实现多Cache一致性方法有:写作废法、写更新法、目录表法。70、程序并行性相关性有三种,即数据相关、数据反相关、数据输出相关。71、什么是机群系统什么是大规模并行机系统机群(cluster)系统是互相连接的多个独立计算机的集合,这些计算机可以是单机或多处理器系统(

30、PC工作站或SMP),每个结点都有自己的存储器、I/O设备和操作系统。大规模并行机系统是指由成百上千甚至近万个处理器组成的大规模计算机系统。72、静态数据流机与动态数据流机主要区别在哪里答:(1)静态数据流机的数据令牌无标号。动态数据流机的数据令牌有标号;(2)静态数据流任意给定时刻当结点操作时每条弧上只能有一个数据令牌、动态数据流机中,任何一条弧上可出现多个不带目标号的数据令牌;(3)静态数据流机中必须设控制令牌以满足要求,动态数据流机中不必须投控制令牌,因为令牌有识别时间、先后关系的标号;(4)静态数据流机不支持递归的并发激活,只支持一般循环,动态数据流机支持递归的并发激活;(5)静态数据流机不需硬件完成标记的匹配,动态数据流机需要硬件将标记附加在数据令牌上,并完成对标记的匹配工作。73、所有布置的作业题。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!