并行计算机体系结构简介

上传人:ch****o 文档编号:248944970 上传时间:2024-10-26 格式:PPT 页数:38 大小:504KB
收藏 版权申诉 举报 下载
并行计算机体系结构简介_第1页
第1页 / 共38页
并行计算机体系结构简介_第2页
第2页 / 共38页
并行计算机体系结构简介_第3页
第3页 / 共38页
资源描述:

《并行计算机体系结构简介》由会员分享,可在线阅读,更多相关《并行计算机体系结构简介(38页珍藏版)》请在装配图网上搜索。

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第11章 并行计算机体系结构简介,并行技术是针对大型机和巨型机的:,第一种:多处理器(一个处理器指一个单片,CPU,芯片),第二种:多机组成,目前通常把后者并行技术称为并行计算机体系结构。,11.1 并行计算机结构分类,并行计算机系统可以分成两大类:,SIMD,系统和,MIMD,系统。,SIMD,(,Single Instruction Multiple Data,),计算机可以同时在多个数据集上并行执行同一条指令。这种类型计算机包括阵列处理系统和向量处理机。,MIMD,(,Multiple Ins

2、truction Multiple Data,),计算机可以同时执行多条指令并同时处理多数据集,它是目前并行技术的主流。,MIMD,计算机又分成多处理器系统和多计算机系统两大类。如图,11,1,所示。,图,11,1,并行计算机分类,11.2,SIMD,并行计算机,SIMD,计算机:用于解决使用向量和阵列这样比较规整的数据结构的复杂的科学计算和工程计算问题。,这种计算机特点:只有一个控制单元,每次只能执行一条指令,但是每一条指令可同时对多个数据进行操作。,SIMD,分为:阵列处理机和向量处理机。,1.阵列处理机(,array processor),特点:一个单一的控制单元提供信号驱动多个处理单元

3、同时运行,如图,11,2,所示。,组成:,PU,由,1,个处理单元,PE,同它的局部存储器组成。,控制部件方式:向全体,PE,“,播送”控制信号,所有,PE,在同一个总的时钟信号下同步工作。,PE,组成:,可以简单到每个,PE,由,1,位,ALU,组成,也可大到,32,位,ALU,,,或者带浮点计算能力的,ALU,。,图,11,2,阵列处理机组成图,2.向量处理机,SIMD,计算机中另一类是向量处理机(,vector processor)。,70,年代前后,为了处理向量计算研发两种类型的巨型计算机系统:流水线处理机和并行处理机。,两者比较优缺点:并行处理机的结构复杂,成本高,因而流水线处理机发

4、展很快。它是处理向量计算的主要手段,因此已把它称为向量处理机。,向量运算举例,假定有一个向量运算:,D=A(B+C),式中,A,B,C,D,都是长度为,N,的向量。若按常规处理,则流水线不能连续流动。,D1=A1(B1+C1),D2=A2(B2+C2),DN=AN(BN+CN),计算这个向量流水线要反复进行加法和乘法的切换,即流水线功能切换。,如改变处理顺序,先对所有元素执行加法运算(,N,个加法),然后对所有元素执行乘法运算(,N,个乘法),其顺序如下:,B,i,+C,i,D,i,(i,从1到,N),D,i,A,i,D,i,(i,从1到,N),这样就能保证流水线畅通。,Cray,1,的体系结

5、构与后来的,RISC,体系结构类似,它成为了很好的研究范例,许多现代的向量超级计算机都受到它的影响。,图,11,3,Cray,1,体系结构,Cray,1,机采用多功能部件结构,一共有,12,个功能部件,分为,4,组:,3,个向量整数单元部件(加、逻辑、移位),,3,个浮点标量,/,向量浮点单元部件(加、乘、求倒数),,4,个标量整数单元部件(加、逻辑、移位、“,1,”个数计数),,2,个地址功能部件(加、乘)。这些功能部件本身都采取流水线结构,只要不发生寄存器冲突,这些功能部件都能并行工作。,11.3,MIMD,并行计算机,MIMD,系统可以分为多处理器系统和多计算机系统两大类。,多处理器系统

6、特点:所有,CPU,共享同一个物理内存,每个,CPU,不带自己的内存或少量带有,由统一操作系统管理,整个物理内存空间由许多内存模块组成。,多计算机系统特点:每个,CPU,都有自己的内存,即自己独立的物理地址空间;执行自己的操作系统,再加上对外通信的通信处理器。,图,11,4,a,和图,11,4,b,分别说明了多处理器系统与多计算机系统的区别。,多处理器系统特点:软件设计简单,易实现,硬件设计比较复杂。,多计算机系统特点:正好相反。,图,11,4,a,多处理器系统,图,11,4,b,多计算机系统,MIMD并行计算机设计中的互连网络问题,MIMD并行计算机设计中面临的问题之一:互连网络。,多计算机

7、系统中用互连网络把多个计算机连接是显而易见的,多处理器系统同样存在这个问题。,11.3.1,多处理器系统,根据共享内存的实现方式可以把多处理器系统分成三类:,分别是一致性内存访问(,Uniform Memory Access,UMA,),非一致性内存访问(,Non Uniform Memory Access,NUMA,),基于,cache,的内存访问(,Cache Only Memory Access,COMA,),1.,UMA,多处理器系统,UMA,计算机的特点是,CPU,访问所有的内存模块的时间都相同,即读取每个内存字的时间是相等的。访问速度按最慢内存模块为准。程序员不会感觉有速度问题存在

8、,这就是一致的含义。这种一致性可以保证系统的性能可以预测,也有利于程序员编写高效率代码。,如图,11,5,所示,图,11,5,基于总线的多处理器系统,每个,CPU,都带有,Cache,,,当同时操作内存中某一块数据时,会出现,Cache,一致性问题。例如,,CPU1,与,CPU2,同时读取内存中一块数据到自己的,Cache,中,,CPU1,先对,Cache,内容进行了修改,此后,CPU2,读自己,Cache,中数据就已成为旧内容,因为,CPU1,修改自己的,Cache,后还没有写回内存,而,CPU2,读的数据相对,CPU1,来讲是旧数据。解决,Cache,一致性问题有两种方法,一种是监听型的,

9、Cache,(,本书不再详述,请查阅有关书籍),另一种是“,MESI,”,Cache,一致性协议。,MESI,协议是一种比较常用的写回,Cache,一致性协议,它是用协议中用到的四种状态的首字母(,M、E、S、I),来命名的。目前,,Pentium 4,和许多其他的,CPU,都使用了,MESI,协议来监听总线。每个,Cache,项都处于下面四种状态之一:,(1)无效(,Invalid),该,Cache,项包含的数据无效。,(2)共享(,Shared),多个,Cache,中都有这块数据,内存中的数据是最新的。,(3)独占(,Exclusive),没有其他,Cache,包括这块数据,内存中的数据是

10、最新的。,(,4,)修改(,Modified,),该项的数据是有效的,内存中的数据是无效的,而且在其他,Cache,中没有该数据项的拷贝。,2.,NUMA,多处理器系统,NUMA,系统也为所有,CPU,提供单一的地址空间,与,UMA,不同处是靠近,CPU,的内存模块的访问速度比其他的内存模块快得多。,NUMA,计算机的主要特点:,(1)所有的,CPU,都看到一个单一的地址空间。,(2)使用,LOAD,和,STORE,指令访问远程内存。,(,3,)访问远程内存比访问本地内存慢。,NUMA,计算机也存在,Cache,一致性问题,除前面介绍过的,MESI,协议外,还有一个,SCI,(,Scalabl

11、e Coherent Interface,,,可伸缩的一致性接口)的,Cache,一致性协议。,3.,COMA,多处理器系统,在,COMA,系统中,把每个,CPU,的主存看成,Cache,来处理,物理地址空间被划分成,Cache,块,这些块根据需要在系统中来回移动,,Cache,块不再有宿主计算机了。,它要解决的新问题:如何对,Cache,块进行寻址和,Cache,块丢弃了最后一个拷贝怎么办。,COMA,系统号称比,NUMA,有更好的性能,但实际建造的,COMA,系统很少。,11.3.2 多计算机系统,多处理器系统的缺点:规模扩展受到限制,通常百个左右,CPU,规模,同时要用大量硬件实现,它的

12、最大规模是几百个,CPU,以内。,多计算机系统的特点:每个,CPU,都有自己的私有内存,,CPU,不能访问其他,CPU,内存,不能再用,LOAD,和,STORE,指令访问任意内存模块,而要用,send,和,receive,这样的原语相互传递消息。,每个结点通过高性能互连网络连接起来,图,11,6,多计算机系统结构,多计算机系统一般分成两大类:,MPP,和,COW。,1.MPP,大规模并行处理机(,Massively Parallel Processor),这是一种价值数百万到上亿美元的超级计算机系统。,MPP,系统已取代了原有,SIMD,计算机、向量超级计算机和阵列处理机,成为当今大型机、巨型

13、机的主流。,大多数的,MPP,系统都使用标准的,CPU,作为它们的处理器。,大的系统都使用几百片以上的,CPU,集合而成,巨型机使用几千片,CPU。,MPP,有三大特点,第一为它使用了高性能的私用的互连网络,可以在低时延和高带宽的条件下传递消息。,另一特点是它们具有强大的输入输出能力。,第三个特点是如何进行容错。在使用数千个,CPU,的情况下,每星期有若干,CPU,失效是常见的事情。如果,因一个,CPU,失效,而导致运行一天的任务被中止是不能容忍的。,MPP,系统还需要使用大量定制的软件和库。,2.,COW,工作站集群(,Cluster of Workstation),它是另一种多计算机系统,

14、也被称为工作站网络。,COW,系统是由数百台,PC,机或者工作站通过商用网络连接在一起构成的。,COW,系统主要有两种:集中式和分散式,集中式的,COW,是装在一个大机架上的工作站或者,PC,机的集群,这些计算机都是同构的,而且除了网卡和磁盘之外没有其他的外设。这是当今第五代计算机的模型。,11.3.3,集群机系统,Cluster,1.Cluster简介,计算机体系结构的研究就是当时的超级计算机的研究,超级计算机共经历了五代。第一代为早期的单芯片系统,第二代为向量处理系统,第三代为大规模并行处理系统,第四代为共享内存处理系统,第五代为集群系统,目前全球五百强超级计算机排名已经有半数以上是集群式

15、系统。,第三代计算机(,MPP,)与第五代计算机:,相同:(,Cluster,)在体系结构上是同构的,同属于分布式内存处理方式(,DMP,Distributed Memory Processing,),差别:是否采用物美价廉的普通商品组件。,MPP,与,Cluster,从互连角度看,区别在于,MPP,使用专用高性能互连网络,而,Cluster,使用商用网络。从,CPU,角度看,MPP,要用单独设计的高性能处理器,而,Cluster,采用高性能成品处理器,从价格方面看,,MPP,比,Cluster,要贵的多。,集群机系统的主要生命力来自其经济有效性,它采用高性能的普通日用品,IA,芯片、公开系统

16、的主板、免费的公开源码操作系统与并行编程接口,使超级计算机系统的造价告别了天文数字,让具有一般规模的公司都用的起。基于集群机特点,它的规模可大可小。,2.Linux集群的特点,集群机根据采用的,操作系统不同而称为某某集群,例如采用,Linux,就称为,Linux,集群,采用,UNIX,就称为,UNIX,集群。下面介绍,Linux,集群的特点。,Linux,集群可分为三类:,第一类是高可用性集群,运行于两个或多个节点上,目的是在系统出现某些故障的情况下,仍能继续对外提供服务。,第二类是负载均衡集群,目的是提供和节点个数成正比的负载能力,这种集群很适合提供大访问量的,Web,服务。,第三类是超级计算集群,按照计算关联程度的不同,又可以分为两种。一种是任务片方式,要把计算任务分成任务片,再把任务片分配给各节点,在各节点上分别计算后再把结果汇总,生成最终计算结果。另一种是并行计算方式,节点之间在计算过程中大量地交换数据,可以进行具有强耦合关系的计算。,CSM,包含多种组件,使,Linux,群集的管理更加容易:,分布式管理服务器,事件应答资源管理器。,远程硬件控制,配置文件管理,分布式,Shel

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

相关资源

更多
正为您匹配相似的精品文档
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  sobing.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!