中大理工学院HPC集群方案

上传人:阳*** 文档编号:117022715 上传时间:2022-07-07 格式:DOC 页数:23 大小:338.50KB
收藏 版权申诉 举报 下载
中大理工学院HPC集群方案_第1页
第1页 / 共23页
中大理工学院HPC集群方案_第2页
第2页 / 共23页
中大理工学院HPC集群方案_第3页
第3页 / 共23页
资源描述:

《中大理工学院HPC集群方案》由会员分享,可在线阅读,更多相关《中大理工学院HPC集群方案(23页珍藏版)》请在装配图网上搜索。

1、中大理工学院HPC集群方案 广州市正特电子科技有限公司GuangZhou RightSpecial Electronic&Technology Co,.Ltd地址:广州市天河路625号1101-1102电话: 87587530传真:网址: 技术:800-830-6850 方案目录一、 公司简介二、 集群系统方案简介2.1集群简介2.2高性能计算机集群简介2.3中山大学物理系理工学院集群系统介绍2.4中山大学物理系理工学院集群软件介绍2.5中山大学物理系理工学院集群硬件介绍三、 ROCKS CLUSTERS集群的建立3.1 ROCKS CLUSTERS的获得3.2 ROCKS CLUSTERS的

2、安装3.3 系统检查四、 集群性能测试4.1 LinPack的介绍4.2 MPBench介绍4.2.1 MPBench测试功能介绍 4.2.2 CacheBench介绍 4.2.3 BLASBench介绍4.3测试结果五、 产品配置和报价六、 售后服务七、 综述一 公司简介因为专业所以信赖广州市正特电子科技有限公司始创于1992年,前身是五舟科技为国内知名的SCSI产品专业供应商。目前正特科技已发展为华南地区知名的服务器和存储解决方案供应商之一,拥有自主品牌的“五舟”服务器和存储产品。同时我们还是Intel 华南区服务器业务核心合作伙伴,Supermicro服务器产品华南及西南区总代,微星服务

3、器产品华南区总代,清华同方服务器中南区核心分销商、清华同方磁盘阵列柜华南区独家分销商,Arena磁盘阵列柜核心代理商,Adaptec中国区核心代理商,Seagate Maxtor授权代理商。我们拥有专业的方案解决能力和技术支持能力,能提供面向不同应用领域的IA服务器硬件方案及大容量数据存储解决方案。我们与业内顶尖的软硬件厂商(如:Supermicro、Intel、MSI、TYAN、Adaptec、LSI Logic、Promise、IBM、Seagate、3Dlabs、ELSA、清华同方等)紧密合作,竭诚为客户提供最优性价比的产品和最专业完善的服务。我们的用户群遍布各行各业,如电信(广州电信、

4、佛山电信)、教育(中山大学、暨南大学、华南师范大学、华工图书馆、荔湾教育局、清远教育局)、电视台(广东电视台、广州电视台、珠海电视台、广州广播电台)、医院(广东医学院附属第二医院、中山二院、湛江市农垦医院)、报社(广州日报社、羊城晚报)、金融(省人民银行、省建行)、邮电(省邮政储汇局、广州中心邮局、茂名邮局)、交通(省交通集团结算中心、广惠公路)、石油(中海油西部)、电力(广电集团)等行业。专业的产品结构正特科技专注于服务器和存储业务,为客户提供最高性价比的服务器和存储整体解决方案。五舟服务器现有两大系列近40款机型,分为基于Intel处理器的5000系列和基于AMD处理器的4000系列,主流

5、机型有1U机架式(5100、5110、1100、4100、4110)、2U机架式(5200、5210、4200、4210)、4U机架式(5410、4400、4410、4350)和塔式(5000、5010、4000、4010),以及最新的双核机型均可在现有机型上升级。还有功能应用型服务器,如防火墙、网络行为管理系统N100;大容量数据存储服务器D208、D212和D216;HPC专用机型510、520、410、420。存储产品有基于DAS、NAS、SAN等不同的技术的产品线,如磁盘阵列柜、基于Lunix技术的NAS、光纤存储网络架构的SAN。阵列柜产品主流有SCSI-SATA、SCSI-SCSI

6、、FC-SATA和FC-FC等型号,应用较广的有SCSI-SATA、SCSI-SCSI,这也是我们构建集群系统的所应用的主流产品,性价比相对较高。二系统方案描述2.1集群简介简单的说,集群(cluster)就是一组计算机,它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点(node)。一个理想的集群是,用户从来不会意识到集群系统底层的节点,在他/她们看来,集群是一个系统,而非多个计算机系统。并且集群系统的管理员可以随意增加和删改集群系统的节点。集群并不是一个全新的概念,其实早在七十年代计算机厂商和研究机构就开始了对集群系统的研究和开发。由于主要用于科学工程计算,所以这些

7、系统并不为大家所熟知。直到Linux集群的出现,集群的概念才得以广为传播。对集群的研究起源于集群系统的良好的性能可扩展性(scalability)。提高CPU主频和总线带宽是最初提供计算机性能的主要手段。但是这一手段对系统性能的提供是有限的。接着人们通过增加CPU个数和内存容量来提高性能,于是出现了向量机、对称多处理机(SMP)等。但是当CPU的个数超过某一阈值,象SMP这些多处理机系统的可扩展性就变得极差。主要瓶颈在于CPU访问内存的带宽并不能随着CPU个数的增加而有效增长。与SMP相反,集群系统的性能随着CPU个数的增加几乎是线性变化的。图1显示了这种情况。图1. 几种计算机系统的可扩展性

8、集群系统的优点并不仅在于此,下面列举了集群系统的主要优点:1. 高可扩展性:如上所述。 2. 高可用性:集群中的一个节点失效,它的任务可以传递给其他节点,可以有效防止单点失效。 3. 高性能:负载平衡集群允许系统同时接入更多的用户。 4. 高性价比:可以采用廉价的符合工业标准的硬件构造高性能的系统。2.2高性能计算机集群简介简单的说,高性能计算(High-Performance Computing)是计算机科学的一个分支,它致力于开发超级计算机,研究并行算法和开发相关软件。高性能计算主要应用于如下两类问题的研究。大规模科学问题,像天气预报、地形分析和生物制药等 存储和处理海量数据,像数据挖掘、

9、图象处理和基因测序顾名思义,高性能集群就是采用集群技术来研究高性能计算。影响高性能计算机系统分类的因素有很多,所以从不同的分类标准得出的高性能集群计算机的系统架构也各不相同。但如果考虑到采用大规模生产的商用计算机和同样是大规模生产的商用LAN及ATM网络来制造的话,主要都是如下两种架构。目前,主流的PC服务器一般含有一到四个处理器,在一个操作系统的控制下,共同存取一个唯一的内存地址空间。各处理器在内存的存取上是平等的,存取代价是相同的。所以这种系统叫做一致内存存取系统,或叫SMP(对称多处理计算机系统)系统。在这个系统中,处理器是以系统总线、交叉开关或其它专有网络与内存连接在一起。SMP系统的

10、最大特点是:一方面,系统架构及共享内存的编程模式的相对简单,所以制造和应用成本很少,为广大中小企业所喜爱。这是我们用于构建集群节点的主要原因。另一方面,它的可拓展性相对较差,一般如果处理器的数量超过四个,那它的制造成本就会变得相当可观。这就制约了它的进一步的发展。但是业界为了弥补这种不足,又推出了另外一种系统分布式内存存取系统。它较之SMP系统的最大特点是没有一个统一的内存空间。这种系统的每一个处理器和它的内存空间构成一个独立的系统,由一个操作系统控制,可以独立运行。在这里我们叫它作节点,这些节点均使用它的网络接口连接到互连网络,并通过网络通信。DM系统具有很多优秀的特点:1、 系统的可拓展性

11、强。拓展成本低,无需使用专用的计算机及定制的网络设备;各个节点可采用通用的LAN或ATM网络连接,技术难度低。2、 可使用成熟通用的LINUX操作系统作为软件平台。3、 大量成熟而各具特色的集群软件,如ROCKSCLUSTERS、OPENMOSIX、OSCAR等。在方案中,我们使用主流的SMP系统作为集群的节点,互连网络也使用类似Myrinet的高速网,我们把这种系统叫作SMP集群。这种集群可以使用MPIOPENMP的混合编程模式。在这种模式下,节点内的处理器利用共享内存进行通信,位于不同的节点的处理器在节点之间利用信息传递机制进行通信。这种混合编程模式充分利用了内存共享和信息传递机制的特点,

12、被公认为是最有效的编程模式。 2.3中山大学物理系理工学院集群系统介绍系统建设背景:中山大学物理系理工学院是集科研教育性质一体的国学教育单位。并于2004年建成了一个40节点的大规模并行计算系统。主要用于以下3个方面的计算:1、 粒子物理及规范场方面的大规模计算。2、 光电材料、凝聚态理论计算。3、 统计物理及大分子生物物理计算等。由于现有系统的计算能力已经越来越不能满足日益增长的教学科研等计算需求,并出于提高单位科研能力的考虑,所以决定对原有系统进行扩充建设。系统建设目标:1、 理论浮点计算能力要求达到192GFlops。2、 交换能力达到1Gbps的以太网络系统。3、 全自动的多主机切换系

13、统(KVM),包括显示系统。4、 基于LINUX的并行操作系统,并安装维护的自动化特性。5、 任用INTEL的MPI及MKL库。系统建设拓扑图:软件系统:基于集群架构的要求,在软件系统方面,我们建议以NPACIROCKSCLUSTER来组建我们的高性能计算集群。ROCKSCLUSTERS是NPACI(美国高级计算基础设施合作委员会)负责研发的,目前最为专业的集群操作系统。它以性能优秀、成熟和稳定的REDHATADVANSCESERVER为基础,按照分布式架构开发。硬件系统:在硬件系统方面,主节点和从节点均采用五舟HPC520R这一专门为HPC应用设计的机型。整个运算过程中,主控节点控制整个系统

14、,负责分派任务,为从节点机提供文件服务和对外的网络连接;同时也是计算节点。整个系统由8个节点,48个处理器核心组成。网络系统:在网络连接方面,鉴于节点间的连接网络是非定制的,为保证系统获得最大的集群性能,我们建议必须采用千兆以太网。同时采用高质量的交换机及双绞电缆,以保证数据交换的低延时和稳定性。辅助系统:另外,为保证系统使用寿命、稳定性和长时间的正常运转,以下几个方面的设备也是须谨慎对待的。首先,供电设施,后备电源和自动发电机组是必然的选择。基于切换时间的考虑,后备电源必须是在线式的;基于整个系统中各用电设备对功率的要求,其功率必须大于总功耗之和;在供电时间方面它必须持续工作至规定的后备发电

15、机组正常供电时间为止。另外,为防止雷电对系统设备造成的损坏,添加后备电源也是一个不错的主意。其次,方案中整体的散热系统的考虑。一方面,机柜的前门及侧板都建议使用蜂窝式设计的产品,有利于冷空气的充分浸入;另一方面,空调的制冷功率也要充分考虑。最后,机房的气温及湿度监测设备以及除湿机的准备。 2.4中山大学物理系理工学院集群软件介绍 基于分布式运算的观点,在此方案中我们推荐使用ROCKS CLUSTERS,一个NPACI(美国高级计算基础设施合作委员会)负责开发的集群系统。ROCKS CLUSTERS以性能优秀、成熟和稳定的REDHATADVANSCESERVER为开发基础,完全按照我们所介绍的S

16、MP集群的分布式架构进行开发。在软件方面也是由FRONTEND(管理节点)加NODE(计算节点)组成。作为业界最出色的集群操作系统,具有相当多的优点: 在系统的安装、维护方面ROCKS CLUSTERS在系统内集成大量的自动化脚本,并由于以REDHATADVANSCESERVER为基础开发的,所以它在安装的时候会自动设置好NFS文件服务器、NIS服务、MPI并行环境及数学函数库,计算节点全部通过PXE网络系统从主节点下载文件并自动完成所有的安装与设置。这里体现的不是一个简单的功能整合,而是融合了开发小组对于软件与硬件方面的优化。ROCKS CLUSTERS对于故障节点的管理思想是,在硬件修复完

17、成后,此节点只需接入集群网络即会自动完成文件的下载与安装,无需人为干预。 计算任务的提交与管理 ROCKS CLUSTERS系统提供了一整套基于WEB的组件用于监控自身的活动及配置状况,如处理器使用数量、内存及交换分区使用情况、网络负载、节点状态和当前计算任务的进展。当然也有第三方厂商为ROCKS开发的任务管理系统如SGE(SUN GRID ENGINE)。 丰富的应用软件ROCKS CLUSTERS的优秀也体现在有强大的第三方的软件支持。首先有来自最球最大的处理器生产商的大力支持,专为CLUSTER高性能计算开发的一系列套件:intel mpi并行环境、intel mkl数学函数库、TOTA

18、LVIEW、MPI DEBUG工具等。其次有性能最为优秀的GOTO数学函数库;最后有大量的科学计算方面的开源软件。所有这些优秀的软件都采用了简单安装方式-用户只会感觉到在一台机器上处理它们。同时由于ROCKS CLUSTERS支持滚动升级的特性,在软件方面,当主节点完成升级后,只在主节点使用相当简单的指令就可以使计算节点在下一次重起后自动完成所有的升级工作;在集群规模扩展方面,所有需要加入的节点只要接入集群网络时打开PXE请求即可完成相关的安装工作;在系统软件方面,软件升级或功能扩展完全可以通过ROLLS或CLUSTER-FORK指令来完成安装,这些工作则由主节点集中完成,系统管理员无需为每一

19、节点的庞大的配置工作而彼于奔命。 庞大的的开发团队 ROCKS CLUSTERS庞大的开发团队包括NPACI自身、San Diego Supercomputer Center,UCSD(加利福尼亚圣迭戈分校超级计算机中心)、Millennium Group at UC Berkeley(位于加利福尼亚伯克利大学的开发团队)、Scalable SystemsPte Ltd in Singapore(新加坡可升级系统有限公司以及OpenSCE in Thailand(泰国开放式可升级集群开发环境)等。2.5中山大学物理系理工学院集群硬件介绍本集群系统中涉及的硬件设备主要有主节点服务器、从节点服务器

20、、千兆网络交换机、阵列柜、机柜等。主节点和从节点服务器建议采用IA架构服务器,可以拥有非常高的性价比。英特尔最新推出的64位双核至强5160处理器,系统外频1333MHz,主频高达3GHz,其理论浮点性达到12GFlops;内存方面采用带奇偶校验功能的INTEL新型串行DDR2667内存(FREEBUFFERDIMM或简称FBD),单机容量最大可支持8-16GB;集成双1000M网络接口,可实现负载均衡或是冗余保护功能;机型采用2U机架式设计,确保机器连续运行时具有很好的散热性能,同时最大限度的利用机柜空间。交换机在集群计算过程中承担着重要的数据交换功能,是集群计算性能的重要影响因素,我们建议

21、采用1000M交换机,可选品牌有华为3Com、Sisco。可选设备:当集群系统有大量计算数据或结果数据需有效保存时,阵列柜是最有效的解决方案,可在主节点服务器上外接一台阵列柜。基于阵列柜数据读写的性能要求,建议采用SCSI-SCSI接口,主机通道为320M/S接口,硬盘同样为320M/S接口,硬盘位可根据数据量的大小选择,一般可选10盘位或是16盘位。三 ROCKS CLUSTERS集群的建立3.1 ROCKS CLUSTERS的获得因为这是NPACI负责开发的一个开源软件,可以在购买了服务器后向广州正特申请。在版本方面,视不同的硬件有i386、X86-64及IA64三个版本;目前总版本号为V

22、ERSION 4.2。3.2ROCKS CLUSTERS的安装ROCKS CLUSTERS给CLUSTER的管理人员提供了一种相当轻松的安装方式。ROCKS CLUSTERS包括了必需的BASE ROLLS、OS DISK1 OS DISK2、SGE及其它数以千计非必需的用于扩展的功能ROLLS。服务器端采用无人值守的安装方式,在完成安装后,计算节点全部通过PXE网络系统从主节点下载文件并自动完成所有的安装与设置。 服务器端的安装:使用BASE ROLLS CD引导系统,在安装过程中可以设置集群系统的基本信息如集群名称、网络参数及分区大小等,而集群并行环境、计算用的数学库等集群系统参数则会通过

23、预先设置优化好的大量的安装脚本自动完成。计算节点的安装:在主节点载入系统后,启动节点安装侦听程序。 计算节点全部通过PXE网络系统从主节点下载文件并自动完成所有的安装与设置。3.3系统安装检查通常我们在安装完一个CLUSTER系统后的工作就是检查是否每一个节点都处于就绪状态。那我们可能以通过指令cluster-fork ps U$USER完成,系统会在当前节点顺序列出每一个节点的节点名称及工作状况。四集群性能测试集群测试主要的任务是对建立后的集群进行一系列的初步测试,以便对我们集群性能有一定的了解。测试主要从几个方面来完成,这就包括:集群浮点运算能力、集群网络带宽、集群网络延迟、集群I/O测试

24、、集群Cache测试等等。我们对集群测试大多使用一些很流行的基准测试软件,这些软件是得到大家公认的。测试包括High Performance Linpack (HPL)与LLCBench(Low Level Architectural Characterization Benchmark Suite)两个方面。4.1LinPack的介绍我们之所以要建立集群,主要原因是我们需要解决大规模的运算,而大多数的运算都可以归结为浮点运算,所以一个集群的浮点运算能力是一个集群性能的主要体现。我们知道在理论上一个集群的理论峰值是我们所有节点运算能力的总和,但是实际上得到峰值却是不可能的。造成这种情况的主要原

25、因有很多,主要的是在网络延迟,主机整体性能和异构平台的不一致性造成的。一般来说比较合理的实际峰值都只有理论峰值的百分之四十到五十左右,而且这样的情况也是在同构的平台下才能得到这样的效果。知道集群理论峰值是不够的,我们还需要得到集群的实际峰值。现在最流行的集群测试软件就是LinPack。由Jack Dongarra编写的Linpack是在高性能计算领域最出名和广泛使用的基准测试。Linpack使用几个线性代数方程,使用高斯消元法在分布式内存计算机上按双精度(64 bits)算法,测量解线性方程的密集系统所需的时间。Linpack的结果按每秒浮点运算次数表示。早在1980年,Linpack的原始版

26、本有大约100100的规模,当这种规模在微处理器的缓冲中容易解决时,此法已经不再使用。为了克服此问题,开发了新的规模更大的Linpack,其名称为High Performance Linpack (HPL)。HPL版Linpack一般用于TOP500超级计算机站上的并列式超级计算机。为了运行HPL,需要MPI和基本线性代数子方程(BLAS)或矢量图形信号处理库(VSIPL)两者之一。HPL可以测试和记录解决问题的时间,在每个HPL问题的解决步骤是相同的,一旦步骤相同只需要知道解决问题的时间就可以很容易的推出运算的能力。HPL的测试值会受到很多因素的影响,但是主要的有两个因素,一是网络的性能,二

27、是平均每个CPU获得的内存大小。(一般针对于SMP来说)HPL与其前辈不同,因为,使用者可以选择矩阵的规模(问题规模)。对于最好的系统性能,目标是使用能与内存匹配的最大的问题规模。为此,推荐接近内存总容量的80%的问题规模。如果问题规模太大,则可能出现(与磁盘的)交换而显著降低性能。使用基准测试一般需要和收集的信息包括:R: 它是系统的最大的理论峰值性能,按GFLOPS表示。如10个Pentium III CPU的Rpeak值。 N: 给出有最高GFLOPS值的矩阵规模或问题规模。正如拇指规则,对于最好的性能,此数一般不高于总内存的80%。 Rmax: 在Nmax规定的问题规模下,达到的最大G

28、FLOPS。 NB: 对于数据分配和计算粒度,HPL使用的块尺度NB。小心选择NB尺度。从数据分配的角度看,最小的NB应是理想的;但太小的NB值也可以限制计算性能。虽然最好值取决于系统的计算/通信性能比,但有代表性的良好块规模是32到256个间隔。4.2 MPBench介绍4.2.1 MPBench主要是测试MPI和PVM消息传模块的效能我们可以从这个测试中获得以下一些信息:1. Bandwidth (BB/second) 带宽2. Gap Time (time to launch a message and continue) (Us) MPI间隔时间3. Roundtrip or 2 *

29、Latency (transactions/second) 往返延迟4. Asynchronous Bidirectional bandwidth (KB/second) 异步双向带宽5. Broadcast (KB/second) 广播速率 6. Allreduce (KB/second) 测试系统最低点7. AlltoAll (KB/second) 全对称带宽在这个程序中又有七个子程式来完成不同的功能,以下我们就介绍以下这七个程式的功能:Bandwidth这个程式主要通过一个timer计数器和不停发送大小不同的包来测试我们的带宽。在程式中使用了多次发送数据的方法来提高测试的可信度,它有两重

30、的循环,外层改变包的大小,内层使用多次发送来完成平均值的计算。Bidirectional Bandwidth这个程式用于点对点的带宽测试。测试两端都使用non-blocking的方式来接收(无阻塞方式)和发送。在下一次重复发送数据之前程序会等待,直到这个循环完成才开始下一次的循环。通过多次的测试和改变包的大小我们就能得到平均数据,以便来反映端到端的带宽性能。Roundtrip 这是一个类似于ping-pong的测试程式。它使用的方法和Bandwidth很类似,唯一不同的是在Roundtrip中slave进程收到消息后不再是发送4个位的数据给master,而是直接把接到的数据回传回去。这种方式很

31、适应于服务器和数据库的应用。Application Latency应用延迟测试和Bandwith很类似,不同的是这里不回复4个位的数据来表示自己接收到了数据,也不象Roundtrip一样发送回原始数据,而是不做任何的反映,这样就测试出发送数据的延迟,也就是应用中发送一个数据包的延迟。Broadcast and Reduce这个程式使用广播的方式来工作。它向每个节点发送一个数据镜像,我们可以通过这个测试了解数据广播包的发送性能All-to-All 使用Broadcast方法来实现每个节点到每个结点之间的传送数据。每次发送包的大小等于包的总大小除以我们MPI进程的个数。测试结果可以反映节点间大量数

32、据分发时的性能。AllReduce这个程式是All-to-All 的一个衍生程式,每个节点都有到其它节点的数据,这样就很容易出现系统的瓶颈。了解这个瓶颈有利于在设计MPI程序时避免这些开销。4.2.2 CacheBench介绍在我们程序当中经常会出现一些需要重复读写的数据,这些数据如果被放置在我们的高速缓存中,程序在读取时就不需要很频繁的去读取内存数据,这样就减少了程序远行的时间。高速缓存的大小对我们的性能是很总要的,所以在这里我们需要对我们的Cache进行一个详细的测试。在LLCBench中它的Cache测试程序叫做CacheBench。它的目标是获得系统的Cache性能的最优参数。并且得到

33、不同编译器开关对我们系统Cache的影响。使用这些参数程序员可以有目的的修改自己的程序,以便能够在不同的环境下使系统的整体性能有所提高。同样的CacheBench也分8个基本的测试,这些测试包括:Cache Read这个程式通过指定的循环来读取不同向量长度的包,以便测试出我们Cache读取数据的带宽。它通过读取Cache中的数据到register中Cache Write这个程式和Read类似,它通过指定的循环写入不同向量长度的包,以便测试我们的Cache写入数据的带宽。它通过把register中数据写入Cache中实现。不同类型的储存子系统对这个测试结果的影响很大。Cache Read/Mod

34、ify/Write这个程式也是反映在不同的循环中我们使用不同向量长度的包读/ 修改/写的数据带宽。在这个程式中会有两次内存的操作,第一次是从memory/cache中读取我们的数据到register中,第二次是将register的数据写入到我们的cache中。Hand tuned Cache Read和CacheRead的使用方法类似,不过我们可以使用编译优化参数。这些参数分别为:1. Degree eight unroling 8等级优化,每个循环使用1个内存元素被使用8个替代2. Dependency analysis 相关性分析,操作中每个元素都是独立的3. Register re-us

35、er 寄存器重用,在任何时刻寄存器都可以重新使用Hand tuned Cache Write和CacheWrite的方法类似,可以使用上述的编译优化参数Hand tuned Cache Read/Modify/Write和Cache Read/Modify/Write类似,可以使用上述的编译优化参数Memset() from C library这是一个C库的标准函数,它用于对内存区域的初始化。这个函数经常被用到,甚至做到了硬件的支持。这个测试主要是得到我们C库中执行Memset()函数的效能。Memcpy() from C library同样的,这是一个内存拷贝的程式,它也是一个标准的库,使用

36、它我们可以获得在内存中做拷贝的效率。这个函数也是经常需要使用的。其中前面的6个测试使用默认的双精度类型的数据作为基本的数据类型数组。当然你也可以改变,你可以在Makefile文件里面修改。4.2.3 BLASBench介绍LLBench中的最后一个测试就是BLASBench,它是一个测试基本线性代数子程序性能的基准测试。数学库直接影响到我们的计算效能,这从上面的章节中已经可以看出。BLAS中提供了基本的向量计算数学方法,其中就有向量与向量,向量与矩阵,矩阵与矩阵。其中矩阵与矩阵已经在上面的LinPach测试中看见了。BLAS提供了标准的API供Fortran或者是C等语言调用。我们测试的目的是

37、估计出BLAS程序的效能,并且再次的分析系统出现瓶颈时Cache的效能。BLASBench有三个主要的测试项目,它们是:AXPY 向量相加评定GEMV 矩阵与向量相乘评定GEMM 矩阵与矩阵相乘评定这些测试都可以选择使用双精度或者是单精度数据类型,这些都可以在Makefile里面定义。BLASBech是使用C语言来调用BLAS(使用Fortran写的)的程序,并且它能够动态的分配我们的内存。首先BLASBech分配足够的内存来解决我们的问题规模,一旦内存分配完成就开始数组的初始化,最后循环的调用BLAS进行计算。在计算的过程中循环次数是动态的,它会根据当前的内存的状况来确定循环的次数。4.3具

38、体的测试结果请参阅正特科技提交的测试报告五产品配置与报价5.1 主节点服务器(五舟HPC-520R)基本性能处理器标配两颗Xeon3.0G处理器,支持双路英特尔Xeon处理器2.83.6Ghz或更高,采用800MHz前端总线,支持EM64T技术(64位内存扩展技术)二级缓存2MB全速二级缓存,集成于CPU内部内存标配2GB双通道DDR2 RECC PC3200内存容量:6个或8个DIMM插槽,支持高达12 /16GB内存寻址空间内存(支持128MB到2GB DIMM;内存必须成对安装)集成双通道内存控制器,支持双路交叉存取模式,数据带宽高达6.4GB/s 类型:72位DDR2 533/400

39、ECC Registered SDRAM,240针DIMM插槽单个DIMM可支持容量:128MB,256MB,512MB,1GB, 2GBECC错误探测功能:修正单位错误,探测双位错误存储控制器集成双通道Ultra320 SCSI控制器, 内建RAID0、1功能;集成双通道IDE控制器集成双通道SATA150控制器, 内建RAID0、1功能RAID控制器可选高性能Ultra320 SCSI RAID卡,实现RAID0/1/5/50等高级RAID应用网络环境集成两个1000M网卡(支持10BASE-T、100BASE-TX和1000BASE-TX,RJ45输出),支持PCI-Express技术提

40、供更高网络带宽图形控制器主板集成ATI Rage XL PCI视频控制器,集成8MB视频内存光盘驱动器52倍速IDE接口CD-ROM软盘驱动器1.44MB 键盘/鼠标(选配)PS/2接口104键盘 PS/2接口 鼠标扩展性能存储扩展性内部存储:最多支持6个1英寸SCSI硬盘,可选热插拔模组外部存储:支持外置存储方式(单机外部扩展磁盘阵列柜或高可用双机模式)I/0扩展槽拥有1个PCI-E、1个PCI-X 64位/133MHz插槽,支持全高、半高扩展卡内部设备接口2个Ultra 320 LVD SCSI接口2个SATA接口2个IDE接口,1个软驱接口外部设备接口2个RJ45网络接口2个USB 接口

41、1个PS/2鼠标接口/1个PS/2键盘接口1个显示接口1个串口1个并口兼容操作系统SCSI配置Microsoft Windows 2000 Server中英文版Microsoft Windows Server 2003系列中英文版Red Hat Linux 8.0/9.0 Red Hat Enterprise Linux 3.0集成SCSI RAID配置(0或1)Microsoft Windows 2000 Server中英文版Microsoft Windows Server 2003系列中英文版Red Hat Linux 8.0/9.0外插SCSI RAID配置(0、1、0+1、5)Micr

42、osoft Windows 2000 Server中英文版Microsoft Windows Server 2003系列中英文版Red Hat Linux 7.3/8.0/9.0 Red Hat Enterprise Linux 3.0管理特性服务器监视CPU温度、电压监测和风扇监测管理软件可选远程服务器管理软件其他特点工作环境温度工作(系统):5C至35C 非工作环境温度-40C至+70C电源电压220V 47-63Hz电源功率480W服务器2U专用电源整机尺寸88.6(高) 445(宽) 640(深)(mm)随机软件五舟服务器驱动软件分别为五舟HPC520非热插拔机型和热插拔机型5.2 从

43、节点服务器(五舟HPC-520R)基本性能处理器标配两颗Xeon3.0G处理器,支持双路英特尔Xeon处理器2.83.6Ghz或更高,采用800MHz前端总线,支持EM64T技术(64位内存扩展技术)二级缓存2MB全速二级缓存,集成于CPU内部内存标配2GB双通道DDR2 RECC PC3200内存容量:6个或8个DIMM插槽,支持高达12 /16GB内存寻址空间内存(支持128MB到2GB DIMM;内存必须成对安装)集成双通道内存控制器,支持双路交叉存取模式,数据带宽高达6.4GB/s 类型:72位DDR2 533/400 ECC Registered SDRAM,240针DIMM插槽单个

44、DIMM可支持容量:128MB,256MB,512MB,1GB, 2GBECC错误探测功能:修正单位错误,探测双位错误存储控制器集成双通道SATA150控制器, 内建RAID0、1功能;集成双通道IDE控制器网络环境集成两个1000M网卡(支持10BASE-T、100BASE-TX和1000BASE-TX,RJ45输出),支持PCI-Express技术提供更高网络带宽图形控制器主板集成ATI Rage XL PCI视频控制器,集成8MB视频内存光盘驱动器可选IDE接口CD-ROM软盘驱动器可选1.44MB 键盘/鼠标(选配)PS/2接口104键盘 PS/2接口 鼠标扩展性能存储扩展性内部存储:

45、最多支持6个1英寸SATA /ATA硬盘外部存储:支持外置存储方式(单机外部扩展磁盘阵列柜或高可用双机模式)I/0扩展槽拥有1个PCI-E插槽1个PCI-X 64位/133MHz插槽,支持全高、半高扩展卡内部设备接口2个SATA接口2个IDE接口,1个软驱接口外部设备接口2个RJ45网络接口2个USB 接口1个PS/2鼠标接口/1个PS/2键盘接口1个显示接口1个串口1个并口兼容操作系统SCSI配置Microsoft Windows 2000 Server中英文版Microsoft Windows Server 2003系列中英文版Red Hat Linux 8.0/9.0 Red Hat E

46、nterprise Linux 3.0集成SCSI RAID配置(0或1)Microsoft Windows 2000 Server中英文版Microsoft Windows Server 2003系列中英文版Red Hat Linux 8.0/9.0外插SCSI RAID配置(0、1、0+1、5)Microsoft Windows 2000 Server中英文版Microsoft Windows Server 2003系列中英文版Red Hat Linux 7.3/8.0/9.0 Red Hat Enterprise Linux 3.0管理特性服务器监视CPU温度、电压监测和风扇监测管理软件

47、可选远程服务器管理软件其他特点工作环境温度工作(系统):5C至35C 非工作环境温度-40C至+70C电源电压220V 47-63Hz电源功率480W服务器2U专用电源整机尺寸88.6(高) 445(宽) 640(深)(mm)随机软件五舟服务器驱动软件五舟HPC510机型参考图片,以实物为准5.3 千兆网络交换机基本资料产品型号华为S1224产品类型以太网交换机硬件规格接口类型10/100M/1000M/RJ45接口数目24口网络与软件VLAN支持不支持VLAN支持网络标准IEEE802.3x,IEEE 802.3,IEEE 802.3u,IEEE 802.3ab网管功能不支持网管功能性能指标

48、传输方式存储转发方式是否支持全双工支持全双工MAC地址表4k物理和环境参数外形尺寸33023043mm电源电压100V-240V AC,50/60Hz最大功率30W5.4 磁盘阵列柜(SCSI-SCSI S10S) 64位 RISC 微处理器 64位SCSI总线 Host and drive 64-bit data path at a burst rate of 540MB/Sec Ultra3 SCSI 传递速率高达320MB/SEC 4个ULTRA320 SCSI 通道 RAID 级别: 0, 1(0+1), 3,5,10 30,50,JBOD (Just a Bunch of Drive

49、s) 支持32M-1G的SDRAM DIMM With ECC 的高速缓存,标准配置为256M高速闪存 模块化的Ultra320 SCSI 通道 支持SAF-TE/S.E.C, S.M.A.R.T , SAN ready 热备用盘后台自动重建数据, 坏盘数据自动重建. 单机容量可达 TB 级,自动 ID 号识别,不需用户设定 硬盘热插拔,可在线更换硬盘,后台自动重建 在线RAID扩展,即在线添加硬盘到RAID中 所有的SCSI/Ultra320通道可配置为主机或硬盘通道 支持并发I/O操作, 命令队列特性,坏扇区重赋值 智能 Read-Ahead/Write-Back 高速缓存 在视窗95/N

50、T环境中有强大且友好的图形管理界面 易于升级的固件快闪存储器 可选备份电池以保护缓存内的数据 可升级至冗余双控 驱动器,电源,风扇,温度控制等有LED指示,蜂鸣器预警 LCD: LCD屏幕显示 10 个80针四级热插拔专用阵列背板(SCA-II),可扩充至30个硬盘, SCSI 线缆: 标准配置80-pin(SCA-II),背板上有源终结器自动选择LVD 或 SE SCSI传输模式 工作温度: 5 to 44° 湿度:10-95% 非凝固状态,海拔: 海平面10,000 Ft 尺寸:17.5(H) x 8.75 (W) x 21.5 (D)型号S10S磁盘阵列CPU64bit RISC

51、 CPUCPU主频400MHZRAID支持基于硬件的RAID010+135103050NRAIDJBODSCSI 接口SCSI Ultra320 LVD通道主机通道12个SCSI Ultra320 LVD通道磁盘通道2 1个SCSI Ultra320 LVD通道数据传输速率320MB/S高速缓存标配256MB1GB(可扩充)单个阵列柜最大支持硬盘数量10个支持最大硬盘数(加扩展柜)30个单个阵列柜(标配)最大存储容量3000GB(300GB/Disk)最大存储容量9000GB(300GB/Disk,加扩展柜)高速缓存标准Read Ahead/Write Back Cache控制器热插拔支持控制

52、器通道扩展支持控制器冗余支持支持控制器数量1个控制器工作模式单控制器工作性能优化方式(随机/顺序)支持故障监视、报警(控制器、硬盘、风扇、电源、温度)有支持S.M.A.R.T功能支持缓存回写支持缓存回写冗余配置冗余电源、冗余风扇、冗余控制器FAX/自动寻呼/监控报警有密码保护有SCSI ID可设定有故障硬盘隔离电路有故障硬盘自动重建有SNMP协议支持(RAID Watch)有RAID在线扩容、扩展和迁移有坏磁道自动指定有热插拔硬盘架10个热插拔电源冗余电源,每个电源400W电源需求400W热插拔风扇2个DB9型RS232接口1个I2C环境监控组件有安全锁有蜂鸣报警器有供电要求100240伏 1

53、1A/5.5A、60/50赫兹工作环境湿度: 10%85%工作温度1050存放温度-4060认证FCC, CE ,UL外型3U机架颜色银灰色体积133(H) * 428 (W) * 552 (D) 重量27.7kg(不含硬盘)参考图片5.5 报价资料产品名称报价(人民币)数量合计(人民币)主节点控制服务器:五舟HPC5202颗Xeon3.0G/2M /2G DDR2 RECC /73G 10K 非热插拔 /2*1000M NIC /52X CD /1.44M /480W /2U机架195001台19500.00从节点服务器:五舟HPC5102颗Xeon3.0G/2M /2G DDR2 RECC

54、 /80G SATA /2*1000M NIC /480W /2U机架165007台115500.00网络交换机:华为S122424口1000M交换机98001台9800.00机柜 YG188942 (42U)28001套2400.00其它耗材500若干500.00系统设备总额147700六产品的售后服务6.1服务方式及说明1、上门服务指在广州地区内,自服务器、存储阵列及其它产品售出之日起,提供一年以内免费上门服务:1)我公司提供上门服务的时间:星期一至星期五,上午9:00下午18:00 (法定假日除外); 2)我们只提供与本系统故障相关的上门服务,其它故障不在此服务范围之内;3)上门服务人员

55、如果遇到特殊情况不能当场解决故障,在得到您的同意后,服务人员将机器带回我司客服中心维修,维修好后无偿将机器送回。2、送修服务1)送修服务范围:购买时间超过一年以上的五舟服务器、存储产品及其它产品,和提供免费上门服务地区以外的客户所购买的产品。2)维修时客户自行或通过货运公司将故障机(或故障部件)送到我司客服中心,修复后客户自行取回。3)保修期内能简单安装的部件(包括热拔插硬盘、热拔插电源、显示器、键盘、鼠标、终结器等),我司提供选择发货更换的方式维修,并提供相应的电话安装指导。3、电话咨询服务客户遇到与服务器运行相关的技术问题,可拔打我们的免费热线800-830-6850,未开通800服务的地

56、区或手机用户请拔打客户服务中心电话。服务说明:1)提供操作系统安装的相关技术咨询;2)提供硬件安装和升级相关的技术咨询;3)提供硬、软件兼容性相关的技术咨询。4、在线技术服务 除了电话咨询、硬件保修、上门服务等传统的服务方式外,我们还为您提供了更为方便和完备的在线服务。您只需上网连接到公司主页就可以了解到我司的产品信息、销售支持和服务信息等,您也可以通过网络向我们的专业人员寻求技术支持。 5、有偿服务收费标准免费上门服务期后,如需要工程师到现场提供服务,差旅费用由项目承包商或用户负担(住宿标准不低于200元/天),另每次收取服务费人民币1000.00元。 或是每年购买一年的售后服务,服务费用按

57、该方案的公开报价的5%计算(含硬件成本费和工程师售后服务费)。6、服务的响应和确认1)上门服务:提供免费上门服务的地区,自接到服务请求后4小时内到达现场;非免费服务区域以外的地区将视路程、交通状况及其实可能影响之因素,与客户协商确定时间;2)电话和在线服务:自确认有保修义务时起,2小时内回应,4小时内给出解决方案;3)上门服务的确认:在上门服务之后,服务工程师会主动向您提供签收证明,以确认您对本次服务的满意度。7、培训正特科技在提供现场服务的同时,为用户培训技术人员,同时配合项目承包商完成对用户工程师的综合培训, 使用户技术人员具备系统维护的能力。8、特别提示用户应对其专有的机密信息和数据的安

58、全自行负责。请您及时对您认为重要的数据自行做好备份,以防止丢失或改动文件、数据或程序,正特科技不负责保留机器上的数据,不负责赔偿任何因数据丢失导致的损失。6.2服务器、交换机保修说明配件类别配件名称保修说明备注一类CPU、内存、主板、SCSI卡、SCSI阵列卡、SCSI硬盘、专业显卡、电源三年保修1 此承诺只针对在保修期内正常使用时出现硬件故障的情况。 2 此承诺仅适用于五舟服务器及其部件、网络交换机、阵列柜的保修。3 五舟服务器硬件部件自购买之日起,在保修期内正常使用发生故障,我公司将选择编修或更换确有故障或缺陷的部件。更换的部件可能是同型号品,也可能是性能上等同于原型号的部件。4 更换后的

59、故障部件归我公司所有。5 如由于数据安全等原因,客户无法提供故障部件,则客户须购买替换部件。二类IDE扩展卡/ 阵列卡、IDE/ SATA硬盘、普通显卡、声卡、网卡、SCSI背板、SCSI终结器、光驱、软驱、风扇一年保修三类机箱及其附件、IDE/SCSI数据线、随机附件(包装材料、随机驱动光、软盘、电源线等)不在保修范围内四类维修更换的部件经我公司服务机构维修后的机器(部件)保修期限按原机器(部件)保修期限计算五类磁盘阵列柜核心部件保修三年六类网络交换机保修一年七类其他未列出部件咨询正特科技客户服务中心说明:保修期自客户购机之日起开始计算,以产品的保修标签及有效保修卡为凭证,若客户无法提供以上

60、证明,则通过五舟服务器客户服务中心客户数据库中该机器的主机序列号(S/N)来判断。6.3服务机构广州:广州市正特电子科技有限公司客户服务中心地址:广州市天河路625号天河娱乐广场东座1101室电话:0208757494287587520东莞:广州市正特电子科技有限公司东莞客服中心 地址:东莞市旗峰路168号金峰堡青松阁1204室电话:076922深圳:深圳市正谊电子技术有限公司客户服务中心地址:深圳市深南中路电子科技大厦A座1401室电话:075583780038上海:上海市正之特电子科技有限公司客户服务中心地址:上海市徐家汇华山路2088号汇银广场2001室电话:0211644817326.4免除保修义务请留意以下内容,对于因下列原因导致的服务器故障,我公司不承担免费保修义务: 1、因运输造成的损坏(请通过经销商与保险公司或运输部门联系解决);2、任何擅自拆机,改、扩硬件和使用非我公司指定的配件,以及非正常操作所造成机器的任何损坏; 3、客户擅自拆开配件所造成的配件损坏或机器故障;4、由于火灾、洪水、雷电、地震或其它不可抗力事件引起的机器故障或部件损坏;5、服务器在非产品规定的工

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!