FLUENT 软件的多重网格并行算法及其性能

上传人:红** 文档编号:168220103 上传时间:2022-11-08 格式:PDF 页数:6 大小:328.80KB
收藏 版权申诉 举报 下载
FLUENT 软件的多重网格并行算法及其性能_第1页
第1页 / 共6页
FLUENT 软件的多重网格并行算法及其性能_第2页
第2页 / 共6页
FLUENT 软件的多重网格并行算法及其性能_第3页
第3页 / 共6页
资源描述:

《FLUENT 软件的多重网格并行算法及其性能》由会员分享,可在线阅读,更多相关《FLUENT 软件的多重网格并行算法及其性能(6页珍藏版)》请在装配图网上搜索。

1、2005 Fluent 中国用户大会论文集 251 FLUENT 软件的多重网格并行算法及其性能 余江洪1,朱宗柏1,2,肖金生1,3(1武汉理工大学材料复合新技术国家重点实验室,2现代教育技术中心,3汽车工程学院,湖北 430070)摘 要:FLUENT 软件是目前国际上比较流行的通用 CFD 软件包,用于模拟从不可压缩到高度可压缩范围内的复杂流动,对大规模问题可用并行多重网格方法进行求解。为了找出 FLUENT 软件的最佳解题规模和并行粒度,以期最大限度地发挥软件和硬件的效能,对 FLUENT 软件采用的多重网格方法和区域分裂法进行了理论分析,通过反复实验,重点讨论了在并行求解过程中,采用

2、不同的多重网格循环方法、区域网格分裂方法、解题的规模和计算节点数对并行性能的影响。FLUENT 软件有良好的并行性能,PEM Fuel Cell 模块可以进一步优化,HPCC 还有很大的升级空间。关键词:燃料电池;多重网格;区域分裂;并行计算;FLUENT FLUENT 软件是一种 CFD(Computational Fluid Dynamics)求解器,它可以求解各种复杂流动,包括不可压缩流动(低亚音速)、弱可压流动(跨音速)和强压缩性问题(超音速)。1由于 FLUENT 软件有多种求解方法的选择,并且提供了多重网格方法来加快收敛速度,同时可以进行并行计算,因此它可以为速度范围很广的流动问题

3、提供高效准确的最优求解方案。本文介绍了 FLUENT 软件的多重网格及并行算法,并测试、分析了其并行性能。1 FLUENT 软件中的多重网格方法 多重网格方法(MGM:MultiGrid Method)是一种高效的串行数值计算方法。其基本思想是,利用粗网格上的残差校正特性消除迭代误差的低频分量(长波分量,即光滑误差),同时利用细网格上的松驰光滑特性消除迭代误差的高频部分(短波分量,即振荡误差),套迭代技术负责通过限制和插值算子连接所有网格层共同求解同一问题1234。多重网格循环可以定义为在每一个网格层面通过网格层次时在网格层面内应用的递归程序,该程序通过在当前层面完成单一网格循环来扩展到下一个

4、粗糙网格层面。FLUENT 软件中有四种多重网格循环:V、W、F 以及灵活(Flexible)循环。V 和 W 循环可以用在代数多重网格(AMG:Algebraic MultiGrid)和全近似存储(FAS:Full-Approximation Storage)多重网格中,F 和灵活循环只限用于 AMG 方法。V 循环如图 1(a)所示,它包括:预松弛(1)限制V 循环插值后松弛(3)W 循环如图 1(b)所示,它包括:预松弛(1)限制W 循环W 循环插值后松弛(3)F 循环则是用 W 循环之后进行 V 循环来构成:余江洪(1977),男,湖北潜江人,武汉理工大学材料科学与工程学院硕士研究生湖

5、北省自然科学基金项目(2003ABA088),教育部博士点基金项目(20030497012)资助。2005 Fluent 中国用户大会论文集 252预松弛(1)限制W 循环V 循环插值后松弛(3)对于 V 和 W 循环,各个层面的转换由三个参数控制:1、2和 3。1(有时称为预松弛扫描)用于指定在当前网格层面进行预松弛迭代的步数(在图 1 中用圆形表示),以减少误差(当地误差)的高频部分,在 AMG 方法中 1的默认值是 0(即:没有预松弛);2用于指定多重网格循环的类型,取值 1 和 2 分别对应 V 循环和 W 循环多重网格,可以减少粗网格的误差(在图 1 中用四边形表示);3(后松弛扫描

6、)用于指定进行后松弛迭代的步数(在图 1 中用三角形表示),以减少在多重网格循环中产生的高频误差,在 AMG 方法中 3的默认值是 1,在 FAS 方法中 3的默认值是 0。Flexible 循环使用粗化网格的计算由逻辑控制多重网格程序来实现。这一逻辑控制可以保证当前层面的网格的残差减小速度足够慢时就会调用较粗糙网格的计算。在当前粗糙网格层上的校正迭代解充分收敛而且因此应该转到下一层精细网格时,多重网格控制会做出适当的处理。Flexible 循环和 V、W 循环之间的主要区别是:Flexible 循环会通过残差减小的公差和终止判据的满足情况,来确定什么时候按什么样的频率来处理每一层网格,而 V

7、 和 W 循环则明确定义了各个层面之间的转换模式。(a)V 循环 (b)W 循环 图 1 多重网格循环 2 FLUENT 软件中的并行算法 FLUENT软件的并行计算就是利用多个计算节点(处理器)同时进行计算。并行计算可将网格分割成多个子域,子域的数量是计算节点的整数倍(如8个子域可对应于1、2、4、8个计算节点)。每个子域(或子域的集合)就会“居住”在不同的计算节点上。除支持单机多CPU的并行计算外,FLUENT还支持网络分布式并行计算。FLUENT软件内置了MPI(Message Passing Interface)并行机制,大幅提高了网络分布式并行计算的并行性能。在用 FLUENT 软件

8、的并行求解器时,需要将网格细分割为几组单元,以便在分离处理器上求解。分割网格,需要选择生成网格的分割方法、设置分割数、选择区域和记录、以及所2005 Fluent 中国用户大会论文集 253使用的优化方法等。并行程序的网格分割有三个主要目标:生成等数量单元的网格分割;使分割的接触面数最小(减小分割边界面积);使分割的邻域数最小。FLUENT 软件里的分割格式是采用两分的原则来进行的,但不象其他格式那样需要分割数,它对分割数没有限制,对每个处理器都可以产生相同分割数(也就是分割总数是处理器数量的倍数)。FLUENT 软件提供了多种方法进行网格分割。最有效的分割方法和求解的问题有关,可试用不同的方

9、法,直至某一个适合所求解问题。并行计算的性能可以用加速比来表示,计算加速比的一般方法是:假设在一个处理器上运行一个程序,令 T1为执行时间,然后在有 P 个节点的并行机(各节点的 CPU 与串行机中的CPU 一样)上运行同样的程序,令 TP为执行时间,则加速比 S=T1/TP,并行效率=S/P5。3 多重网格并行性能测试 3.1 测试环境 硬件环境:高性能计算机集群(HPCC:High Performance Computer Cluster),主节点是DELL POWEREDGE_2650,配置了 1 个 Intel Xeon 2.8GHz/533MHz FSB 的 CPU、2G/DDR26

10、6的内存,集成千兆网卡,584G 的 SCSI 硬盘,计算节点是 DELL POWEREDGE_1750,各配置了 2 个 Intel Xeon 2.8GHz/533MHz FSB 的 CPU,2G/DDR266 的内存,集成千兆网卡,73G 的SCSI 硬盘,主节点和计算节点信息交换通过千兆以太网交换机完成。软件环境:Red Hat Enterprise Linux 3.0 操作系统,FLUENT6.2.16 的 Linux 并行版。3.2 测试方案 本文测试的是单直流道单电池模拟,质子交换膜燃料电池是 FLUENT 软件中默认的七层模型,即阴、阳极的集流板、扩散层和催化层,以及中间的质子交

11、换膜。采用 FLUENT 软件中 PEM Fuel Cell 模块计算,利用 FLUENT 内部命令(Benchmark)测试迭代 100 步并记录 CPU使用率和运算时间(Elapsecl-time)。按多重网格循环方法、区域分裂法和解题规模分三种方案测试。方案 1:网格划分为 100 万单元,采用 FLUENT 默认的主轴对称的网格分裂方法和不同的多重网格循环方法测试,从 1 个到 8 个计算节点,每个节点分配一个任务。方案 2:网格划分为 40 万单元,以方案 1 中并行效率最高的多重网格循环方法,并入 2个计算节点,每个节点分配一个任务,采取不同的网格分裂方法进行并行计算。由于燃料电池

12、模型几何特征的对称性,本实验只采用了 Principal X-Coordinate、Principal Y-Coordinate、Principal Z-Coordinate 和 Cartesian X-Coordinate、Cartesian Y-Coordinate、Cartesian Z-Coordinate方法。为方便记录,上述网格分裂方法采用简写,如 Principal X-Coordinate 简写为 P X-C。方案 3:网格划分为 40 万单元和 10 万单元两种,以并行效率最高的方案 1 中的多重网格循环方法和方案 2 中的网格分裂方法,每个节点分配一个任务,测试计算节点从

13、1 个到 8 个的 CPU 利用率和运算时间。由于主节点参与计算会导致负载不平衡,降低 HPCC 的加速性能5,因此以上方案中主节2005 Fluent 中国用户大会论文集 254图 2 不同多重网格循环方法的加速比 点均不参与计算,为了测试结果的准确性,同一测试重复一遍。由于测试结果重复性非常好,因此实验结果采用两次测试的算术平均值。4 FLUENT 的并行性能测试结果及分析 4.1 多重网格循环方法对并行性能的影响 方案 1 的测试结果如图 2,随着多重网格循环方法的不同,加速比和计算速度均不相同。这是因为不同循环方法的计算量和通讯量不一样,对于 V 循环、F循环和 Flexible 循环

14、,计算节点 CPU 利用率都很高,在 14 个节点时,都达 90%的利用率,因此分析对于这三种循环,主要还是因为计算量不同所引起的测试结果不同;而采用 W 循环时,CPU 利用率极低,最高只达到 10%,并且计算速度非常慢,可见采用 W 循环并行计算时,通讯量相当大,这是主要影响因素。从图 2 中可以看出,在 5 个计算节点以前,四种循环方法的并行加速比基本相同,但计算节点继续增加时,V 循环的并行加速比明显比其它三种大;随着计算节点的增加,所有的循环的加速比增长率都逐渐变小。不同循环 1 个节点的运算时间是 V 循环 4786 秒,W 循环 37504 秒,F 循环 5121 秒,Flexi

15、ble 循环 6870 秒。其中,V 循环运算速度最快,W 循环运算速度最慢,这是由于 V 循环运算量最少,W 循环运算量最大的缘故。4.2 区域分裂法对并行性能的影响 方案 2 的测试结果如表 1 所示,不同的网络分裂方法计算所用的时间各相同,有的甚至相差很大。这是因为不同的网络分裂方法所产生的分割接触面和领域的多少不同,并行计算时所需交换的数据量不同,因而通讯量不同,从而引起计算速度不同。分割接触面和领域数越少,计算速度越快。不同的求解问题模型需要寻找不同的网络分裂方法,以求计算速度最快。本文中最佳网络分裂方法是 Cartesian X-Coordinate。表 1 不同网络分裂法的测试结

16、果 方 法 P X-C P Y-C P Z-C C X-C C Y-C C Z-C 分割接触面 1.0 1.00.90.20.90.7 分割领域%4.8 4.85.31.05.34.3 时 间 s 2659 2661 2739 2120 2331 2159 4.3 不同解题规模对并行性能的影响 方案 3 的测试结果如图 3 所示,相同的多重网格循环方法(V 循环)和网格分裂方法123456781.01.52.02.53.03.54.04.55.0Speedup Ratio Number of Computing Nodes V-circle W-circle F-circle Flexible

17、2005 Fluent 中国用户大会论文集 255(Cartesian X-Coordinate),不同规模算例的并行性能不同。从图 3(a)可以看出,在计算节点数较少时,不同规模算例的加速比基本相同,随着计算节点数的进一步增加,虽然计算速度和加速比增加,但增长趋势逐渐变小,并且算例规模越小,并行加速比越小。图 3(b)显示,随着计算节点数的增加,并行效率均降低,不同规模的算例,其并行效率不一样,并且并行效率的变化趋势和加速比的变化趋势基本相同。这是由于在并行处理的消息传递模式中,计算量和通信量以及它们之间的关系起着极其重要的作用6。随着参与运算的 CPU 数的增加,CPU 的使用率与加在其上

18、的计算载荷相应的减少了,同时并行计算的通讯支出则相应增加了,因此随着计算结点的增加,并行效率降低。而对于不同规模的算例,其计算量和通信量的关系不一样,因而并行性能也不一样。123456781.01.52.02.53.03.54.04.55.0Speedup RatioNumber of Computing Nodes 1000,000 Cells 400,000 Cells 100,000 Cells12345678405060708090100Parallel Efficiency(%)Number of Computing Nodes 1000,000 Cells 400,000 Cell

19、s 100,000 Cells(a)加速比 (b)并行效率 图 3 不同解题规模的加速性能 4.4 FLUENT 基本模块与 PEM Fuel Cell 模块的并行加速比 图 4 是在相同的多重网格循环方法(V循环)和网格分裂方法(Principal Axes)情况下,PEM Fuel Cell 模块加速比、FLUENT中基本模块加速比5和理想最高加速比的对比。PEM Fuel Cell 模块并行加速比比FLUENT 中不带该模块的加速比小,而且两者均小于理想加速比,并且随计算节点数的增加,相差值越大。这是因为理想状况是忽略了数据通讯影响的,而 PEM Fuel Cell 模块由于增加了求解方

20、程,计算量和通讯量比 FLUENT 基本模块中的大。通过测试结果与 FLUENT 公司提供的 Benchmark 数据7比较,发现本次测试的并行效率低于该公司公布的 DELL POWEREDGE_1750 机型的并行效率。说明本次测试的测试环境需要进一步的优化。5 结论 123456781.01.52.02.53.03.54.04.55.05.56.06.57.07.58.0Speedup RatioNumber of Computing Nodes图4 加速比 PEM Fuel Cells Model Fluent Basal Model 4 Ideal Status2005 Fluent

21、中国用户大会论文集 256(1)FLUENT 软件中PEM Fuel Cell 模块在HPCC中运行时采用V循环的并行性能最好。(2)FLUENT 求解不同模型的问题时,网格分裂的分割接触面和领域数最少是最佳的区域分裂方法,此时解题速度最快。(3)利用 FLUENT 在 HPCC 上求解时,求解问题的规模还可以进一步加大,同时,HPCC的计算节点还有很大的扩充空间,以达到最大的并行加速比和更快的求解速度。(4)FLUENT 基本模块和 PEM Fuel Cell 模块的并行性能都比较好。同时,PEM Fuel Cell 模块还有更大的优化空间。参考文献 1 徐长发.实用偏微分方程数值解法M.武

22、汉:华中理工大学出版社,1990.284-394.2 W.哈克布思.多重网格方法M.科学出版社,1988.22-114.3 曹志浩.多格子方法M.上海:复旦大学出版社,1989.1-35.4 Zongbo Zhu,Guoxun Yan,Chunxiao Liu,Jinsheng Xiao.Parallel Multi-grid Algorithm Based on Cluster Computing with Application to Transient Heat Transfer.J.2004 International Symposium on Distributed Computin

23、g and Applications to Business,Engineering and Science,(DCABES 2004),345-349 5 温小飞,朱宗柏,胡春枝,肖金生J.高性能计算机集群的性能评价.武汉理工大学学报信息与管理版.2005,27(4):19-22 6 Guo Q P,Yakup P.Concurrent Communication and Granularity Assessment for a Transputer-based Multiprocessor system J.Journal of Computer Systems Science&Engin

24、eering,1990,5(1):18-20.7 FLUENT Inc.FLUENT Benchmark.http:/www.FLUENT.com/software/FLUENT/fl5bench,2005.10.7.Parallel Multi-Grid Algorithm and its Performance of FLUENT Software Yu Jianghong1,Zhu Zhongbo 1,2,Xiao Jinsheng 1,3 1The State Key Laboratory of Advanced Technology for Materials Synthesis a

25、nd Processing,2Center of Modern Education Technology,3School of Automotive Engineering,Wuhan University of Technology,Hubei 430070,China Abstract:The FLUENT is a popular CFD software package now,it can model complicated fluxion question from incondensability to the highly condensability.It can use p

26、arallel multi-grid method to solve the large-scale problems.In order to find out the suitable scale and parallel granularity of the FLUENT software while it makes the solution,and make the best of the software and the hardware,it analyses the multi-grid method and domain decomposition method of the

27、FLUENT software and tests again and again.It mainly discusses the influence of the different multi-grid cycle method,domain decomposition method,the scale of sample and the number of computing nodes on parallel efficiency.The results from the theories analysis and the experiments show that the FLUENT software has favorable parallel performance and the PEM Fuel Cell Model and HPCC could have better performance by upgraded well.Key words:fuel cell;multi-grid;domain decomposition;parallel computing;FLUENT

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!