对于多核多核直接和并行迭代法及其在辐射流体力学中运用
最后更新时间:2024-04-15
作者:用户投稿本站原创
点赞:7733
浏览:22709
论文导读:由www.7ctime.com,需要论文可以联系人员哦。摘要3-5Abstract5-7目录7-11表格11-13插图13-15第一章序言15-211.1探讨背景15-181.2本论文工作18-21第二章预备知识21-372.1Krylov子空间策略概述21-282.1.1计算Krylov子空间正交基的Arnoldi策略22-232.1.2基
摘要:大规模并行计算机的快速进展和运用,使得复杂物理系统的高分辨率数值模拟已成为可能.在这些数值模拟中,系统隐式离散后,通常需要求解稀疏线性代数方程组,所耗费的时间有的甚至达到模拟时间的80%.为了有效缩短数值模拟时间,要求相应的运用程序必须具有高度的可扩展能力.由此,在大规模并行机上进展具有高可扩展能力的线性解法器,是实现高性能数值模拟的重要组成部分,具有重要的论述作用和运用价值.本论文的工作主要有以下五个方面:第一,通过减少(串行)GPBiCR策略中全局同步化点的个数,提出了并行GPBiCR策略(记作PGPBiCR)所得的PGPBiCR策略与原GPBiCR策略具有相同的收敛性和数值稳定性,我们对两种策略在分布式存储并行机上实现时的并行性能,进行了浅析,得到新策略的同步开销减少为原来的三分之一.比较GPBiCR策略,以论述上证明了PGPBiCR策略的可扩展性得到了提升,通讯性能提升比率趋向于66.7%.数值试验得出了与论述浅析相吻合的结果.第二,通过消除(串行)BiCGSTAB2策略中内积计算的数据相关性,提出了并行BiCGSTAB2策略(记作PBiCGSTAB2)所得PBiCGSTAB2策略与原BiCGSTAB2策略具有相同的数值稳定性和收敛性.为了保证性能浅析的可靠性与公平性,把连续的偶数步与奇数步两次迭代整体看成一个大迭代步.比较BiCGSTAB2策略,以论述上证明了PBiCGSTAB2策略的可扩展性得到了提升,通讯性能提升比率趋向于66.7%.对两种策略在分布式并行机上进行了性能测试,所得数值试验结果与论述浅析结果相吻合.同时,也通过数值例子验证了两种策略具有相同的收敛性和数值稳定性.第三,基于目前占主流的多核系统结构的并行计算机,以及利用矩阵的低秩性所产生的快速健壮的结构化多波前分解(robust structured multifrontal factoriza-tion,记作RF)策略,提出了多核并行RF(记作MRF)策略MRF策略主要对RF策略的嵌套分割排序、符号分解以及数值分解三部分进行了多核并行实现.其中符号分解和数值分解是基于二叉消元树的分支结构来实现多核并行的.数值试验表明MRF策略是有效的.第四,基于二维三温辐射扩散方程及其离散系统,利用离散所得的三温矩阵所具有的块对角结构,对RF策略中的重排序和符号分解部分进行了分块操作,在数值分解部分利用了块矩阵操作技术.使得重排序和符号分解部分的时间效率得到了显著改善,同时基于良好的排序和块矩阵操作技术,数值分解部分的时间效率也得到了提升.我们把这种分块形式的策略称作分块RF(记作BRF)策略.数值试验部分通过五点离散模板所得的三温矩阵验证了BRF策略的稳定性与高效性,而且随着不足规模的增大,改善效果越来越显著.第五,基于前面所提出的MRF策略和BRF策略,进一步给出了适用于三温线性方程组的多核并行分块RF策略(记作MBRF)该策略把MRF策略多核并行的特点与BRF策略分块操作的特点充分结合了起来,使得所产生的MBRF策略同时具有了多核并行和分块操作的特性.数值试验部分基于二维三温辐射扩散方程的五点离散模板,验证了MBRF策略比MRF和BRF策略更有效.最后我们利用具有实际作用的三温模型所产生的线性方程组,对本论文所给的PGPBiCR策略,MRF策略,BRF策略以及MBRF策略进行了性能测试.测试结果进一步验证了所提策略的有效性.关键词:稀疏线性代数方程组论文Krylov子空间迭代法论文多核系统结构论文直接法论文二维三温辐射扩散方程论文
本论文由www.7ctime.com,需要论文可以联系人员哦。摘要3-5
Abstract5-7
目录7-11
表格11-13
插图13-15
第一章 序言15-21
.3 基于正交化的策略24-25
2.
5.
5.
5.
第六章 分块RF策略和多核分块RF策略83-99
参考文献113-125
发表文章目录125-127
致谢127-128
摘要:大规模并行计算机的快速进展和运用,使得复杂物理系统的高分辨率数值模拟已成为可能.在这些数值模拟中,系统隐式离散后,通常需要求解稀疏线性代数方程组,所耗费的时间有的甚至达到模拟时间的80%.为了有效缩短数值模拟时间,要求相应的运用程序必须具有高度的可扩展能力.由此,在大规模并行机上进展具有高可扩展能力的线性解法器,是实现高性能数值模拟的重要组成部分,具有重要的论述作用和运用价值.本论文的工作主要有以下五个方面:第一,通过减少(串行)GPBiCR策略中全局同步化点的个数,提出了并行GPBiCR策略(记作PGPBiCR)所得的PGPBiCR策略与原GPBiCR策略具有相同的收敛性和数值稳定性,我们对两种策略在分布式存储并行机上实现时的并行性能,进行了浅析,得到新策略的同步开销减少为原来的三分之一.比较GPBiCR策略,以论述上证明了PGPBiCR策略的可扩展性得到了提升,通讯性能提升比率趋向于66.7%.数值试验得出了与论述浅析相吻合的结果.第二,通过消除(串行)BiCGSTAB2策略中内积计算的数据相关性,提出了并行BiCGSTAB2策略(记作PBiCGSTAB2)所得PBiCGSTAB2策略与原BiCGSTAB2策略具有相同的数值稳定性和收敛性.为了保证性能浅析的可靠性与公平性,把连续的偶数步与奇数步两次迭代整体看成一个大迭代步.比较BiCGSTAB2策略,以论述上证明了PBiCGSTAB2策略的可扩展性得到了提升,通讯性能提升比率趋向于66.7%.对两种策略在分布式并行机上进行了性能测试,所得数值试验结果与论述浅析结果相吻合.同时,也通过数值例子验证了两种策略具有相同的收敛性和数值稳定性.第三,基于目前占主流的多核系统结构的并行计算机,以及利用矩阵的低秩性所产生的快速健壮的结构化多波前分解(robust structured multifrontal factoriza-tion,记作RF)策略,提出了多核并行RF(记作MRF)策略MRF策略主要对RF策略的嵌套分割排序、符号分解以及数值分解三部分进行了多核并行实现.其中符号分解和数值分解是基于二叉消元树的分支结构来实现多核并行的.数值试验表明MRF策略是有效的.第四,基于二维三温辐射扩散方程及其离散系统,利用离散所得的三温矩阵所具有的块对角结构,对RF策略中的重排序和符号分解部分进行了分块操作,在数值分解部分利用了块矩阵操作技术.使得重排序和符号分解部分的时间效率得到了显著改善,同时基于良好的排序和块矩阵操作技术,数值分解部分的时间效率也得到了提升.我们把这种分块形式的策略称作分块RF(记作BRF)策略.数值试验部分通过五点离散模板所得的三温矩阵验证了BRF策略的稳定性与高效性,而且随着不足规模的增大,改善效果越来越显著.第五,基于前面所提出的MRF策略和BRF策略,进一步给出了适用于三温线性方程组的多核并行分块RF策略(记作MBRF)该策略把MRF策略多核并行的特点与BRF策略分块操作的特点充分结合了起来,使得所产生的MBRF策略同时具有了多核并行和分块操作的特性.数值试验部分基于二维三温辐射扩散方程的五点离散模板,验证了MBRF策略比MRF和BRF策略更有效.最后我们利用具有实际作用的三温模型所产生的线性方程组,对本论文所给的PGPBiCR策略,MRF策略,BRF策略以及MBRF策略进行了性能测试.测试结果进一步验证了所提策略的有效性.关键词:稀疏线性代数方程组论文Krylov子空间迭代法论文多核系统结构论文直接法论文二维三温辐射扩散方程论文
本论文由www.7ctime.com,需要论文可以联系人员哦。摘要3-5
Abstract5-7
目录7-11
表格11-13
插图13-15
第一章 序言15-21
1.1 探讨背景15-18
1.2 本论文工作18-21
第二章 预备知识21-372.1 Krylov子空间策略概述21-28
2.1.1 计算Krylov子空间正交基的Arnoldi策略22-23
2.1.2 基于正交投影的策略23-24
2.1论文导读:.3 基于正交化的策略24-25
2.
1.4 基于双正交化的策略25-27
2.1.5 基于法方程的策略27-28
2.2 层次型半可分(HSS)结构矩阵28-342.1 HSS结构28-31
2.2 HSS树的后续遍历31-32
2.3 HSS结构的生成算法32-33
2.4 一个4×4块矩阵的例子33-34
2.3 多核CPU概述34-37
2.3.1 多核计算进展走势34-35
2.3.2 多核CPU硬件结构35-36
2.3.3 多核CPU编程方式36-37
第三章 并行GPBiCR策略37-533.1 降低全局通信的三种基本方式37-38
3.2 并行GPBiCR策略38-40
3.3 通信操作的具体实现40-42
3.1 向量校正的并行计算41
3.2 向量内积的并行计算41-42
3.3 矩阵向量乘积的并行计算42
3.4 性能浅析42-44
3.5 等效率浅析44-47
3.6 数值试验47-51
3.6.1 串行数值试验47
3.6.2 并行数值试验47-51
3.7 小结51-53
第四章 并行BiCGSTAB2策略53-654.1 并行BiCGSTAB2策略53-56
4.2 性能浅析56-58
4.3 等效率浅析58-60
4.4 数值试验60-64
4.1 串行数值试验60
4.2 并行数值试验60-64
4.5 小结64-65
第五章 多核并行RF策略65-835.1 RF策略65-70
5.1.1 嵌套分割排序65-66
5.1.2 多波前分解策略66-67
5.1.3 健壮的HSS Cholesky分解67-68
5.1.4 RF策略68-70
5.2 多核并行RF策略70-745.
2.1 嵌套分割排序的多核并行计算70-71
5.2.2 符号分解历程的多核并行计算71-72
5.2.3 数值分解历程的多核并行计算72-73
5.2.4 MRF策略73-74
5.3 性能浅析74-775.
3.1 并行化效率和加速比74-76
5.3.2 负载平衡不足76-77
5.4 数值试验77-815.
4.1 数值试验一77-79
5.4.2 数值试验二79-81
5.5 小结81-83第六章 分块RF策略和多核分块RF策略83-99
6.1 二维三温辐射扩散方程83-84
6.2 二维三温辐射扩散方程的离散84-88
6.3 BRF策略88-91
6.4 数值试验91-93
6.5 MBRF策略93-95
6.6 数值试验95-97
6.7 小结97-99
第七章 辐射流体力学中的运用99-1117.1 PGPBiCR策略的运用99-101
7.2 MRF策略的运用101-103
7.3 BRF策略的运用103-108
7.3.1 运用一103-104
7.3.2 运用二104-108
7.4 MBRF策略的运用108-1097.5 小结109-111
第八章 总结与展望111-113参考文献113-125
发表文章目录125-127
致谢127-128