赵永华
- 作品数:57 被引量:106H指数:5
- 供职机构:中国科学院计算机网络信息中心更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术理学电子电信自然科学总论更多>>
- GPU集群加速近似逆预条件CG并行求解器被引量:1
- 2015年
- 针对GPU集群系统,研究了分解近似逆(approximate inverse,AINV)和对称逐次超松弛-近似逆(symmetric successive over relaxation approximate inverse,SSOR-AI)两类近似逆预条件的并行算法。采用多级k-路图划分方法,通过子图的内点和边界点识别方法以及稀疏矩阵的置换技术,提出了将稀疏矩阵转换为分块箭形矩阵的并行方法。基于所形成的分块箭形矩阵,结合块内稀疏矩阵近似逆串行、块间并行的策略给出了近似逆预条件的并行方法,实现了AINV和SSOR-AI并行算法,解决了AINV预条件难以并行的问题。基于CPU与GPU协同计算、主机端页锁定内存和设备端计算与通信重叠的优化技术,实现了并行近似逆预条件与共轭梯度(conjugate gradient,CG)算法相结合的线性方程组混合并行求解器。数值实验表明,所提方法对AINV和SSOR-AI两类近似逆预条件,在多GPU上获得了很好的可扩展性和加速效果。
- 赵莲赵永华陈尧赵慰
- 关键词:预条件迭代法GPU集群
- 一种应用于图像混合集群处理系统的图像处理方法
- 本发明提供一种应用于图像混合集群处理系统的图像处理方法,图像混合集群处理系统包括至少一个管理节点和多个计算节点,管理节点和计算节点均采用CPU和GPU异构架构的混合集群系统模式,图像处理方法包括通过管理节点读取待处理的图...
- 赵永华赵莲于天禹苏琳
- 文献传递
- '基础并行软件平台建设与应用'综述
- '基础并行软件平台建设与应用'是中国科学院'十五'信息化建设规划项目'超级计算环境建设与应用'的重要内容之一.本文介绍了该项目开发的背景和内容,以及九大并行数值软件的基本概况、基本功能和简要评价.简单介绍了我们目前的工作...
- 程强迟学斌冯仰德王建赵永华陈江赵韬
- 关键词:并行计算软件开发
- 文献传递
- 一种图形处理器上基于延迟修正的批量矩阵求逆方法
- 本发明涉及一种图形处理器上基于延迟修正的批量矩阵求逆方法,该方法包括以下步骤:产生需要批量求逆的矩阵数据;依次将所述矩阵数据从主机内传输到图形处理器全局内存;在所述图形处理器上建立Grid列条和Block块与矩阵的对应关...
- 赵永华刘世芳黄荣锋
- 文献传递
- PETSc并行求解二维全球正压大气浅水波方程
- 本文采用多守恒差分格式和两种不同的隐式迭代方法,运用PETSc求解二维全球正压大气浅水波方程,数值试验结果表明在计算规模较大时获得了很好的并行可扩展性能,并很好地保持了4个守恒性。
- 程强王彦桐赵永华曹建文王斌
- 关键词:浅水波方程
- 文献传递
- 广义Hermitian特征问题标准化转换的有效并行块算法被引量:1
- 2007年
- 广义Hermitian特征问题并行求解器的性能依赖于所选择的并行算法和矩阵的分布策略等诸多方面.基于块存储和快算法策略,提出了一个新的标准化转化的并行算法,该并行算法将Cholesky分解结合到广义特征问题标准化转换中,降低了已有并行算法的通信开销,并增加了算法的并行性.新算法可显著改善已有并行算法的性能和可扩展性.另外给出了一个有效求解具有多个右端项的三角矩阵方程AX=B的并行块算法.通过自主开发的特征问题并行软件包PSEPS的测试结果表明,并行算法比传统的并行算法快大约1倍,并具有较好的可扩展性.
- 赵永华迟学斌程强
- 关键词:块算法CHOLESKY分解并行计算可扩展性
- 基于两步对角化的对称稠密矩阵特征值问题快速求解算法
- 2015年
- 计算对称矩阵中的某些特定的特征值和特征向量问题是很多科学计算领域中都存在的重要课题。特别在电子结构的计算中,特征值计算成为计算瓶颈。以往在需要求解大部分特征值和特征向量的应用场合,一般使用直接求解的方式。为了更好地利用存储器性能优势,我们设计了对角化算法,对规约与逆变换过程进行拆分处理,通过对整个过程的重新设计,充分利用存储器结构上的优势,提升单核计算速度,同时改进并行效率。本文中我们重点讨论三对角矩阵到带状矩阵逆变换过程。本文中所提及到的算法应用于MESIA电子结构计算软件包之中,取得了一定的性能提升。
- 郑啸天赵永华
- 关键词:对称矩阵三对角矩阵电子结构计算
- SMP集群系统上矩阵特征问题并行求解器的有效算法被引量:9
- 2007年
- 对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步.针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI+OpenMP混合并行算法.算法研究集中在SMP集群系统环境下的负载平衡、通信开销和性能评价.混合并行算法的设计结合了粗粒度线程并行模式和任务共享的动态调用方法,改善了MPI算法中的负载平衡问题、降低了通信开销.在深腾6800上的实验表明,基于混合并行算法的求解器比纯MPI版本的求解器具有更好的性能和可扩展性.
- 赵永华迟学斌程强
- 关键词:MPI+OPENMP
- 基于GPU异构平台的第一性原理计算软件加速
- 第一性原理计算软件在密度泛函理论的发展中起着重要作用。相比平面波方法,局域轨道法更适合处理大规模多体问题。随着问题规模的不断增大和计算机计算能力的提升,软件的并行加速成为一个重要课题。在继续增加CPU 处理器数量已经无法...
- 赵慰赵永华刘晓辉何力新
- 关键词:CUDA第一性原理
- HPSEPS软件包及其千核应用
- 基于自主开发的并行软件包HPSEPS所提供的大规模对称特征问题并行求解器,讨论了对称特征问题的并行计算方法,给出了HPSEPS的架构。HPSEPS软件包开发基于多级并行实现技术,并提供包括求解稠密和稀疏特征问题在内的多个...
- 赵永华迟学斌王武
- 关键词:对称矩阵