您的位置: 专家智库 > >

卢风顺

作品数:12 被引量:147H指数:4
供职机构:国防科学技术大学计算机学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 8篇期刊文章
  • 2篇学位论文
  • 1篇会议论文

领域

  • 11篇自动化与计算...

主题

  • 3篇并行计算
  • 2篇球谐函数
  • 2篇CPU
  • 2篇MPI
  • 1篇带权
  • 1篇带权图
  • 1篇性能分析
  • 1篇性能优化方法
  • 1篇异构
  • 1篇异构系统
  • 1篇社会网
  • 1篇社会网络
  • 1篇数值天气预报
  • 1篇同化
  • 1篇线程
  • 1篇可扩展
  • 1篇集合通信
  • 1篇加速器
  • 1篇广播
  • 1篇海洋资料

机构

  • 11篇国防科学技术...
  • 1篇国家超级计算...

作者

  • 11篇卢风顺
  • 8篇宋君强
  • 3篇朱小谦
  • 2篇杨锦辉
  • 2篇刘志强
  • 2篇王翔
  • 2篇张理论
  • 1篇银福康
  • 1篇任开军
  • 1篇吴泉源
  • 1篇贾焰
  • 1篇丁兆云
  • 1篇张卫民
  • 1篇周斌
  • 1篇徐芬
  • 1篇林旺群
  • 1篇赵娟

传媒

  • 2篇计算机工程与...
  • 2篇软件学报
  • 1篇计算机研究与...
  • 1篇计算机学报
  • 1篇微电子学与计...
  • 1篇计算机科学

年份

  • 3篇2012
  • 5篇2011
  • 1篇2010
  • 2篇2007
12 条 记 录,以下是 1-10
排序方式:
非平衡进程到达模式下MPI广播的性能优化方法被引量:4
2011年
为了提高非平衡进程到达(unbalanced process arrival,简称UPA)模式下MPI广播的性能,对UPA模式下的广播问题进行了理论分析,证明了在多核集群环境中通过节点内多个MPI进程的竞争可以有效减少UPA对MPI广播性能的影响,并在此基础上提出了一种新的优化方法,即竞争式流水化方法(competitive and pipelined method,简称CP).CP方法通过一种节点内进程竞争机制在广播过程中尽早启动节点间通信,经该方法优化的广播算法利用共享内存在节点内通信,利用由竞争机制产生的引导进程执行原算法在节点间通信.并且,该方法使节点间通信和节点内通信以流水方式重叠执行,能够有效利用集群系统各节点的多核优势,减少了MPI广播受UPA的影响,提高了性能.为了验证CP方法的有效性,基于此方法优化了3种典型的MPI广播算法,分别适用于不同消息长度的广播.在真实系统中,通过微基准测试和两个实际的应用程序对CP广播进行了性能评价,结果表明,该方法能够有效地提高传统广播算法在UPA模式下的性能.在应用程序的负载测试实验结果中,CP广播的性能较流水化广播的性能提高约16%,较MVAPICH21.2中广播的性能提高18%~24%.
刘志强宋君强卢风顺徐芬
关键词:MPI集合通信
快速球谐函数展开的并行算法设计及实现
球谐函数展开是一种广泛应用的数学方法。在研究Rokhlin-Tygert球谐函数展开快速算法(RT算法)的基础上,扩充并完善了RT算法,建立了所有阶连带Legendre多项式展开系数的计算过程,进而研究了该算法的MPI并...
王翔宋君强卢风顺杨锦辉
关键词:球谐函数
面向全球数值天气预报模式的加权等积并行数据划分算法被引量:2
2012年
极区计算对全球数值预报模式设计的重要性主要体现在2个方面:模式动力框架中的极区处理和极区并行数据划分带来的并行负载不平衡问题.其中后者是全球数值预报模式大规模并行计算的性能瓶颈,对此提出一种新的基于加权等积的球面数据划分算法.该算法以球带数目和权函数为参数,将南北两极分别划分到单独的子区域,形成极点通区,使从极点到赤道方向每个纬度对应的子区域数目逐渐增多,灵活地实现球面网格的高质量划分.从理论上分析该算法的划分质量后,以基于球谐谱的浅水波模式PSTSWM为实验平台,验证了提出的划分算法具有很好的并行划分性能以及可扩展性.结合我国自主设计的GRAPES全球模式,展望了该算法的应用前景.
卢风顺宋君强张理论张卫民任开军朱小谦
关键词:数值天气预报并行计算
CPU/GPU协同并行计算研究综述被引量:97
2011年
CPU/GPU异构混合并行系统以其强劲计算能力、高性价比和低能耗等特点成为新型高性能计算平台,但其复杂体系结构为并行计算研究提出了巨大挑战。CPU/GPU协同并行计算属于新兴研究领域,是一个开放的课题。根据所用计算资源的规模将CPU/GPU协同并行计算研究划分为三类,尔后从立项依据、研究内容和研究方法等方面重点介绍了几个混合计算项目,并指出了可进一步研究的方向,以期为领域科学家进行协同并行计算研究提供一定参考。
卢风顺宋君强银福康张理论
关键词:GPU计算可扩展
快速球谐函数展开的并行算法设计及实现
2011年
球谐函数展开是一种广泛应用的数学方法.在研究Rokhlin-Tygert球谐函数展开快速算法(RT算法)的基础上,扩充并完善了RT算法,建立了所有阶连带Legendre多项式展开系数的计算过程,进而研究了该算法的MPI并行策略并给出了RT并行算法.数值实验表明,RT算法的计算量随三角截断波数的增大而急剧增长;MPI并行技术能够有效提高其运算速度,较好地提升算法的整体性能,但并行效率会受多核处理器cache大小和访存带宽的限制.
王翔宋君强卢风顺杨锦辉
关键词:球谐函数MPI
OVALS海洋资料同化系统并行计算研究
2010年
海洋数值预报技术的发展与高性能计算密切相关。为提高OVALS海洋资料同化系统的时效性,本文实现了OVALS系统的并行化。在温盐资料同化模块并行化过程中,本文提出了层优先处理器划分算法,并研究了基于该算法的并行I/O、全局通讯等实现方法;在高度计资料同化模块并行化过程中,设计实现了基于预处理的非规则区域分解算法,较好地实现了OVALS并行计算负载平衡。数值实验表明,OVALS并行系统在36并行规模下取得了17.45的并行加速比。
卢风顺宋君强朱小谦
基于线程的MPI通信加速器技术研究被引量:12
2011年
为了针对多核系统构建更高效的MPI支撑环境,文中提出了一种基于线程的MPI加速器,称作MPIActor.MPIActor是一种用于协助传统MPI库的透明中间件,用户可以在编译期选择是否在单线程MPI程序中采用该中间件.加入MPIActor后,每个节点内的MPI进程都被映射成同一进程中的多个线程,从而节点内的通信可通过轻量级的线程通信机制实现.作者给出了MPIActor的基本设计,详细阐述了其工作机制、通信体系结构及关键技术,并在真实系统上分别针对MVAPICH2和OpenMPI并行环境利用OSU LATENCY基准测试进行了性能评测.实验结果表明在两种MPI环境上进行节点内8 KB^4 MB数据通信时MPIActor都能使通信性能平均提高一倍左右.
刘志强宋君强卢风顺赵娟
WRF三维变分同化并行程序性能分析被引量:3
2007年
并行程序性能分析在科学计算程序设计和优化中发挥着重要作用,通过它可以了解并行程序运行效率,分析计算瓶颈,从而改进和优化程序设计,更好地发挥高性能计算机效能。本文介绍了WRF三维变分同化原理和并行策略,采用性能分析工具TAU对WRF三维变分同化并行程序运行效率进行了量化分析,确定了程序的计算热点和瓶颈,并提出了相应的优化方案。
卢风顺宋君强朱小谦
关键词:性能分析TAU
海洋资料变分同化系统优化及并行实现
海洋数值预报技术的发展与高性能计算密切相关。高性能计算技术的发展推动海洋预报方法的不断创新以及预报分辨率和预报精确度的逐步提高。OVALS是中国科学院大气物理研究所开发的海洋资料同化系统,采用三维变分方法同化各种温盐观测...
卢风顺
关键词:OVALS变分同化
基于带权图的层次化社区并行计算方法被引量:22
2012年
提出了一种基于带权图并行分解的层次化社区发现方法,该方法采用图划分的方式定义社区结构,并在这种社区结构之上实现了社会网络社区发现并行算法P-SNCD(parallel social network community discovery).P-SNCD算法有效地避免了传统的基于"模块度"的社区发现方法倾向于发现相似规模社区的弊端.同时,该算法能够以可扩展的方式,在处理器规模为O(hmn)或O(hn2)的条件下,以并行计算时间复杂度为O(logn)高效地挖掘大规模复杂社会网络中社区密度为h的社区,其中,n为社会网络节点数,m为边数,h为用户指定的任意社区密度.所提出的算法对用户参数输入要求简单,从而使得算法具有较强的实用性.充分的实验数据验证了所提出算法的精确性和高效性.
林旺群卢风顺丁兆云吴泉源周斌贾焰
关键词:带权图并行计算社会网络
共2页<12>
聚类工具0