黄品丰
- 作品数:8 被引量:15H指数:3
- 供职机构:解放军信息工程大学更多>>
- 发文基金:国家科技重大专项国家重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向异构处理器的代价模型及存储优化技术研究
- 异构处理器在高性能计算领域的应用越来越广泛。它在单芯片上集成了不同类型的处理器核,为并行计算提供了巨大潜力,但也带来了巨大挑战。人们需要掌握更高级的编程模型和更丰富的体系结构知识才能编写出充分利用异构资源的并行代码。这对...
- 黄品丰
- 关键词:并行化编译并行编程模型
- 文献传递
- 面向异构系统的OpenMP程序自动生成被引量:3
- 2012年
- 异构系统的应用日益广泛。对一般的应用程序员而言,在异构体系结构上开发出高性能的应用程序并非易事。对OpenMP编程模型进行扩展,添加了适用于异构系统存储模型的编译子句;以Open64编译器为基础,实现了包含扩展子句OpenMP并行程序的自动生成。测试结果表明,自动生成的扩展OpenMP并行程序能够在异构系统上获得明显的性能提升。
- 刘晓娴黄品丰
- 关键词:异构系统OPENMP
- 面向异构众核多级存储结构的数据分布与局部性优化方法
- 本发明涉及一种面向异构众核多级存储结构的数据分布与局部性优化方法,具体为:对程序进行数据流分析,完成数据在不同类型核心的存储器之间的高效映射和布局,通过自动生成指导数据分布的相关数据管理子句,显式控制局部存储器与主存储器...
- 姚远赵荣彩韩林李雁冰黄品丰
- 文献传递
- OpenMP数据分布子句自动生成算法
- 2013年
- 将OpenMP程序扩展到异构多核结构时,非本地存储访问会导致访存开销增加,影响程序性能。针对该问题,引入带数组划分信息的数据分布子句,对数据在异构多核存储系统的布局进行管理,提出一种基于并行循环识别和数组引用模式分析的算法,实现该类子句的自动生成。实验结果表明,自动生成的OpenMP程序包含数据分布子句,具有较好的数据局部性,可降低访存开销,在异构多核系统上获得明显的性能提升。
- 黄品丰赵荣彩韩林刘晓娴
- 关键词:异构多核数据局部性
- 面向异构多核处理器的并行代价模型被引量:3
- 2013年
- 现有的并行代价模型大多是面向共享存储或分布存储结构设计的,不完全适合异构多核处理器。为解决这个问题,提出了面向异构多核处理器的并行代价模型,通过定量刻画计算核心运算能力、存储访问延迟和数据传输开销对循环并行执行时间的影响,提高加速并行循环识别的准确性。实验结果表明,提出的并行代价模型能有效识别加速并行循环,将其识别结果作为后端生成并行代码的依据,可有效提高并行程序在异构多核处理器上的性能。
- 黄品丰赵荣彩姚远赵捷
- 关键词:自动并行化异构多核
- 面向异构众核多级存储结构的数据分布与局部性优化方法
- 本发明涉及一种面向异构众核多级存储结构的数据分布与局部性优化方法,具体为:对程序进行数据流分析,完成数据在不同类型核心的存储器之间的高效映射和布局,通过自动生成指导数据分布的相关数据管理子句,显式控制局部存储器与主存储器...
- 姚远赵荣彩韩林李雁冰黄品丰
- 文献传递
- 面向异构多核处理器的的循环分块被引量:4
- 2015年
- 将OpenACC编程模型用于异构多核处理器时,由于异构多核处理器加速设备内存有限,操作大量数据的代码不能获得很好的加速。针对这一问题,在OpenACC中引入循环分块子句,对循环进行分块处理,使每个循环块使用的数据能够存储在设备内存中;提出面向异构多核处理器的循环分块子句生成算法,并在基于Open64的"源-源"自动并行化系统Auto-ACC中进行实现。测试结果表明,在异构多核处理器上,扩展的循环分块子句及所提生成算法能够对程序进行明显的加速。
- 李雁冰赵荣彩赵博黄品丰
- 关键词:异构多核处理器数据重用自动并行化
- 基于嵌套循环分类的并行识别技术被引量:5
- 2012年
- 传统的分布存储并行编译系统大多是在共享存储并行编译系统的基础上开发的.共享存储并行编译系统的并行识别技术适合OpenMP代码生成,实现方式是将所有嵌套循环都按照相同的识别方法进行处理,用于分布存储并行编译系统必然会导致无法高效发掘程序的并行性.分布存储并行编译系统应根据嵌套循环结构的特点进行分类处理,提出适合MPI代码生成的并行识别技术.为解决上述问题,根据嵌套循环的结构和MPI并行程序的特点,提出了一种新的嵌套循环分类方法,并针对不同的嵌套循环分别提出了相应的并行识别技术.实验结果表明,与采用传统并行识别技术的分布存储并行编译系统相比,按照所提方法对嵌套循环进行分类,采用相应并行识别技术的编译系统能够更高效地识别基准程序中的并行循环,自动生成的MPI并行代码其性能加速比提高了20%以上.
- 赵捷赵荣彩丁锐黄品丰