王桂彬 作品数:36 被引量:47 H指数:4 供职机构: 国防科学技术大学 更多>> 发文基金: 国家自然科学基金 国家科技重大专项 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
面向科学计算的流应用开发与优化 流处理器集成了大量的计算单元和软件管理的片上存储器,对于数据密集的媒体应用可以获得极高的计算性能,它具有低主频、低功耗、高数据并行性、高峰值性能等特点。因此,研究在大规模科学和工程计算领域应用流处理器是当前的一个热点问题... 王桂彬关键词:流体系结构 流编程模型 任意载波分配OFDMA上行链路同步 2014年 为了获得任意载波分配正交频分复用多址(OFDMA)系统上行链路更优的频率偏移(CFOs)和定时误差(TEs)联合估计性能,利用恒包络零自相关(Constant Amplitude Zero Auto Correlation;CAZAC)序列和增加训练块数对已有的联合估计算法进行改进.虽然传输效率降低,但是估计性能有所提高,这种牺牲是值得的.仿真结果表明,这种改进算法估计性能更好,应用范围更为广泛. 王桂彬 宋高俊 赵文婷 王佳仲关键词:CAZAC序列 一种面向异构并行系统的最大功耗管理方法 被引量:3 2013年 高功耗已成为制约高性能计算机发展的重要问题之一.近年来,大量研究关注于如何在满足系统功耗约束的条件下优化系统执行性能.然而,已有方法大都针对同构系统,未考虑异构处理器之间的功耗或速度差异,难以高效应用于基于加速器的异构系统.对当前异构并行系统执行模型进行了抽象,并提出了融合两级功耗控制机制的系统功耗管理框架,自顶向下依次为系统级功耗控制器和异构处理引擎功耗控制器.在异构处理引擎功耗控制中,针对类OpenMP并行循环,首先分析了异构多处理器在满足功耗约束条件下达到性能最优的条件.基于该结果,给出了功耗受限的并行循环划分算法,该方法通过协调并行循环调度和动态电压频率调节技术以优化异构并行处理.在系统级功耗控制中,建立了异构处理引擎效能评估方法,以此作为功耗划分的依据,在兼顾并发应用公平性的同时,提高系统整体执行效能.最后,基于典型CPU-GPU异构系统验证了方法的有效性. 王桂彬 杜静 唐滔关键词:任务调度 动态电压 模板操作在GPU上的实现与优化 被引量:2 2011年 随着GPU的快速发展,使用GPU来加速科学计算应用已成为必然趋势。本文抽取了SPEC2000中富含模板操作的Mgrid的两个典型子程序Rprj3和Interp,使用Brook+语言把它们移植到AMD GPU上运行。采用Brook+语言提供的线程调节机制,我们实现了不同线程粒度下的程序版本,并分析了加速比不同的原因,总结了线程粒度调节对模板程序移植的指导意义。我们使用AMD RadeonHD4870 GPU作为实验平台,对比Intel Xeon E5405 CPU上的运行结果发现,在最大规模下,Rprj3获得的相对于CPU版本的加速比为5.37×,Interp获得的相对于CPU版本的加速比为12.8×。 方旭东 唐玉华 王桂彬 唐滔关键词:GPU 一种基于网络控制器的超大规模栅栏同步方法 一种基于网络控制器的超大规模栅栏同步方法,步骤为:(1)进行MPI栅栏同步调用,软件构造同步通信域,并将参与线程与物理节点的映射关系发送给所有参与节点;(2)基于软件线程号,构建栅栏同步描述符;(3)基本节点的信息,完成... 徐炜遐 王绍刚 肖立权 庞征斌 王克非 夏军 童元满 陈虎 张峻 齐星云 王桂彬 常俊胜 张建民 罗章 徐金波 董德尊 赖明澈 陆平静文献传递 用于无缓存光交换网络的自适应路由方法 本发明公开了一种用于无缓存光交换网络的自适应路由方法,步骤如下:1)源计算节点将信息存入待发送信息队列;2)计算节点赋予路由标记;3)计算节点监听其所连交换节点,当有空闲输出时将信息输出;4)交换节点对内输出端口有空闲则... 罗章 徐金波 董德尊 赖明澈 陆平静 王绍刚 徐炜遐 肖立权 庞征斌 王克非 夏军 童元满 陈虎 张峻 齐星云 王桂彬 常俊胜 张建民基于通信感知任务划分的异构系统低功耗优化方法 2011年 针对由通用微处理器和专用加速部件构成的异构并行系统,提出结合通信感知的并行任务划分和动态电压频率调节技术的异构系统能耗优化方法,该方法旨在将并行任务图划分并映射在异构处理单元,在满足性能约束的条件下最小化系统能耗.在目前典型异构并行系统中,主处理器与加速部件大都通过系统总线连接,必然引入不可忽略的通信开销,因此通信感知的任务划分技术是该问题的关键.提出了基于整数线性规划的静态最优能耗优化方法和基于遗传算法的动态能耗优化方法.并通过一个典型科学计算应用验证了本文方法的有效性. 王桂彬关键词:低功耗优化 Co-array Fortran编译器的设计与实现 被引量:1 2007年 基于GUN Fortran编译器,设计并实现了co-array Fortran(CAF)编译器。通过源到源的转换将CAF代码转换为带有运行库调用的Fortran 90程序。典型用例的测试表明,CAF具有较好的可编程性,且CAF程序通过对数据分布的显式控制可获得比OpenMP程序更为高效的执行性能。 唐沛蓉 黄春 杨学军 王桂彬关键词:FORTRAN 基于硬件性能计数器的GPU功耗预测模型 被引量:3 2012年 图形处理器GPU以其高性能、高能效优势成为当前异构高性能计算机系统主要采用的加速部件。虽然GPU具有较高的理论峰值能效,但其绝对功耗开销明显高于通用处理器。随着GPU在高性能计算领域的应用逐渐扩展,面向GPU的低功耗优化研究将成为该领域的重要研究方向之一。准确的功耗预测是功耗优化研究的重要前提,本文提出了基于硬件性能计数器的GPU功耗预测方法。该方法基于硬件性能计数器信息,结合GPU在部分运行频率下的功耗值,通过线性回归的方法预测处理器在其他运行频率下的功耗值。实验结果表明,该方法可以准确地预测GPU功耗。 王桂彬面向高速缓冲存储器的可综合伪随机验证方法及装置 本发明公开了一种面向高速缓冲存储器的可综合伪随机验证方法及装置,方法步骤如下:1)建立数据镜像模块并初始化;2)生成伪随机数,构造访存控制数据信号并发送到高速缓冲存储器,同时启动超时计数器并在超时后报告超时错误;当收到高... 张建民 罗章 徐金波 董德尊 赖明澈 陆平静 黎铁军 王绍刚 徐炜遐 肖立权 庞征斌 王克非 夏军 童元满 陈虎 张峻 齐星云 王桂彬 常俊胜