您的位置: 专家智库 > >

余磊

作品数:9 被引量:20H指数:3
供职机构:中国科学院计算技术研究所更多>>
发文基金:北京市自然科学基金国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇期刊文章
  • 4篇专利
  • 1篇会议论文

领域

  • 5篇自动化与计算...

主题

  • 5篇处理器
  • 4篇寄存器
  • 4篇核结构
  • 3篇硬件
  • 3篇指令级
  • 3篇体系结构
  • 3篇计算机
  • 3篇计算机体系
  • 3篇计算机体系结...
  • 2篇代码
  • 2篇序号
  • 2篇硬件资源
  • 2篇流水线
  • 2篇汇编代码
  • 2篇寄存器堆
  • 2篇加速比
  • 2篇负载均衡
  • 2篇RISC处理...
  • 2篇LU分解
  • 2篇标志位

机构

  • 9篇中国科学院
  • 4篇中国科学院研...

作者

  • 9篇余磊
  • 7篇刘志勇
  • 6篇范东睿
  • 4篇张浩
  • 4篇宋风龙
  • 2篇徐卫志
  • 2篇安述倩
  • 2篇叶笑春
  • 1篇张帅
  • 1篇马宜科
  • 1篇张军超

传媒

  • 2篇计算机学报
  • 1篇高技术通讯
  • 1篇系统仿真学报
  • 1篇2009中国...

年份

  • 2篇2013
  • 2篇2011
  • 3篇2010
  • 2篇2009
9 条 记 录,以下是 1-9
排序方式:
处理器内指令级流水线控制方法及其系统
本发明涉及处理器内指令级流水线控制方法和系统,方法包括:步骤1,初始化发射序号寄存器和写回序号寄存器初始值相同;步骤2,发射指令时,以发射序号寄存器的值为基础值,按指令在本次发射中的顺序,生成指令的发射序号,并在指令中携...
余磊张浩刘志勇范东睿
处理器内指令级流水线控制方法及其系统
本发明涉及处理器内指令级流水线控制方法和系统,方法包括:步骤1,初始化发射序号寄存器和写回序号寄存器初始值相同;步骤2,发射指令时,以发射序号寄存器的值为基础值,按指令在本次发射中的顺序,生成指令的发射序号,并在指令中携...
余磊张浩刘志勇范东睿
文献传递
众核处理器片上同步机制和评估方法研究被引量:11
2010年
同步机制是片上多核/众核处理器正确执行和协同通信的关键,其效率对处理器的性能非常重要.针对片上众核体系结构,提出并实现了两种粗粒度同步机制和一种细粒度同步机制,即片上专用硬件支持的同步机制、基于原语的片上互斥访问同步机制和基于满空标志位的细粒度同步机制;提出了粗粒度同步机制的评估标准和评估方法,并设计了量化评估程序.以片上同构众核处理器Godson-T模拟器和AMDOpteron商业片上多核处理器为平台,评估比较了提出的硬件支持的同步机制与基于原语的同步机制的性能.结果表明,硬件支持可以使得片上众核处理器的同步机制性能明显提高;在传统基于原语的同步机制中,大部分性能损失是由于负载不平衡和同步点的串行化操作而造成的等待时间.
徐卫志宋风龙刘志勇范东睿余磊张帅
关键词:硬件支持微程序
RISC处理器中执行寄存器类型指令的方法和其系统
本发明涉及RISC处理器中执行寄存器类型指令的方法和系统,方法包括:步骤1,发现汇编代码中寄存器类型指令在执行时,所用类型寄存器的可用数目不足,则生成所述寄存器类型指令对应的宏指令,使用所述宏指令代替所述寄存器类型指令;...
安述倩余磊张浩范东睿
文献传递
LU分解在众核结构仿真器上的指令级调度研究被引量:5
2011年
随着集成电路工艺的发展,众核处理器体系结构逐渐成为计算机体系结构设计者的研究热点。众核体系结构通过任务级的并行来提升整个处理器的性能。然而,指令级的并行性仍然是众核设计者需要认真考虑的问题。对浮点运算效率和加速比进行了形式化描述,验证了进行指令级调度的必要性。对处理器核内流水线进行详细分析,指出了指令级调度的一般性问题。提出了在众核结构上使用指令级调度和软件流水的方法。针对Splash2程序集里的LU分解算法,使用众核结构的硬件支持,在Scratched Pad Memory(SPM)上给出了调度指令的方案。在众核仿真器Godson-T上仿真了经过指令级调度后的算法,当使用64个线程处理512×512的矩阵时,程序性能达到调度前性能的4倍。
余磊刘志勇宋风龙叶笑春
关键词:计算机体系结构加速比指令级并行LU分解
一种片上众核结构共享Cache动态隐式隔离机制研究被引量:4
2009年
访存带宽是限制众核处理器性能提升的关键,将片上最后一级Cache设计为所有处理器核共享是必要的.在共享Cache中隔离放置冲突的数据,是提高共享Cache性能的关键.文中提出了缓存块链接的硬件方法,用于隔离共享Cache中不同线程之间的数据.文中基于时钟精准的片上众核结构模拟器,使用Splash2程序组和生物信息学中的任务,对所提机制进行了评估.实验结果表明,与传统共享Cache相比,使用缓存块链接机制时,使得共享Cache的冲突性缺失率降低约20%,而使得IPC平均提高了约10%.
宋风龙刘志勇范东睿张军超余磊
关键词:共享CACHE数据冲突
众核结构上分块LU分解算法的研究
2011年
针对科学计算中的经典程序LU分解进行了深入研究。在仔细分析Lu分解算法的基础上,提出了一个理想加速比模型,实现了基于比特翻转异或(BRX)的算法,进而提出了一个动态绝对均衡策略(DABP)算法。为了评估2Dscatter算法、BRX算法和DABP算法3种负载均衡算法的效果,提出了两种负载均衡评估函数,并用这两个函数验证了DABP算法的有效性。在众核结构Godson-T上仿真了3种算法,试验结果表明,在使用64个处理器核的情况下,DABP算法加速比达到46,是3个算法中性能最好的。
余磊刘志勇马宜科宋风龙徐卫志叶笑春
关键词:计算机体系结构加速比负载均衡LU分解
RISC处理器中执行寄存器类型指令的方法和其系统
本发明涉及RISC处理器中执行寄存器类型指令的方法和系统,方法包括:步骤1,发现汇编代码中寄存器类型指令在执行时,所用类型寄存器的可用数目不足,则生成所述寄存器类型指令对应的宏指令,使用所述宏指令代替所述寄存器类型指令;...
安述倩余磊张浩范东睿
众核结构上LU分解算法负载均衡的研究
随着计算机体系结构的发展,众核体系结构越来越成为科研人员关注的焦点。众核技术的发展要求能够利用片上大规模的并行资源,高效加速应用程序的性能。本文针对科学计算中的经典程序LU分解进行了深入研究。通过仔细分析算法,指出了2D...
余磊刘志勇范东睿宋风龙
关键词:计算机体系结构负载均衡
文献传递
共1页<1>
聚类工具0