国家教育部博士点基金(20094307110009)
- 作品数:3 被引量:15H指数:2
- 相关作者:陈书明朱红雷尹亚明陈胜刚彭元喜更多>>
- 相关机构:国防科学技术大学更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种低开销的复合神经网络分支预测器
- 2011年
- 为提高神经网络分支预测器的预测正确率,提出一种将神经网络算法与2位分支预测的优点相结合的新的预测器。实验结果表明,该预测器能够弥补神经网络算法学习时间较长的缺陷,提高分支预测器在神经网络算法学习阶段的预测正确率。
- 刘洋徐瑞陈书明李勇
- 关键词:神经网络复合神经网络
- 一种动态分配虚拟输出队列结构的片上路由器被引量:11
- 2012年
- 传统虚通道流控技术的片上路由器通过增加虚通道缓解排头阻塞引起的链路吞吐率下降以及网络拥塞的同时,面临缓冲区低利用率、仲裁开销较大等问题.而动态虚通道流控的片上路由器虽可通过动态管理缓冲单元,提高缓冲区利用率与链路吞吐率,但却不可避免流控与仲裁逻辑复杂度与开销的快速增长.为了提高链路吞吐率与缓冲区利用率,获得较好的性能与开销折中,提出一种动态分配虚拟输出队列结构的片上路由器DAVOQ,该结构通过快速链表动态组织虚拟输出队列,同时使用超前路由机制以简化仲裁逻辑,优化流水线.模拟与综合的结果表明,相比传统虚通道路由器,DAVOQ路由器改善报文传输延迟与吞吐率的同时,在0.13μm CMOS工艺下,节省了15.1%的标准单元面积与12.9%的漏电流功耗;而相比动态虚通道路由器,DAVOQ路由器能够以较小的吞吐率损失获得可观的延迟改善,同时节约15.6%的标准单元面积与20.5%的漏电流功耗.
- 朱红雷彭元喜尹亚明陈胜刚
- 关键词:片上网络虚拟输出队列虚通道
- 面向通用HPC的高性能DSP设计权衡被引量:4
- 2013年
- GPU由于其计算能力高达数TFLOPS,被高性能计算领域用于加速并行运算.但GPU较低的峰值性能利用率和功耗效率,已经成为了系统性能进一步提升的瓶颈.为了解决这个问题,作者开始研究将高性能DSP用于通用高性能计算领域.为了高效支撑通用高性能计算,文中提出了高性能DSP的结构框架,并通过映射GotoBLAS库到该结构上,建立了GEMM在该结构上的性能模型.作者研究了影响GEMM效率的主要因素,包括性能、存储层次、核的大小以及核的数量.文中总结了一些有指导意义的结论用于构建面向通用高性能计算的高效DSP.实验结果表明,通过尽可能少的硬件代价,可以在TFLOPS DSP上获得接近峰值的性能.
- 张凯陈书明王耀华宁希
- 关键词:矩阵乘法数字信号处理器