您的位置: 专家智库 > >

赵国兴

作品数:13 被引量:17H指数:3
供职机构:北京师范大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 8篇期刊文章
  • 3篇会议论文
  • 2篇专利

领域

  • 9篇自动化与计算...
  • 2篇电子电信

主题

  • 5篇热分析
  • 2篇调度
  • 2篇任务调度
  • 2篇图形处理器
  • 2篇片上系统
  • 2篇热阻
  • 2篇温度管理
  • 2篇芯片
  • 2篇模块级
  • 2篇矩阵
  • 2篇功耗
  • 2篇SOR
  • 2篇GPU
  • 2篇GPU计算
  • 2篇并行计算
  • 2篇采样
  • 2篇处理器
  • 1篇电路
  • 1篇电路理论
  • 1篇电热

机构

  • 13篇北京师范大学
  • 1篇北京信息科技...
  • 1篇中国科学院

作者

  • 13篇骆祖莹
  • 13篇赵国兴
  • 4篇唐亮
  • 2篇杨旭
  • 2篇邹甜
  • 1篇余先川
  • 1篇韩银和
  • 1篇黄琨
  • 1篇周明全
  • 1篇周金和
  • 1篇方浩
  • 1篇邢星星
  • 1篇朱佩佩

传媒

  • 3篇计算机学报
  • 3篇第十七届全国...
  • 2篇计算机辅助设...
  • 1篇计算机研究与...
  • 1篇计算机科学
  • 1篇中国科学:信...

年份

  • 1篇2017
  • 2篇2014
  • 3篇2013
  • 4篇2012
  • 2篇2011
  • 1篇2010
13 条 记 录,以下是 1-10
排序方式:
基于GPU的全源最短路径算法被引量:4
2012年
针对有向图中每对顶点之间的最短路径问题,基于CPU集群并行算法,根据GPU并行计算加速机制,提出了基于棋盘划分方式的GPU并行算法,以增加算法的并行性与数据的局部性。当有向图规模超过GPU显存限制时,进一步提出了异步并行处理的GPU最短路径算法。实验结果表明,与CPU上单核算法相比,本算法具有如下加速效果:(1)对于节点数少于10000的小规模有向图,可以实现约155倍的加速;(2)对于节点数超过10000的大规模有向图,可实现约25倍的加速。
邢星星赵国兴骆祖莹方浩
关键词:GPUFLOYD算法
利于GPU计算具有线性并行度的P/G网SOR求解算法被引量:3
2013年
近年来电子设计自动化(EDA)研究人员尝试利用图形处理器(graphic processing unit,GPU)提供的高性能计算能力对IC参数分析进行加速研究.为了利用GPU进行电源线/地线网络(power/ground network,P/G网)快速分析,设计了一种基于经典的连续过松弛(successive over-relaxation,SOR)算法的高效P/G网分析并行算法.基于GPU并行计算加速原理,此算法进行了如下改进:1)采用红-黑次序的松弛策略.将所有的节点分为红黑两类,红色节点的所有邻点只有黑色节点、黑色节点的所有邻点只有红色节点,红色节点与黑色节点交替松弛,保证了GPU并行计算中的数据一致性.对于具有N个节点的P/G网而言,一次红色节点或黑色节点松弛可以同时对N/2个节点进行松弛操作,即理论上可以同时启动N?2个并行线程.2)优化数据结构.实现了对数据空间的合并访问,以保证对GPU全局存储空间的最优访问.3)在共享存储器内通过并行归约对松弛标记进行快速统计,同时利用zero-copy技术进行松弛标记的快速拷贝,以快速决定是否继续松弛.大量的实验结果表明:与单线程的CPU程序相比,此算法的加速倍数随GPU所提供物理线程的数目增加而线性增加,可以获得最大242倍的加速效果,是目前EDA研究领域中加速效果最好的GPU算法.
唐亮骆祖莹赵国兴杨旭
关键词:统一计算设备架构
一种基于预采样的模块级热分析方法
本发明公开了种基于预采样的模块级热分析方法,该分析方法包括采样热阻矩阵S的预提取模块,预提取模块将S作为参数库输入S到实用电阻矩阵R的映射模块,映射模块将R作为参数库输入到基于R计算芯片温度T<Sub>chip</Sub...
骆祖莹邹甜赵国兴李晓怡
文献传递
考虑电压/温度变化的电热综合分析及其并行加速技术被引量:1
2013年
受限于计算能力,在现有的电热分析研究中,无法考虑电压变化对电热分析的影响,从而降低了分析的精度.基于已有的研究成果,文中分析了芯片的功耗/电压/温度分布向量之间的相互关系,指出了在电热综合分析中考虑电压/温度变化的必要性,进而提出了一种迭代式的并行电热综合分析方法ETA_VT,该方法基于功耗与电压/温度之间的递归关系,进行迭代计算,最后将收敛后的功耗/电压/温度分布向量作为求解结果同时输出.基于多核CPU+众核GPU异构计算机系统所提供的并行计算资源,为了提高电热综合分析的运行效率,文中不仅设计了一个具有主辅双进程的ETA_VT算法流程,而且还分别采用CPU多线程并行计算、GPU并行计算、CPU+GPU协同并行计算技术对ETA_VT算法进行加速研究.实验数据表明:(1)考虑电压/温度变化的电热综合分析不仅可以获得较为精确的分析结果,而且可以同时计算出芯片的功耗/电压/温度分布;(2)采用并行计算技术、并合理分配计算资源,不仅可以解决电热综合分析中存在的功耗/电压/温度多参量相互影响的问题,而且还可以有效地提高电热综合分析的速度,获得多达44倍的加速效果.文中工作是将高性能计算引入电子设计自动化(EDA)算法研究的一次有益尝试,表明高性能计算技术不仅可以提高EDA算法的执行效率,而且可以促进芯片设计中存在的多参量相互影响综合分析问题的研究和解决.
赵国兴骆祖莹黄琨唐亮
关键词:PGPU计算
局部松弛电路理论及其在电热分析中的应用
2011年
在复杂度日益增高的高性能集成电路设计中,高效的性能分析是一项重要的设计内容,其中由电源线/地线网络(P/G)分析与芯片热分析构成的电热分析则是目前研究的热点问题.针对电热分析方程所具有的大规模稀疏(电导或热导)系数矩阵,根据该系数矩阵所具有的对称正定严格对角占优等特性,本文从理论上证明了电热分析具有局部性,在相同的截断误差限松弛结束条件下,局部松弛和全局松弛具有相同的松弛精度.基于局部松弛理论,本文提出了一个高效实用的局部过松弛(SOR)算法(LSOR2),并在文章最后将其用于如下的3个具体的电热分析问题研究:(1)P/G网中的过压降点电压变化统计分析;(2)3D热分析中的过热点温度变化统计分析;(3)单开路故障下的P/G网快速分析.实验数据表明:与全局SOR算法相比,在保证精度的前提下,LSOR2算法可以将电热分析的求解速度提高1-2个数量级.
骆祖莹赵国兴
关键词:集成电路
基于GPU的快速图像细化
图像细化是一种计算量较大的高度并行化算法,现有的CPU处理技术难以满足其对实时性的要求.在利用图形处理器GPU对数字图像处理进行加速的研究中,本文对传统的Rosenfeld图像细化算法进行了如下改进:首先对数据结构进行了...
朱佩佩赵国兴唐亮骆祖莹
关键词:图像细化图形处理器中央处理器
文献传递
可热扩展的三维并行散热集成方法:用于大规模并行计算的片上系统关键技术被引量:3
2011年
现有的三维(3D)垂直集成技术无法实现热扩展,受限于过高的温度,难以通过众多器件层的叠放来实现性能的最大化.文中提出了一种具有热扩展性的3D并行散热集成方法,将每个器件层平行于散热方向进行叠放,器件层为长条形,其短边平行于散热方向,长边垂直于散热方向,这样就保证了每个器件层均可以凭借自身所拥有的高导热性硅衬底(而不是导热过孔)来获得独立而较短的散热通道,保证3D并行散热集成芯片最高温度与所叠加的器件层数无关.文中提出了一种用于3D并行散热集成芯片最高衬底温度计算的分析模型,推导出3D芯片最高衬底温度的解析表达式,从理论上说明了该方法具有热扩展性.通过对未来用于千核并行计算的芯片进行3D集成设计表明:该文3D并行散热集成方法具有热扩展性、不需要导热过孔、良品率高等优点.
骆祖莹韩银和赵国兴余先川周明全
关键词:片上系统热分析并行计算
基于任务精确预测的实时功耗温度管理被引量:2
2014年
实时功耗温度管理(DPTM)通过对任务的准确预测与合理调度,可以有效降低片上系统的运行能耗与峰值温度.为了获得更好的DPTM调度效果,文中提出了一种精确的组合式任务预测算法和一种任务调度算法VP-TALK,进而构建了一个完整的DPTM原型系统.为了对复杂任务进行精确的任务预测,文中DPTM系统先将复杂任务按频谱长短分类为随机/周期/趋势3种成分,然后采用灰色模型/傅里叶模型/径向基函数(RBF)神经网络模型分别对这3种成分进行组合分析,以获得精确的预测效果;基于精确预测的任务负载量,文中所提出的VP-TALK算法可以计算出最优电压-频率对的理想值,进而选择出两组与理想值相邻的电压-频率对,以获得两个现实的工作状态,并考虑核心温度和任务实时性的条件,VP-TALK算法将任务负载分配到这两个工作状态,以获得最优的DPTM效果;最后基于机器学习方法,综合4种源算法构建了一套完整的DPTM原型系统.实验结果表明:(1)文中系统的任务预测组合方法的平均误差仅为2.89%;(2)在相同的设定峰值温度约束下,与已有调度算法的能耗值相比,尽管假设了更为敏感的功率-温度影响关系,但对于较高的工作负载率,文中所提出的VP-TALK调度算法仍能够获得平均14.33%的能耗降低;(3)文中所提出的DPTM原型系统可以获得接近于理想状态的能耗优化效果.
赵国兴闫佳琪骆祖莹
关键词:任务调度
ECO布局中的电源线/地线网络局部SOR分析方法被引量:1
2010年
供电电压直接决定芯片性能,在IC设计的各个阶段考虑供电电压约束具有重要的意义.受制于电源线/地线(P/G)网络分析的高复杂性,尽管供电电压已成为布图规划设计中的一个设计约束,但目前在布局设计中还未考虑供电电压约束.有别于ICCG,SOR等经典的全局分析算法,提出了一种局部的连续过松弛方法(SORPECO),并在ECO布局过程中对P/G网电压约束进行高效的分析.基于前一个布局的P/G网电压分布,针对ECO试探布局中某些轻微设计变动,SORPECO只需对这些设计变动的局部变化周边区域进行松弛,以更新P/G网电压分布.受益于P/G网络分析的局部性,SORPECO拥有局部、高效和高精度等优点.实验结果表明,与通常用于布图规划的传统高效的ICCG算法相比,SORPECO不仅精度损耗几乎可以忽略(最大误差<0.062%),而且可以加速2个数量级.
骆祖莹赵国兴周金和
基于任务精确预测的实时功耗温度管理
为了获得实时功耗温度管理(DPTM)的最佳效果,本文采用分段拟合与分段控制的组合策略来提高任务预测精度和功耗温度管理效果,进行了研究工作:采用三种不同拟合方法来分别对周期任务进行精确预测,以获得对复杂任务的精确预测;根据...
闫佳琪骆祖莹赵国兴
关键词:片上系统系统仿真
文献传递
共2页<12>
聚类工具0