您的位置: 专家智库 > >

魏学超

作品数:4 被引量:5H指数:1
供职机构:中国科学技术大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 4篇自动化与计算...

主题

  • 3篇处理器
  • 2篇TRIPS
  • 2篇EDGE
  • 1篇优化技术
  • 1篇数据流
  • 1篇数据流模型
  • 1篇数据流驱动
  • 1篇片式
  • 1篇组网
  • 1篇组网雷达
  • 1篇流模型
  • 1篇流驱动
  • 1篇雷达
  • 1篇降水
  • 1篇降水系统
  • 1篇编译器
  • 1篇并行化
  • 1篇并行性
  • 1篇并行性分析
  • 1篇OPENMP

机构

  • 4篇中国科学技术...
  • 1篇中国人民解放...

作者

  • 4篇魏学超
  • 3篇安虹
  • 2篇毛梦捷
  • 1篇吴石磊
  • 1篇刘谷
  • 1篇周伟
  • 1篇李小强

传媒

  • 1篇小型微型计算...
  • 1篇计算机科学
  • 1篇2012中国...

年份

  • 1篇2013
  • 3篇2012
4 条 记 录,以下是 1-4
排序方式:
EDGE结构上一种通过超块重组加速单线程应用的方法
Explicit Data Graph Execution( EDGE)ISA是一种专门为类数据流驱动的分片式众核处理器而设计的指令集体系结构。相较于传统的采用控制流驱动的处理器,EDGE结构以超块(Hyperblock...
魏学超安虹毛梦捷
关键词:EDGETRIPS
文献传递
组网雷达估测降水系统并行化方案的设计与实现被引量:5
2012年
国家气象局天气组网雷达定量估测降水系统不仅拥有较大的计算量,而且具有较大的数据吞吐量,同时对实时性要求较高。如果缩短其执行时间,无疑将会带来巨大的收益。鉴于这些特点,使用VTune Amplifer XE对串行程序进行了热点分析和并行性分析,得出程序中有较多线程级并行性,从而制定了相应的并行化方案;然后使用Win32多线程和OpenMP两种技术对该程序在Intel四核处理器平台上进行了并行化。程序主要由单站处理和组网处理两部分组成。由于计算资源的限制,并行后的单站处理程序只有大约10%的性能提升,而组网处理程序则可以达到近似线性的性能提升。通过调整计算负载,并行化版本的加速比可以达到5.5。最后,可以得出该并行化方法适用于计算密集且数据吞吐量较大的一类应用。
吴石磊安虹李小强周伟刘谷魏学超
关键词:并行性分析OPENMP
类数据流驱动的分片式处理器上一种超块优化技术
分片式处理器体系结构(TPA)将计算、存储和互连资源组织成片式的基本结构单元,并将大量的片式单元由高效能、可扩展的片上网络连接起来。为了有效利用TPA丰富的片上资源,高度暴露程序并行性,指令集体系结构(ISA)的设计是首...
魏学超
关键词:数据流模型编译器
文献传递
EDGE结构上一种通过超块重组加速单线程应用的方法
2012年
Explicit Data Graph Execution(EDGE)ISA是一种专门为类数据流驱动的分片式众核处理器而设计的指令集体系结构.相较于传统的采用控制流驱动的处理器,EDGE结构以超块(Hyperblock)而不是单个指令作为其执行单位,在超块内部实现数据流执行,超块之间按照推测序保持控制流执行,有利于挖掘指令级并行性.但是,EDGE编译器按照程序的串行执行顺序组织超块,超块间和超块内部受限于数据依赖,削弱了整个程序运行时的潜在数据级并行性和线程级并行性,不利于发挥EDGE分片式结构的优势.本文通过分析EDGE编译器超块组织的特点,结合EDGE结构特有的执行模型,提出一种普适性的超块组织框架来模拟EDGE结构上多线程运行的效果,进一步挖掘EDGE结构运行串行单线程程序时的指令级并行性.本文选用TRIPS微处理器作为EDGE结构的实例处理器,利用矩阵乘法等三个实验验证了我们所提出的框架的可行性,实验结果表明这些应用在TRIPS上获得了较好的性能提升.
魏学超安虹毛梦捷
关键词:EDGETRIPS
共1页<1>
聚类工具0