您的位置: 专家智库 > >

国家自然科学基金(60633050)

作品数:35 被引量:80H指数:5
相关作者:窦勇窦文华杨学军董亚卓孙全宝更多>>
相关机构:国防科学技术大学河南公安高等专科学校中国航天员科研训练中心更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国防科技技术预先研究基金更多>>
相关领域:自动化与计算机技术电子电信理学更多>>

文献类型

  • 35篇期刊文章
  • 3篇会议论文

领域

  • 35篇自动化与计算...
  • 3篇电子电信
  • 1篇理学

主题

  • 7篇处理器
  • 6篇网络
  • 6篇FPGA
  • 4篇连网
  • 4篇互连
  • 4篇互连网
  • 4篇互连网络
  • 3篇调度
  • 3篇映射
  • 3篇可重构
  • 3篇光突发交换
  • 3篇QOS
  • 2篇多核
  • 2篇多核处理
  • 2篇多核处理器
  • 2篇硬件
  • 2篇体系结构
  • 2篇偏射路由
  • 2篇流水线
  • 2篇路由

机构

  • 32篇国防科学技术...
  • 2篇河南公安高等...
  • 2篇装甲兵工程学...
  • 2篇中国航天员科...
  • 1篇湖南大学
  • 1篇湖南第一师范...
  • 1篇中国人民解放...
  • 1篇并行与分布处...
  • 1篇国防科技大学
  • 1篇中国人民解放...
  • 1篇瑞典皇家理工...
  • 1篇江南遥感应用...

作者

  • 13篇窦勇
  • 6篇杨学军
  • 6篇窦文华
  • 4篇杨灿群
  • 4篇董亚卓
  • 4篇孙全宝
  • 3篇邬贵明
  • 3篇范永亮
  • 3篇肖立权
  • 3篇张民选
  • 2篇董勇
  • 2篇徐进辉
  • 2篇雷元武
  • 2篇易会战
  • 2篇张光胜
  • 2篇宋健
  • 2篇窦强
  • 2篇周兴铭
  • 2篇左艳辉
  • 2篇李东

传媒

  • 12篇计算机工程与...
  • 5篇计算机工程
  • 4篇计算机学报
  • 3篇计算机研究与...
  • 2篇计算机辅助设...
  • 2篇光通信技术
  • 1篇湖南大学学报...
  • 1篇国防科技大学...
  • 1篇中国科学(E...
  • 1篇计算机工程与...
  • 1篇Scienc...
  • 1篇通讯和计算机...
  • 1篇Journa...

年份

  • 3篇2011
  • 3篇2010
  • 13篇2009
  • 15篇2008
  • 4篇2007
35 条 记 录,以下是 1-10
排序方式:
A coarse-grained reconfigurable computing architecture with loop self-pipelining
2009年
Reconfigurable computing tries to achieve the balance between high efficiency of custom computing and flexibility of general-purpose computing. This paper presents the implementation techniques in LEAP, a coarse-grained reconfigurable array, and proposes a speculative execution mechanism for dynamic loop scheduling with the goal of one iteration per cycle and implementation techniques to support decoupling synchronization between the token generator and the collector. This paper also in- troduces the techniques of exploiting both data dependences of intra- and inter-iteration, with the help of two instructions for special data reuses in the loop-carried dependences. The experimental results show that the number of memory accesses reaches on average 3% of an RISC processor simulator with no memory optimization. In a practical image matching application, LEAP architecture achieves about 34 times of speedup in execution cycles, compared with general-purpose processors.
DOU Yong WU GuiMing XU dinHui ZHOU XingMing
位平面编码存储优化算法及FPGA设计被引量:5
2008年
提出一种基于子块的存储优化算法,可用于解决现有JPEG2000位平面编码器中存在的访问编码块存储器模式失配问题.采用将编码块划分成4×4的子块独立进行编码的策略,将访问同一小波系数的时间间隔从3N2Δt减少至48Δt,同时将访问编码块存储器的次数从(3K-2)N2降低至N2/W.该算法不仅兼容现有各种加速技术,而且增加了子块并行的机会.基于FPGA平台实现了一种子块并行合并样本并行的位平面编码器结构,能够将编码时间复杂度从O(N2)降低至O(N),同时节省状态信息存储39%以上.实验结果表明,与目前最快的三层并行结构相比,文中设计的加速比达到了1.3.
李宝峰窦勇
关键词:JPEG2000位平面编码FPGA
基于查表的空间填充曲线映射算法
2010年
空间填充曲线是进行数据降维处理的典型方法。首先给出对角线空间填充曲线的映射规则,该规则使得在高维情况下存在唯一曲线,并且每一维度上的格点数目不受限制。然后提出等势面的概念,推导出不同等势面上格点数量的递推关系。在此基础上,给出基于查表的对角线空间填充曲线映射算法,该算法执行快、可扩展性好,其时间复杂度随维度的增加呈线性增长。
吴国福窦强窦文华
关键词:空间填充曲线对角线等势面降维
二维DCT在粗粒度可重构处理器上的实现被引量:2
2008年
针对粗粒度可重构处理器的特点,提出一种二维离散余弦变换的设计方法,该方法在硬件资源受限的条件下,有效地挖掘了算法的并行性,结果证明算法在速度和资源利用率方面均达到了较好的状态,可满足实时图像编解码的要求。
徐佳庆邬贵明窦勇
关键词:二维离散余弦变换可重构处理器粗粒度
光突发交换中冲突解决的GHA策略被引量:1
2008年
为了解决光突发交换中突发包竞争问题,针对光突发网络中现有的突发包分割机制,提出新的基于优先级分组复合封装策略,分析冲突长度相对值和偏射路由阈值概念,结合头部丢弃与偏射路由双重机制进行冲突解决。仿真结果表明,该策略有效地较低了网络的丢包率,保证了高优先级IP包的高效传输,较好地支持了网络的QoS。
范永亮孙全宝刘光明窦文华李松涛
关键词:光突发交换偏射路由
支持循环自动流水线的粗粒度可重构阵列体系结构被引量:13
2008年
可重构计算兼顾定制计算的高效性与通用计算的灵活性,是人们正在探索的一类新型计算机体系结构.文中介绍一种粗粒度可重构多核协处理器体系结构,用于加速计算密集或数据密集类算法.在该结构中采用具有猜测执行机制的循环自动流水线技术,将流水线并行执行和数据驱动执行紧密结合.采用以循环程序为单位的固定指令多数据流执行模式,在循环执行期间,每个单元固定执行一种指令,配置信息量减少,支持快速动态重构.设计了多种特殊数据传递指令,如非平衡数据复制指令、数据选择指令等,充分利用循环迭代内部、循环迭代间的数据相关,开发数据重用性,减少对存储器带宽的需求.以大容量FPGA开发板为基础,构建了8×8规模的可重构阵列实验环境.多个计算密集型程序的实际运行结果表明,该体系结构在流水线吞吐率方面可以达到每拍1个循环迭代,访问存储器的请求数仅为典型RISC处理器的3%,并且具有单拍切换配置现场的能力.
窦勇邬贵明徐进辉周兴铭
关键词:可重构计算数据驱动
Cell处理器上软件缓存的设计与实现被引量:3
2011年
在Cell异构多核处理器上,并行程序对不规则共享数据的访问延迟较大,共享数据的一致性维护困难。为解决上述问题,提出一种基于扩充Location Consistency存储模型一致性协议的软件缓存。测试结果表明,该软件缓存能够缩短近40%的共享数据访问时间,有效提高并行程序的执行效率。
孙守航杨灿群
关键词:CELL处理器一致性
扩展双精度浮点并行计算:MPI方法
2010年
双精度浮点并行计算将不能满足高性能计算领域对计算精度的要求,但是目前还没有高性能的超双精度并行计算的解决方法。基于并行编程语言MPI,本文提出了扩展双精度浮点的并行计算实现方法,并且使用精度敏感的圆周率计算BBP算法验证了该方法的正确性和性能。
杨灿群杨学军易会战
关键词:MPI
StreamJacobi: Efficient implementation of 2-D Jacobi on a stream processor
2009年
ZHANG Ying LI Gen YANG Xue-jun ZHANG Wei FANG Xu-dong ZHANG He-ying
关键词:程序设计编程语言处理器
Cholesky分解细粒度并行算法被引量:7
2010年
本文提出了一种Cholesky分解细粒度流水线并行算法,该算法可以处理任意规模的数据,可以充分开发FP-GA加速器提供的细粒度并行。实验表明,该算法具有很好的可扩展性,在Xilinx XC5 VLX330 FPGA上能够集成36个处理单元(PE),当矩阵的阶为16384、运行频率为200MHz时性能达到14.3GFLOPS。
邬贵明窦勇王淼
关键词:CHOLESKY分解细粒度并行FPGA
共4页<1234>
聚类工具0