您的位置: 专家智库 > >

国家自然科学基金(60633050)

作品数:35 被引量:80H指数:5
相关作者:窦勇窦文华杨学军董亚卓孙全宝更多>>
相关机构:国防科学技术大学河南公安高等专科学校中国航天员科研训练中心更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国防科技技术预先研究基金更多>>
相关领域:自动化与计算机技术电子电信理学更多>>

文献类型

  • 35篇期刊文章
  • 3篇会议论文

领域

  • 35篇自动化与计算...
  • 3篇电子电信
  • 1篇理学

主题

  • 7篇处理器
  • 6篇网络
  • 6篇FPGA
  • 4篇连网
  • 4篇互连
  • 4篇互连网
  • 4篇互连网络
  • 3篇调度
  • 3篇映射
  • 3篇可重构
  • 3篇光突发交换
  • 3篇QOS
  • 2篇多核
  • 2篇多核处理
  • 2篇多核处理器
  • 2篇硬件
  • 2篇体系结构
  • 2篇偏射路由
  • 2篇流水线
  • 2篇路由

机构

  • 32篇国防科学技术...
  • 2篇河南公安高等...
  • 2篇装甲兵工程学...
  • 2篇中国航天员科...
  • 1篇湖南大学
  • 1篇湖南第一师范...
  • 1篇中国人民解放...
  • 1篇并行与分布处...
  • 1篇国防科技大学
  • 1篇中国人民解放...
  • 1篇瑞典皇家理工...
  • 1篇江南遥感应用...

作者

  • 13篇窦勇
  • 6篇杨学军
  • 6篇窦文华
  • 4篇杨灿群
  • 4篇董亚卓
  • 4篇孙全宝
  • 3篇邬贵明
  • 3篇范永亮
  • 3篇肖立权
  • 3篇张民选
  • 2篇董勇
  • 2篇徐进辉
  • 2篇雷元武
  • 2篇易会战
  • 2篇张光胜
  • 2篇宋健
  • 2篇窦强
  • 2篇周兴铭
  • 2篇左艳辉
  • 2篇李东

传媒

  • 12篇计算机工程与...
  • 5篇计算机工程
  • 4篇计算机学报
  • 3篇计算机研究与...
  • 2篇计算机辅助设...
  • 2篇光通信技术
  • 1篇湖南大学学报...
  • 1篇国防科技大学...
  • 1篇中国科学(E...
  • 1篇计算机工程与...
  • 1篇Scienc...
  • 1篇通讯和计算机...
  • 1篇Journa...

年份

  • 3篇2011
  • 3篇2010
  • 13篇2009
  • 15篇2008
  • 4篇2007
35 条 记 录,以下是 1-10
排序方式:
A coarse-grained reconfigurable computing architecture with loop self-pipelining
2009年
Reconfigurable computing tries to achieve the balance between high efficiency of custom computing and flexibility of general-purpose computing. This paper presents the implementation techniques in LEAP, a coarse-grained reconfigurable array, and proposes a speculative execution mechanism for dynamic loop scheduling with the goal of one iteration per cycle and implementation techniques to support decoupling synchronization between the token generator and the collector. This paper also in- troduces the techniques of exploiting both data dependences of intra- and inter-iteration, with the help of two instructions for special data reuses in the loop-carried dependences. The experimental results show that the number of memory accesses reaches on average 3% of an RISC processor simulator with no memory optimization. In a practical image matching application, LEAP architecture achieves about 34 times of speedup in execution cycles, compared with general-purpose processors.
DOU Yong WU GuiMing XU dinHui ZHOU XingMing
位平面编码存储优化算法及FPGA设计被引量:5
2008年
提出一种基于子块的存储优化算法,可用于解决现有JPEG2000位平面编码器中存在的访问编码块存储器模式失配问题.采用将编码块划分成4×4的子块独立进行编码的策略,将访问同一小波系数的时间间隔从3N2Δt减少至48Δt,同时将访问编码块存储器的次数从(3K-2)N2降低至N2/W.该算法不仅兼容现有各种加速技术,而且增加了子块并行的机会.基于FPGA平台实现了一种子块并行合并样本并行的位平面编码器结构,能够将编码时间复杂度从O(N2)降低至O(N),同时节省状态信息存储39%以上.实验结果表明,与目前最快的三层并行结构相比,文中设计的加速比达到了1.3.
李宝峰窦勇
关键词:JPEG2000位平面编码FPGA
基于查表的空间填充曲线映射算法
2010年
空间填充曲线是进行数据降维处理的典型方法。首先给出对角线空间填充曲线的映射规则,该规则使得在高维情况下存在唯一曲线,并且每一维度上的格点数目不受限制。然后提出等势面的概念,推导出不同等势面上格点数量的递推关系。在此基础上,给出基于查表的对角线空间填充曲线映射算法,该算法执行快、可扩展性好,其时间复杂度随维度的增加呈线性增长。
吴国福窦强窦文华
关键词:空间填充曲线对角线等势面降维
二维DCT在粗粒度可重构处理器上的实现被引量:2
2008年
针对粗粒度可重构处理器的特点,提出一种二维离散余弦变换的设计方法,该方法在硬件资源受限的条件下,有效地挖掘了算法的并行性,结果证明算法在速度和资源利用率方面均达到了较好的状态,可满足实时图像编解码的要求。
徐佳庆邬贵明窦勇
关键词:二维离散余弦变换可重构处理器粗粒度
Cell处理器上软件缓存的设计与实现被引量:3
2011年
在Cell异构多核处理器上,并行程序对不规则共享数据的访问延迟较大,共享数据的一致性维护困难。为解决上述问题,提出一种基于扩充Location Consistency存储模型一致性协议的软件缓存。测试结果表明,该软件缓存能够缩短近40%的共享数据访问时间,有效提高并行程序的执行效率。
孙守航杨灿群
关键词:CELL处理器一致性
扩展双精度浮点并行计算:MPI方法
2010年
双精度浮点并行计算将不能满足高性能计算领域对计算精度的要求,但是目前还没有高性能的超双精度并行计算的解决方法。基于并行编程语言MPI,本文提出了扩展双精度浮点的并行计算实现方法,并且使用精度敏感的圆周率计算BBP算法验证了该方法的正确性和性能。
杨灿群杨学军易会战
关键词:MPI
StreamJacobi: Efficient implementation of 2-D Jacobi on a stream processor
2009年
ZHANG Ying LI Gen YANG Xue-jun ZHANG Wei FANG Xu-dong ZHANG He-ying
关键词:程序设计编程语言处理器
Cholesky分解细粒度并行算法被引量:7
2010年
本文提出了一种Cholesky分解细粒度流水线并行算法,该算法可以处理任意规模的数据,可以充分开发FP-GA加速器提供的细粒度并行。实验表明,该算法具有很好的可扩展性,在Xilinx XC5 VLX330 FPGA上能够集成36个处理单元(PE),当矩阵的阶为16384、运行频率为200MHz时性能达到14.3GFLOPS。
邬贵明窦勇王淼
关键词:CHOLESKY分解细粒度并行FPGA
自相似网络流量预测研究被引量:5
2008年
研究发现,网络流量自相似特性具有普遍性,且不随缓冲、交换、传输和延迟而改变,网络流量预测必须考虑这种自相似特性.本文从自相似网络流量的多个方面对现有研究成果进行了分析,从网络自相似的模型、参数估计、性能预测等多个方面对网络自相似流量预测研究进展进行了总结,并提出了一种基于测量的流量自相似等价带宽预测算法.分析表明:该算法能有效地减少计算量和降低实现复杂度.
张光胜李靖波窦文华邵立松
关键词:网络通信量自相似参数估计
滑动窗口应用循环展开及其数据通路生成被引量:3
2008年
滑动窗口广泛应用于图像处理、模式识别和数字信号处理中,它具有数据量大、计算密集等特点.可重构硬件为滑动窗口应用提供了一个灵活高效的实现平台.文中基于一种存储、数据调度模型及其相应的数据通路生成技术,研究循环展开对滑动窗口应用的面积、时钟频率和吞吐率的影响.实验结果表明内层循环展开相对于外层循环展开将带来更大的控制复杂度,增加了对芯片面积的需求,然而外层循环展开需要更多的存储资源保存重用数据;当片内存储模块个数增加到一定规模时,时钟频率将随着循环展开不断降低;不同维度的应用,吞吐率随循环展开提升程度不同.
董亚卓刘明政夏飞窦勇
关键词:数据通路
共4页<1234>
聚类工具0