您的位置: 专家智库 > >

文梅

作品数:107 被引量:72H指数:5
供职机构:国防科学技术大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 63篇专利
  • 33篇期刊文章
  • 10篇会议论文
  • 1篇学位论文

领域

  • 75篇自动化与计算...
  • 2篇电子电信

主题

  • 31篇处理器
  • 24篇流处理器
  • 17篇体系结构
  • 14篇网络
  • 12篇调度
  • 11篇流体系结构
  • 10篇寄存器
  • 10篇编程
  • 9篇硬件
  • 9篇寄存器文件
  • 8篇代码
  • 7篇数据流
  • 7篇矩阵
  • 7篇汇编代码
  • 7篇加速器
  • 7篇分布式
  • 7篇编译器
  • 6篇阵列
  • 6篇脉动阵
  • 6篇脉动阵列

机构

  • 107篇国防科学技术...
  • 2篇国防科技大学
  • 1篇湖南师范大学
  • 1篇湖南省消防总...

作者

  • 107篇文梅
  • 74篇张春元
  • 41篇伍楠
  • 38篇杨乾明
  • 34篇任巨
  • 29篇荀长庆
  • 24篇何义
  • 23篇沈俊忠
  • 22篇管茂林
  • 18篇吴伟
  • 16篇柴俊
  • 16篇扈啸
  • 14篇王耀华
  • 13篇乔寓然
  • 12篇苏华友
  • 9篇全巍
  • 8篇李京旭
  • 8篇孙海燕
  • 6篇李海燕
  • 6篇李礼

传媒

  • 18篇计算机工程与...
  • 6篇国防科技大学...
  • 4篇计算机研究与...
  • 2篇计算机学报
  • 2篇第十三届全国...
  • 1篇电子学报
  • 1篇上海交通大学...
  • 1篇电子设计工程
  • 1篇2004年全...
  • 1篇2006中国...
  • 1篇2009年全...
  • 1篇第十七届计算...
  • 1篇湖南省第三届...

年份

  • 13篇2023
  • 13篇2022
  • 8篇2021
  • 8篇2020
  • 5篇2018
  • 2篇2017
  • 3篇2016
  • 4篇2015
  • 2篇2014
  • 3篇2013
  • 3篇2012
  • 7篇2011
  • 5篇2010
  • 7篇2009
  • 8篇2008
  • 4篇2007
  • 6篇2006
  • 3篇2004
  • 1篇2000
  • 2篇1999
107 条 记 录,以下是 1-10
排序方式:
面向VLIW和SIMD架构的编译器自动调试方法及系统
本发明公开了一种面向VLIW和SIMD架构的编译器自动调试方法及系统,本发明方法包括针对待校验程序进行语义正确性校验以判断待校验程序相对源程序是否存在语义错误,若语义正确性校验发现存在语义错误,则判定调试不通过,否则针对...
时洋邓灿陈照云文梅赵宵磊王家男王耀华扈啸
一种利用低空地面图像自动生成地面全景图的新方法
地面全景图的用途十分广泛,但是由于其对视觉效果和地理参考意义的要求,使得用低空地面图像来自动生成地面全景图面临诸多挑战。这些挑战主要来源于两点:<br>  拍摄高度较低,地表和地物不能看作在同一平面;使用低空...
黄达飞文梅伍楠任巨张春元
关键词:立体视觉图像拼接
高清H.264 变换编码的流式实现
.264 作为新一代视频编码标准,具有很好的性能,但计算复杂度比较高。Storm 处理器是一款面向媒体应用和信号处理的高效能流处理器,在媒体处理方面具有很好的应用前景。针对H.264 对计算性能的要求,本文给出了高清H....
苏华友伍楠文梅任巨吴伟张春元
关键词:STREAMPROCESSORH.264CODINGTRANSFORMENCODINGSTREAM
共享存储可重构计算机软硬件通信的优化实现被引量:6
2013年
可重构硬件操作系统BORPH提供的硬件进程概念和以硬件为中心的执行模型可极大地提高可重构计算平台的易用性.BORPH-N为BORPH的扩展系统,主要的扩展是支持在共享存储可重构计算平台上的运行.BORPH-N为硬件进程提供基于共享存储、符合Unix语义的高性能进程间通信支持:共享存储和信号量.利用这两项服务,硬件进程可与系统中其他所有软件进程和硬件进程进行交互.可重构计算的重要目标是利用可重构逻辑对应用的耗时部分进行加速,所以软硬件交互机制的效率至关重要.通过类似远程调用这种简单方式来提供这两项服务,软硬件交互频繁,开销较大,性能难以满足需求.BORPH-N使用的优化策略基于独立执行的基本思路进行设计.实验结果表明,BORPH-N所需硬件开销较小,为硬件进程提供的共享存储和信号量的效率逼近硬件平台的峰值,可以满足实际应用的需求.
荀长庆杨乾明伍楠文梅张春元
关键词:可重构计算软硬件协同共享存储进程间通信
一种利用剩余资源分配寄存器的方法
本发明公开了一种利用剩余资源分配寄存器的方法,要解决的技术问题是在处理器寄存器分配过程中减小寄存器文件压力过载,减少溢出访存。技术方案是在寄存器分配失败后,首先构建剩余网络,然后选择平移变量,再对选定的平移变量选择合适的...
管茂林文梅伍楠张春元任巨何义荀长庆杨乾明吴伟
文献传递
一种支持可变分块的矩阵乘加速方法
本发明公开了一种支持可变分块的矩阵乘加速方法,步骤包括:输入矩阵A和矩阵B,根据矩阵A和矩阵B的规模确定子块大小S<Sub>i</Sub>,将矩阵A以规模为S<Sub>i</Sub>*N的子块为单位进行按行分块,将矩阵B...
文梅沈俊忠乔寓然杨乾明苏华友肖涛陈照云张春元
以编译为导向的Matrix-DSP程序分析与优化被引量:1
2020年
数字信号处理器(DSP)在图像处理、自动化控制、信号处理等多个领域具有广泛应用。自主研发的Matrix DSP采用了典型的单指令多数据SIMD+超长指令字VLIW的向量化架构,因此面向该架构如何实现高效的向量化编程与优化是一项重要挑战。基于Matrix DSP的体系结构特点,以编译器性能为导向,对内核级代码常用的分析优化手段进行梳理和总结,并结合一个通用矩阵乘的例子进行展示,其执行性能可最高提升1个数量级。最后,从编译器优化和程序员高效编程的角度提出了一些后续的思考与讨论。
荀长庆陈照云文梅孙海燕马奕民
关键词:编译器
面向GPDSP的轻量级高效汇编代码编程方法及系统
本发明公开了一种面向GPDSP的轻量级高效汇编代码编程方法及系统,本发明包括:输入串行汇编代码,所述串行汇编代码由指令串行构成,其中指令排布的顺序表示指令执行和生效的顺序,且每一条指令不包含有效的并行符号以及功能单元信息...
陈照云文梅马奕民时洋孔玺畅扈啸王耀华孙海燕邓灿赵宵磊
一种矩阵块间提前切换的脉动阵列优化方法及装置
本发明公开了一种矩阵块间提前切换的脉动阵列优化方法及装置,本发明包括根据脉动阵列的规模,将输入矩阵A、输入矩阵B和结果矩阵C进行分块,初始化分块编号i为0;采用两个寄存器来依次加载矩阵B的连续分块,使得在输入矩阵B的第i...
文梅鞠鑫曹亚松冯静杨建超汤珉琎杨韧禹汪志沈俊忠康宇晗方亚豪黄浩岚李宇航
一种减少流处理器片上指令存储器资源消耗的方法
本发明公布了一种减少流处理器片上指令存储器资源消耗的方法,要解决的技术问题基于现有成熟的硬件存储器结构,不增加复杂的编译算法,有效减少指令存储器的资源消耗。技术方案是将流处理器中纯软件管理的指令存储器修改为软硬件混合指令...
何义张春元文梅伍楠杨乾明任巨管茂林荀长庆吴伟柴俊李京旭
文献传递
共11页<12345678910>
聚类工具0