董亚卓
- 作品数:18 被引量:36H指数:3
- 供职机构:中国人民解放军91655部队更多>>
- 发文基金:国家自然科学基金军内科研计划重点项目国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术军事电子电信航空宇航科学技术更多>>
- 面向规约挖掘的事件相关性分析被引量:1
- 2014年
- 规约在测试、分析、验证、维护等软件工程的各个阶段都发挥着重要作用。规约挖掘技术试图从程序代码或者程序执行轨迹中自动挖掘软件的规约。寻找相关事件是规约挖掘的第一步,也是最重要的一步。本文给出一种寻找相关事件的静态分析方法,可以把该方法与现有的规约挖掘方法相结合,挖掘更好的规约。
- 张毅刘超董亚卓
- 关键词:软件工程
- 面向大尺寸滑动窗口应用的并行计算模型被引量:1
- 2011年
- 大尺寸滑动窗口的应用在数据输入速度与处理速度之间存在较大差距。为了缩短差距,提出了一种并行计算模型,使用尽可能少的存储资源与尽可能简单的存储器读写控制逻辑实现了尽可能高的数据重用性与并行性。该模型将不同滑动窗口之间的并行处理与单个窗口内不同数据之间的并行处理结合起来:对于不同窗口,按列进行分组并映射到多个处理单元上并行处理;对于单个窗口内的数据,使用多体存储结构进行缓存,并设计了存储体分配机制与寻址函数以实现多个数据的无冲突并行访问。在FPGA上的实验结果表明:提出的计算模型在没有明显增加存储资源使用代价与读写控制逻辑复杂性的情况下大大提高了处理速度。
- 庞征斌徐金波董亚卓窦勇张峻
- 关键词:并行处理
- 基于参数化存储结构的滑动窗口IP核自动生成被引量:3
- 2009年
- 为解决目前高级综合方法在处理滑动窗口程序时存在的存储系统设计瓶颈问题,提出了参数化存储体系结构模型.采用三级存储层次,充分开发内层循环、外层循环的数据重用;采用寄存器平移策略,简化硬件设计.与相关工作相比,这种体系结构模型使用相对较少的存储资源,将程序执行速度提高了2.13倍~3.8倍,将执行频率由相关工作的69MHZ提升到了238.7MHZ.
- 窦勇董亚卓徐进辉邬贵明
- 关键词:数据调度
- LDLT分解协处理器的并行结构研究
- 2011年
- 为提高LDLT分解协处理器的性能,基于FPGA平台,研究其并行结构。分析循环片间的数据依赖关系,提出LDLT分解细粒度并行算法,并在可扩展一维阵列处理器中加以实现,利用主机、算法加速器组成单精度浮点LDLT分解协处理器的并行结构。实验结果表明,与运行在2.50 GHz Pentium微处理器上的C代码相比,该协处理器可获得32.03倍~43.25倍的性能提升。
- 郭磊唐玉华周杰董亚卓
- 关键词:现场可编程门阵列细粒度并行协处理器
- 海空目标航迹数据清洗方法和流程研究被引量:3
- 2017年
- 论文针对海空目标航迹数据的内容与特点,面向海空目标探测效能评估需求,提出了海空目标航迹数据清洗方法和流程,包括数据格式规范化处理、数据筛选、去离群点和航迹插值等。试验证明,论文提出的数据清洗算法能够优化数据格式,剔除原始数据中的错误、无效数据,增加样本数量,从而为后续开展海空探测效能评估做好数据准备。
- 刘帅杨松常歌董亚卓
- 关键词:数据清洗
- 面向FPGA设计的类C语言及其关键技术研究被引量:1
- 2017年
- 类C语言自提出起来,已经取得了丰硕的研究成果。本文详细论述了类C语言的特点、发展历程,分析了所有类C语言设计中面临的关键技术问题,并对几种类C语言进行了比较说明。类C语言作为一种能同时实现软硬件描述的语言,其执行效果并不尽如人意,还有很多问题亟待解决。
- 董亚卓常歌
- 关键词:类C语言FPGA
- 将循环程序中有效的间接寻址数据调入缓存的技术
- 为加速循环程序执行,我们提出了固定指令多数据流计算模型.基于这一计算模型,我们发现,如果对循环程序中普遍存在的间接寻址操作数采用传统的缓存(cache)调入技术,将带来大量的间址数据在cache和存储系统之间的流动,同时...
- 董亚卓窦勇
- 关键词:高速缓存间接寻址
- 文献传递
- 滑动窗口应用循环展开及其数据通路生成被引量:3
- 2008年
- 滑动窗口广泛应用于图像处理、模式识别和数字信号处理中,它具有数据量大、计算密集等特点.可重构硬件为滑动窗口应用提供了一个灵活高效的实现平台.文中基于一种存储、数据调度模型及其相应的数据通路生成技术,研究循环展开对滑动窗口应用的面积、时钟频率和吞吐率的影响.实验结果表明内层循环展开相对于外层循环展开将带来更大的控制复杂度,增加了对芯片面积的需求,然而外层循环展开需要更多的存储资源保存重用数据;当片内存储模块个数增加到一定规模时,时钟频率将随着循环展开不断降低;不同维度的应用,吞吐率随循环展开提升程度不同.
- 董亚卓刘明政夏飞窦勇
- 关键词:数据通路
- 基于FPGA的Cholesky分解细粒度并行结构与实现被引量:4
- 2011年
- 基于FPGA平台研究大规模矩阵Cholesky分解的细粒度并行结构与实现.首先在数据依赖关系分析的基础上,提出了Cholesky分解细粒度并行算法,然后提出了可扩展的一维线性阵列结构实现该并行算法.最后在设计的开发板上实现了单精度浮点Cholesky分解阵列处理器.综合结果表明,单个Xilinx Virtex5 XC5VLX330FF1760 FPGA芯片可集成32个处理单元.与运行在2.50GHz Pentium微处理器上的串行C代码相比,该阵列处理器取得最大104.413倍和平均78.789倍的性能加速.
- 郭磊唐玉华周杰董亚卓
- 关键词:CHOLESKY分解FPGA细粒度并行
- 一种面向可重构硬件的编译中间表示方法
- 2008年
- 中间表示IR是构建编译和高级综合工具的基础。本文设计了一种面向可重构硬件的编译中间表示方法。这一工作是我们设计的高级综合工具的一部分。实验结果表明,应用这一中间表示,可以将C源程序高效地映射到目标可重构硬件上。
- 董亚卓左艳辉刘明政窦勇