国家高技术研究发展计划(2009AA01Z110)
- 作品数:24 被引量:57H指数:4
- 相关作者:樊晓桠高德远安建峰任向隆张萌更多>>
- 相关机构:西北工业大学中国科学院更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金西北工业大学基础研究基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 改进的非对称多通道路由器结构及其分析模型被引量:1
- 2012年
- 为提高路由器的性能,提出了一种改进的非对称多通道路由器结构,并给出了相应的排队论分析模型,用于片上网络设计方案的性能评估.通过将非对称多通道路由器输入端口中特定输出方向的通道由单个扩展到一组,降低了该方向上的队列头阻塞;通过分析该结构的各种阻塞、报文到达率和服务速率,并借助M/G/1/N排队论模型构建了对应的分析模型.给定通道组中合适的通道数量,该结构可有效降低报文平均延时、提高饱和吞吐率;结构的分析模型与仿真结果之间的平均相对误差小于6.4%.
- 任向隆安建峰高德远樊晓桠
- 关键词:网络性能路由器排队论分析模型片上网络
- 浮点和与点积计算结构研究
- 2011年
- 浮点数求和与点积计算在科学计算,信号处理,图像处理等领域中广泛应用.对浮点和与点积计算的硬件结构进行了研究.在只有一次舍入误差的前提下,提出一种通用的浮点数求和算法和结构,利用重对阶方法,解决了多个粘贴位和尾数过抵消所产生的精度损失问题.然后将这种算法移植到浮点点积计算中.为了增加结构的通用性,将提出的结构和常用的SIMD计算单元进行结合.根据提出的算法,设计实现了FADD4和FDP4的硬件结构,和使用离散的加法器和乘法器来实现求和与点积的方法相比,计算速度分别提高了20.4%和42.1%.
- 姚涛高德远樊晓桠
- 关键词:硬件结构
- 32位双发射双流水线结构RISC微处理器设计被引量:1
- 2011年
- "龙腾R2"是西北工业大学自主研制的32位嵌入式RISC微处理器,与IBM公司的Power-PC750处理器pin-to-pin兼容。综合考虑面积、功耗、实时响应以及性能要求等因素,文章提出了一种应用于嵌入式处理器微架构设计的双发射双流水线结构。该结构的核心思想是在指令流水线前端处理阶段动态检测相邻指令的先后依赖关系,预先完成双发射判断。文中首先介绍了"龙腾R2"的微体系架构,然后重点讨论了基于双发射双流水结构的指令调度策略、相邻指令耦合关系、双发射下的相关处理以及精确异常考虑等。采用M ibench基准程序完成了性能评测,综合分析结果显示,该结构对算术计算类程序流加速明显,并且电路结构清晰,易于设计验证,同时发现优化存储系统结构是提升该处理器性能的关键。文章最后对"龙腾R2"的可测试性设计以及硅物理设计等关键技术进行了论述。"龙腾R2"已流片成功,整个处理器采用SMIC 180nm CMOS工艺,芯片面积5.9 mm×6.7 mm,核心频率266 MHz,CBGA360封装。
- 黄小平樊晓桠张盛兵史莉雯
- 关键词:可测试性设计
- 基于安全日志的问责技术的研究
- 2014年
- 分布式系统发展至今,规模越来越大,网络中故障节点的查找更加困难。在此针对这种问题提出了一种新的基于安全日志的问责方法。通过维护一个系统安全日志以记录节点过去的行为,节点间依赖此安全日志中的记录来确定其他节点行为的正确性。通过在NS-3环境下对问责机制的模拟,得出结论:使用问责机制可以确保分布式环境下任意发生故障的节点最终能被至少一个正确的节点检测出来,并且存在至少一个正确的节点持有该节点发生故障的确凿证据。
- 高翔郭新东逢晓燕张凤兰
- 关键词:分布式系统安全日志问责机制
- 片上多核处理器共享末级缓存动静结合地址映射机制被引量:1
- 2012年
- 片上多核处理器(CMP)通常采用私有或者共享的末级高速缓存(cache)结构,而共享末级cache一般使用静态地址映射机制。该机制将各处理器临时私有访问的数据映射于分布在其他处理器的末级cache中,使得各处理器对临时私有数据的访问延时增加。针对该问题,提出了一种动静结合的共享末级cache地址映射方法。该方法可将原来静态映射于其他处理器末级cache中的临时私有数据动态映射于访问者处理器的本地末级cache中,减少了大量静态映射所造成的长延时非本地末级cache访问,从而有效降低了整个共享末级cache的访问延时,在提高性能的同时降低了功耗和带宽使用。实验结果表明,动静结合的地址映射方式应用于采用环连接互连结构和侦听顺序环协议的CMP结构时,可获得的平均性能提升为9%,最大性能提升为38%。
- 曹非刘志勇
- 关键词:片上多核处理器
- 基于CUDA的稀疏矩阵与矢量乘法的优化被引量:6
- 2010年
- 随着VLSI技术的发展,在单芯片上集成若干个处理器核的思想成为现实,现代GPU就是一个典型的多核处理器设备;由于面向计算密集型的应用发展非常迅速,当前的GPU又具有了较强的通用计算能力;全文首先介绍了CUDA和稀疏矩阵的相关知识;基于矩阵的CSR表示格式,文章提出了三种CUDA模型下的程序优化方法;论文分析并实现了这三种程序优化方法,在Geforce 9600GT上的实验结果表明,最大可以实现4倍左右的加速比。
- 周洪樊晓桠赵丽丽
- 关键词:CUDAGPGPUCSR并行计算
- 支持媒体处理的子字绝对值单元设计与实现
- 2012年
- 子字并行结构的计算单元是提高多媒体应用程序性能的有效方式。研究和实现了支持子字并行的32位绝对值单元,并优化了该单元的关键路径。从时序,面积等方面对三种设计方案进行了分析比较。结果表明经过优化的子字并行绝对值单元在保证面积大小的同时,减小了整个单元的延时。
- 开耀文高德远张萌
- 关键词:子字并行加法器
- ARINC659航空总线监控器的设计被引量:4
- 2012年
- ARINC659是一种具有高数据吞吐量、高故障容错和数据确定性的航空总线;为给系统分析提供数据源,根据ARINC659航空总线表驱动的协议特性,介绍了一种基于Verilog HDL硬件描述语言的ARINC659总线监控器的实现方案,完成了总线的采样,解码,串并转换和存储,并通过状态跟踪方法生成了附有表指令地址和全分辨率时间的描述符;存储的总线数据和生成的描述符通过Xil-inx PCI LogiCORE的接口上传给主机;实验结果表明该监控器能实时检测分析ARINC659总线的数据与各种同步信息,实现了PCI 32bit×33MHz的主控方式数据上传。
- 李文星樊晓桠安建峰
- 关键词:ARINC659航空总线监控器
- LT-SP2汇编器的设计与实现
- 2012年
- 流处理器体系结构的研究是当今的一个热点,而核级汇编器在流处理器的验证和应用中举足轻重。LT-SP2是一款支持短向量操作的多核流处理器,一条指令能对多个计算单元进行操作。针对LT-SP2的体系结构及系统容错问题,采用了编译程序自动构造方法,提出了冗余备份和校验机制,在此基础上给出了汇编器框图,并实现了支持LT-SP2的汇编器。实验结果证明,所设计的汇编器功能正确,提升了流计算系统的容错性能。
- 佘增辉樊晓桠张萌
- 关键词:汇编器代码生成器流处理器容错
- 基于安卓平台的井控信息处理系统的设计实现被引量:10
- 2014年
- 介绍运行在平板电脑上基于安卓系统的井控信息处理系统的设计与实现。该系统采用多个智能化模块,涵盖了井队作业的所有流程,其中包括数据采集、系数设定、数据计算、数据存储和转储、智能报警、异常分析、数据检索等任务。显著提高了基层井队工人的作业效率、极大地缩短了发现异常并报警的时间,显著的增加了企业整体的效益。
- 高翔郭新东张凤兰管伟
- 关键词:数据记录安全事故