许宏杰
- 作品数:22 被引量:68H指数:6
- 供职机构:西安航空计算技术研究所更多>>
- 发文基金:国家科技重大专项中国人民解放军总装备部预研基金武器装备预研基金更多>>
- 相关领域:自动化与计算机技术电子电信航空宇航科学技术更多>>
- 一种基于GPU的主机接口设计与验证被引量:1
- 2020年
- 对于性能要求极高的GPU核,为了解决其与CPU进行高速数据通信的需求,设计了一种基于PCIe DMA为核心的高速主机接口,峰值通信速率可达16 Gb/s(x4),实现了寄存器通路以使CPU对GPU内核寄存器配置,实现了DMA通道以使CPU与GPU内核间高速进行图形数据传输;因设计复杂、规模大、要求主机接口模型能模拟CPU行为,采用UVM标准化验证架构实现其虚拟仿真平台,实现了与C交互的DPI接口以使软件激励模拟CPU的行为,该平台高效、可重用并具有良好的鲁棒性,经过性能仿真统计DMA数据传输有效带宽完全满足高速数据传输的需求,且性能稳定。
- 王世中田泽田泽许宏杰张骏
- 关键词:GPU主机接口PCIE
- ARINC 659总线接口芯片的FPGA原型验证被引量:9
- 2009年
- ARINC 659总线是一种高速高可靠性的航空电子机架内部总线,主要用于机架内部各个在线可更换模块之间的通信。介绍了ARINC 659总线的结构和基于该总线结构开发的一种小型化高集成度的总线接口芯片。为了进行该芯片的原型验证,开发了基于ARINC 659总线架构的FPGA原型验证平台。描述了FPGA验证逻辑的结构,并举例说明了具体的验证流程和验证结果。实验证明,使用该平台和相应的验证流程,极大地提高了验证效率,为芯片的成功投片提供了可靠的保证。
- 郭亮李玲田泽许宏杰
- 关键词:ARINCFPGA原型验证
- 低功耗X86指令译码部件的设计与实现
- 2020年
- 随着处理器设计技术和半导体制造工艺的进步,芯片的规模和复杂度急剧增大,不断提升的功耗密度对系统工作的可靠性和稳定性造成很大影响,“功耗墙”已经成为提升处理器性能的最大障碍。介绍了低功耗设计的基本原理,结合X86指令集的特点,设计了一种X86指令译码器,并在体系结构层次上,提出从指令预取队列和译码队列两个不同角度对X86指令译码器进行低功耗设计的方法。基于SMIC 180 nm CMOS工艺,采用Synopsys DC工具进行了综合实现,并对译码器低功耗设计效果进行了评估。结果表明,在几乎不影响速度和面积的前提下,指令译码器关键数据通路寄存器平均翻转率降低了17.16%。
- 张骏张骏任向隆田泽刘航
- 关键词:微处理器低功耗指令译码X86
- 一种流水处理的HSV调整电路的设计与实现被引量:1
- 2019年
- 数字图像处理技术的高速发展需要更加强大的高性能图形处理器提供支持.为了满足图形处理器在RGB颜色空间进行视频图像处理时,可以单独改变某个颜色属性(色度、饱和度或亮度)来调整视频图像显示效果而不影响其它属性的需求,本文研究一种流水处理的HSV调整电路的设计与实现.采用RGB到HSV颜色空间转换、HSV调整和HSV到RGB颜色空间转换关键模块设计电路,重点实现了核心模块HSV调整.最终,通过模块级仿真验证、系统级虚拟仿真验证和FPGA原型验证完成了HSV调整电路的验证实现,验证结果表明本设计功能和性能满足需求,实现了流水处理的HSV调整功能,从而达到理想的视频图像处理效果.
- 徐晓梅田泽任向隆任向隆许宏杰张骏范飞虎
- 关键词:视频图像RGBHSV
- 高速1553BIP核的设计与实现被引量:10
- 2009年
- 随着MIL-STD-1553B总线在航空、航天等军事领域的综合电子信息系统中的广泛应用,系统应用对1553B协议处理器的高传输率、高可靠性以及小型化提出了更高的需求,采用传统专用芯片的方案已经不能很好地满足应用需求。从上述需求出发,文中全面描述了高速1553BIP的功能结构以及各功能模块的设计与实现。目前,1553BIP已经过MPW投片验证,样片的性能测试和系统应用验证结果表明,1553BIP完全符合MIL-STD-1553B协议,支持10 Mbps高速数据通信。
- 许宏杰田泽袁晓军
- 关键词:协议处理器IP核多时钟域
- 基于图元光栅化触发的高效GPU深度数据预取
- 2022年
- 数据预取技术已经广泛应用在各类中央处理器(CPU)设计领域,取得了很好的效果。而图形处理器(GPU)对存储带宽的需求更为巨大,与图形渲染流水线和图形算法直接相关,且数据访问模式与通用CPU有显著差异,需要更有针对性的有效数据预取机制。针对GPU深度测试关键功能,本文提出一种图元光栅化触发的高效深度数据预取机制——DPRT,通过图元光栅化过程中实时扫描到的片段块地址来触发Z缓存(Z Cache)的深度数据预取,同时为了适应不同实现中流水线处理延迟,为Z Cache数据块增加访问一次标志(OTT),保证深度数据预取有效性。实验结果表明,DPRT使深度测试时Z Cache访问命中率平均提升9.51%,深度测试延迟平均降低40.43%。
- 田泽田泽许宏杰
- 关键词:光栅化
- 基于扫描线填充的三角形图元双向光栅化技术被引量:9
- 2015年
- 光栅化是图形处理器3D引擎流水线的关键阶段,实现了从连续方式描述的图形到离散的像素点间的转换,如何提高光栅化效率是图形处理器设计的关键技术之一.本文分析了基于Bresenham算法的线填充算法,提出一种基于扫描线填充算法的三角形图元双向光栅化技术,称为BSF,实现了同时从两个方向对三角形图元进行光栅化,将三角形光栅化效率提升约39.02%,代价是增加了光栅化单元的规模和复杂度.基于BSF设计了光栅化单元,并采用Xilinx的ISE工具进行综合,在Xilinx Vertex6 XC6VLX760 FPGA上进行原型验证,电路工作频率可以达到202M Hz,测试结果表明可以正确快速的实现光栅化功能.在SMIC 65nm CMOS工艺下,采用Synopsys Design-Compiler对光栅化单元进行综合,电路工作频率达到330MHz,满足设计需求.
- 田泽刘天江张骏许宏杰黎小玉
- 关键词:图形处理器光栅化扫描线BRESENHAM
- ARINC659芯片协议符合性验证关键技术研究被引量:5
- 2013年
- ARINC659总线主要用于机架内部各在线可更换模块(LRM)间的通信。在ARINC659芯片设计过程中,如何对协议符合性进行充分验证是确保芯片设计符合协议的关键和核心。本文首先对ARINC659总线产生的背景及ARINC659协议及总线协议处理芯片进行了概述,并结合ARINC659总线协议处理芯片对芯片协议符合性验证中的关键技术进行了分析和研究。
- 田泽郭亮刘宁宁许宏杰王泉邵刚
- 关键词:芯片验证
- 一种流水处理图元建立电路的设计与实现被引量:1
- 2019年
- 为了提高图形处理器的图形绘制能力,本文设计了一种能够流水处理的图元建立电路,实现了OpenGL定义的9种图元到点、线和三角形简单图形的转换,可有效降低图形流水线后续单元任务的复杂度.提高图形绘制性能.通过虚拟仿真和FPGA原型验证确认,实现了基本图元的建立功能,频率能够达到400MHz以上,三角形建立峰值可达380M/s.
- 裴希杰田泽郑新建郑新建许宏杰张骏
- 关键词:OPENGL
- 一种高效的视频编码系统存储器接口的验证被引量:1
- 2014年
- 存储器接口是某高清音视频编码芯片的核心IP之一,用于快速高效地存储和读取编码过程中产生的大量中间数据,主要包括运动估计、宏块信息、去块滤波和码流数据等,因此对其功能正确性的验证具有重要意义。由于采用传统的定向测试方法对其验证很难遍历到所有情况,而将定向测试和随机测试两者结合起来,能大量减小测试向量的开发。文中提出一种存储器接口验证解决方案,通过对仿真验证结果和代码覆盖率的统计分析,证明采用该方法能高效地检查出设计的缺陷,缩减了验证花费的时间。
- 杜斐田泽许宏杰卢俊
- 关键词:测试用例