贺光辉 作品数:29 被引量:99 H指数:6 供职机构: 上海交通大学电子信息与电气工程学院 更多>> 发文基金: 国家自然科学基金 国家电网公司科技项目 国家教育部博士点基金 更多>> 相关领域: 电子电信 自动化与计算机技术 更多>>
一种上行链路大规模MIMO系统的低复杂度检测算法 被引量:3 2017年 提出了一种适用于上行链路大规模MIMO系统的基于Kaczmarz算法的低复杂度检测算法.通过将MMSE检测算法转化成等效的增广矩阵的形式,提出的算法同时避免了直接矩阵求逆和Gram矩阵求解.此外,一种算法初始值的估计方法和近似的软判决信息计算方法也被提出用于进一步降低算法复杂度.仿真结果表明该算法在性能和计算复杂度方面优于近期文献中的算法.同时,FPGA的验证结果也表明提出的算法能以更低的硬件资源消耗完成大规模MIMO系统的检测. 丁春辉 贺光辉关键词:信号检测 MMSE 基于直方图的白平衡算法的研究 被引量:5 2018年 针对常见基于直方图的白平衡算法对于RGB各通道直方图相似度低时失效的问题,提出了一种基于直方图匹配改进的自动白平衡算法.利用RGB通道直方图的相似度对基于直方图匹配的白平衡算法增加有效性判断,对于直方图相似度低的图片采用直方图平移算法处理.结合直方图匹配与直方图平移的特点,弥补单个算法的不足.通多对大量图片测试表明,该算法对图像偏色有较好的矫正效果,且适用范围提高了11%. 魏超 贺光辉关键词:白平衡 直方图匹配 直方图平移 色偏 一种多数据集混合累加电路设计 2016年 提出了一种包含输入缓存FIFO、加法器及其控制逻辑、存储单元三个部分的电流注入累加模块(Node Injected Current Accumulation,NICA),解决了流水线阻塞大,控制逻辑复杂、累加混合的问题,并在此基础上采取分批处理的方式,减少了累加的延时,最终节省了硬件资源.在Virtex-7 690T开发板上综合布线后,得到了较好的硬件资源消耗结果,满足了EMTP系统的实时性仿真要求. 胡浩 贺光辉关键词:电磁暂态仿真 FPGA 流水线 累加器 用于实时目标检测的FPGA神经网络加速器设计 被引量:5 2020年 在FPGA上实现YOLO等目标检测算法,需要从模型量化到硬件优化等多种优化方法.为了缩短硬件延时,使用了三种技术:(1)利用层融合和位宽量化策略来降低计算复杂度;(2)利用具有padding跳过技术的基于列的流水线架构来减少启动时间;(3)利用设计空间探索算法来平衡流水线时间,提高DSP使用效率.为了验证提出的神经网络加速器架构,在ZC706 FPGA上实现了具有1280×384输入的YOLO网络.与传统加速器相比,取得了1.97倍的延迟缩减或者1.54倍的DSP效率提升. 李岑 贺光辉关键词:低延时 基于FPGA的卷积神经网络硬件加速器设计空间探索研究 被引量:2 2020年 为了解决基于FPGA的卷积神经网络硬件加速器资源分配的问题,提出一种基于细粒度流水线架构的设计空间探索方法.为了提高吞吐率,该方法主要使用了三种技术:1)通过对DSP进行多阶段分配,实现各级流水线平衡;2)利用可调节的中间值缓存,协调BRAM和DDR带宽资源;3)利用深度可分解卷积替换部分卷积层,减少网络整体计算量.为了验证提出的设计空间探索方法,在ZC-706FPGA上实现了YOLO2-tiny网络,结果表明与同类设计相比,本设计的吞吐率与能效比高,整体延时低. 郭谦 贺光辉关键词:设计空间探索 一种面向Chiplet互连的高效传输协议设计与实现 被引量:2 2023年 高效、高带宽、高可靠性的传输协议对于Chiplet异构集成技术有着至关重要的作用。为此,提出了一种面向Chiplet互连的并行传输接口协议。采用新型分层架构提升协议的灵活性和可兼容性;通过基于多路选择链的冗余通道技术提高对物理链路故障的容错性,并在硬件上实现循环冗余校验,从而提升协议的传输可靠性。为了验证提出的传输协议,在2块VC709 FPGA上实现了协议传输通路。实验结果表明,与PCIe相比,所提协议具有带宽高、接口面积小、可靠性高的优势。 熊国杰 张津铭 贺光辉关键词:互连协议 高带宽 高可靠性 基于随机计算的大规模MIMO检测算法研究与硬件实现 被引量:1 2020年 为了减少大规模MIMO检测算法的复杂度以适应第五代移动通信系统的要求,本文提出了一种基于随机计算的低复杂度线性检测算法.随机计算把传统二进制数转化为一串01序列,使得复杂的计算电路能通过简单的门逻辑实现,从而大幅度的降低硬件资源消耗.通过采用基于二段分解的随机计算矩阵乘法器,检测算法的计算消耗大大降低.此外,我们通过Vivado HLS实现了基于随机计算的预处理共轭梯度算法.仿真结果表明,该算法在128×8规模的大规模MIMO系统,误比特率为10^-6时,和最优检测性能误差小于0.2 dB;而FPGA结果表示,基于随机计算的检测算法不需要采用任何DSP,同时能节省20.7%的寄存器消耗. 熊海翡 贺光辉格基规约算法在MIMO检测中的应用 被引量:1 2015年 研究了格基规约(lattice reduction,LR)技术中的LLL(Lenstra-Lenstra-Lov’asz)算法,以及格基规约辅助(LR Aided,LRA)的多输入多输出系统(multiple input multiple output,MIMO)检测技术,重现了已有的多种LRA低复杂度检测算法的结果,探讨了LR与MIMO检测的本质,继而提出了一种带边界限定的格基规约辅助的选择性的快速枚举展开算法。仿真结果表明:LLL算法能大幅度提高矩阵的正交性,使低复杂度MIMO检测算法的性能接近最优检测;而本文提出的改进算法能进一步逼近最优检测的性能,使误码率为10-4时,和最优检测算法的检测性能仅差0.8dB。 秦小波 贺光辉 马骏关键词:树搜索 一种低复杂度近最优大规模MIMO检测算法 被引量:2 2020年 为了提升大规模MIMO(Massive Multiple-input Multiple-output)检测算法的性能并降低其复杂度,本文提出了一种基于连续替换Richardson迭代的低复杂度近最优检测算法.该算法采用连续替换策略,提升了传统Richardson迭代的收敛速度;除此之外,提出了基于特征值估计的初始化策略,在较低的复杂度下进一步提升了算法性能.仿真结果表明该算法对比传统Richardson迭代性能提升显著,且在128×16规模MIMO系统中,当迭代次数为2,误比特率为10-4时相对于MMSE仅有0.06 dB的性能损失,而相对于Jacobi算法有2 dB的性能提升,算法复杂度降低了10.8%.文章还给出了该算法在Xilinx Virtex-7 FPGA平台的硬件实现结果,较其他算法有更高的吞吐率,达到了10.3 Mbps. 陈曦 吴天宝 龚奕宇 吕东旭 贺光辉关键词:MIMO 40nm工艺下反向窄沟道效应对VLSI电路设计的影响 被引量:1 2014年 反向窄沟道效应(INWE)是纳米级工艺下较为明显的版图效应,它使MOS管阈值电压Vth随着OD(扩散区)宽度的下降而下降,由此使得饱和电流Idsat提高并最终影响器件的速度.重点阐述了产生INWE的原因,同时将INWE考虑在标准单元库的设计当中.以TSMC N40LP 12T标准单元库为基础,根据INWE现象重新对电路结构(Circuit Structure)和版图(Layout)进行设计,最终能够在原有版图面积下整体性能提升5%以上,整体功耗升高控制在2%以内,从而得到有着更好PPA(Power Performance Area)指标的标准单元库器件. 郑凯磊 贺光辉关键词:版图设计