夏凯锋
- 作品数:5 被引量:6H指数:2
- 供职机构:中国科学院微电子研究所更多>>
- 发文基金:国家科技重大专项国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 任意2^k点存储器结构傅里叶处理器
- 2016年
- 针对任意,点数快速傳里叶变换(FFT)运算,设计并实现一种拥有并行地址无冲突策略的存储器结构FFT处理器.该策略可以支持原位回存,连续帧计算模式,可变多种点数和任意,长度的FFT运算.通过这种地址策略,FFT处理器所能达到的吞吐率由每一级抽取时的限制条件集合个数所决定.因此这种地址策略可以通过改变计算单元基底和调整计算单元并行度的方式可控地调整吞吐率.为了验证本地址策略的可行性,设计一款应用于长期演进(LTE)系统的128-2048点的可配置FFT处理器.处理器采用中芯国际55nmCMOS工艺实现,在122.88MHzX作频率下内核面积为0.615mm^2,功耗为32.4mW.FFT处理器的ASIC结果表明所提策略具有优秀的计算长度灵活性,硬件效率,可以支持任意,长度的FFT计算.
- 夏凯锋周小平吴斌
- 用于MIMO-OFDM系统QR分解的分布式脉动阵列处理算法被引量:4
- 2012年
- 针对多载波系统中信道矩阵QR(正交三角矩阵)分解的延时问题,该文提出适用于MIMO-OFDM系统QR分解的分布式脉动阵列处理(Distributed Systolic Array Processing,DSAP)算法。该算法包含两种处理机制,一是交织预处理,对不同子载波信道矩阵行矢量进行分组交织处理,按照延时递增规律将每列信道矩阵元素读出并输入到脉动阵列;二是分布式脉动阵列计算,通过脉动阵列边界单元和内部单元中流水线CORDIC计算和子载波同步处理实现信道矩阵QR分解分布式处理,实现不同子载波QR分解分布于脉动阵列边界单元和内部单元中CORDIC不同级。与串行脉动阵列处理(Serial Systolic Array Processing,SSAP)算法比,DSAP算法充分利用时钟周期,分解延时约为SSAP算法的8%,有效减少数据处理延时,而复杂度几乎没有增加。
- 朱勇旭吴斌周玉梅蔡菁菁夏凯锋
- 任意点存储器结构FFT处理器地址策略被引量:2
- 2017年
- 提出一种针对任意点数运算的并行地址无冲突的存储器结构的FFT处理器.该方法利用高基底的分解方法减少整体计算时钟周期,以及小基底互联的多路延迟交换结构降低计算引擎的复杂度.该方法可以将存储器结构FFT处理器中的几个重要特性如连续帧处理模式,多点数计算和并行无地址冲突等特点集成在一起.另外,素因子FFT算法也被运用到该处理器当中用以降低乘法器个数和蝶形因子存储,以及满足任意点数的计算需求.设计了一种统一的基-2,3,4,5的Winograd算法的蝶形计算单元用以降低计算复杂度.实验仿真结果表明,本FFT处理器在122.88MHz工作频率下功耗只有40.8mW,非常适合LTE系统的应用.
- 夏凯锋周小平吴斌
- 下行发射机系统及工作方法
- 本发明提供了一种下行发射机系统及工作方法,用于支持两路码字在双天线信道中的传输,包括处理模块、层映射模块、预编码模块和资源映射模块。处理模块对输入的两路码字进行一路码字方向的分时串行处理,得到码字串行数据流;层映射模块对...
- 孙璐王洲吴斌申山山夏凯锋刘振
- 文献传递
- 下行发射机系统及工作方法
- 本发明提供了一种下行发射机系统及工作方法,用于支持两路码字在双天线信道中的传输,包括处理模块、层映射模块、预编码模块和资源映射模块。处理模块对输入的两路码字进行一路码字方向的分时串行处理,得到码字串行数据流;层映射模块对...
- 孙璐王洲吴斌申山山夏凯锋刘振
- 文献传递