您的位置: 专家智库 > >

国家自然科学基金(61232009)

作品数:18 被引量:62H指数:3
相关作者:汪文祥肖利民兰雨晴王翔徐浩更多>>
相关机构:北京航空航天大学中国科学院大学龙芯中科技术有限公司更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
相关领域:自动化与计算机技术电子电信航空宇航科学技术理学更多>>

文献类型

  • 15篇期刊文章
  • 1篇会议论文

领域

  • 11篇自动化与计算...
  • 3篇电子电信
  • 2篇航空宇航科学...
  • 1篇天文地球
  • 1篇电气工程
  • 1篇一般工业技术
  • 1篇理学

主题

  • 4篇处理器
  • 3篇电路
  • 3篇多核
  • 3篇多核处理
  • 3篇多核处理器
  • 3篇一致性
  • 2篇虚拟化
  • 2篇虚拟化技术
  • 2篇图像
  • 2篇片上多核处理...
  • 2篇桌面
  • 2篇龙芯
  • 2篇面积优化
  • 2篇缓存
  • 2篇缓存一致性
  • 2篇SPICE
  • 1篇低功耗
  • 1篇电路模块
  • 1篇调度
  • 1篇调度算法

机构

  • 7篇北京航空航天...
  • 5篇中国科学院
  • 5篇中国科学院大...
  • 5篇龙芯中科技术...
  • 2篇河北农业大学
  • 1篇泰安市妇幼保...

作者

  • 4篇肖利民
  • 3篇汪文祥
  • 2篇兰雨晴
  • 2篇王翔
  • 1篇孟小甫
  • 1篇吴瑞阳
  • 1篇王焕东
  • 1篇王克俭
  • 1篇阮利
  • 1篇胡伟武
  • 1篇李玲
  • 1篇陈李维
  • 1篇张广飞
  • 1篇曾露
  • 1篇陈新科
  • 1篇霍志胜
  • 1篇傅杰
  • 1篇夏庆新
  • 1篇张爽爽
  • 1篇任彤

传媒

  • 4篇高技术通讯
  • 2篇计算机工程与...
  • 2篇北京航空航天...
  • 2篇Fronti...
  • 1篇Journa...
  • 1篇兰州大学学报...
  • 1篇微电子学
  • 1篇导弹与航天运...
  • 1篇中国科学:信...

年份

  • 1篇2022
  • 1篇2021
  • 1篇2019
  • 5篇2015
  • 4篇2014
  • 4篇2013
18 条 记 录,以下是 1-10
排序方式:
基于BABFA的XNOR/OR电路面积优化被引量:1
2022年
基于XNOR/OR的固定极性Reed-Muller(FPRM)电路面积优化是当前集成电路设计领域的研究热点之一。由于基于XNOR/OR的FPRM电路面积优化属于组合优化问题,提出了一种二进制自适应细菌觅食算法(BFA)。该算法在复制操作中加入概率模式,提高种群多样性,采用模糊规则对复制概率和迁移概率进行修正,提高算法的收敛速度。使细菌在邻域内进行搜索,替代细菌群体感应机制中的斥力操作,细菌无需感应其他个体位置对其的影响。提出一种基于XNOR/OR的FPRM电路面积优化方法,利用提出的二进制自适应细菌觅食算法搜索电路面积最小的FPRM电路。基于MCNC Benchmark电路的实验结果表明:面积最大优化率为18%,时间最大节省率为46%。
周宇豪何振学梁新艺范新超霍志胜肖利民
关键词:面积优化模糊规则
一种CMOS温度传感器的设计及其应用被引量:3
2014年
提出了一种新的对温度传感器输出电压进行微调的电路和方法。利用温度自适应模块调节输出电压与温度关系曲线的斜率,并添加CMOS减法电路以调节曲线的截距。该电路结构简单,相比用电平平移电路和比例电路对输出电压进行微调,有更大的优越性。将该温度传感器,包括自适应模块与减法模块,用于稳定环形振荡器的输出频率,取得了较好的效果。
曾梓臻夏同生王翔
关键词:环形振荡器
一种面向大规模音乐库的音乐推荐方法
文中提出一种满足大规模音乐库检索要求的音乐推荐方法。音乐推荐系统是音乐信息检索领域的研究热点,目前的主流系统能够实时处理百万量级的音乐库,但在线音乐库的规模已突破千万量级,因而难以满足用户的检索要求。该文给出的方法以音乐...
郑尧肖利民唐文琦姚光超阮利
关键词:GPU加速
文献传递
基于OR1200的多层次协同功耗设计
2014年
提供一种基于OpenRisc的多层次协同低功耗设计,搭建了基于OpenRisc 1200(OR1200)的片上系统(SoC),并通过寄存器传输级、系统级和门级3个层次对SoC进行了低功耗设计。利用设计的门控时钟模块和电源管理模块以及系统级程序协调,以实现SoC的休眠以及唤醒功能;使用Synopsys公司的Design Compiler软件对整个系统的门级电路插入集成门控时钟电路,使动态功耗大幅降低,从而实现了多层次协同低功耗设计。
张溢王翔卢颖赵泽西
关键词:低功耗门控时钟动态电源管理
基于改进烟花算法的MPRM逻辑电路面积优化被引量:2
2021年
针对现有混合极性(MPRM)逻辑电路面积优化效果较差的问题,提出一种基于改进烟花算法的MPRM逻辑电路面积优化方法 .充分利用烟花算法的爆发性、多样性和分布并行性等优点,通过对高斯变异进行改进,增强了烟花算法搜索MPRM逻辑电路最佳面积极性的性能.基于北卡罗来纳微电子中心基准测试电路的实验结果表明,与基于遗传算法的MPRM逻辑电路面积优化方法相比,平均电路面积减少了44.46%;与基于离散粒子群算法的MPRM逻辑电路面积优化方法相比,平均电路面积减少了34.66%.
潘钰华何振学王克俭
关键词:面积优化逻辑综合
基于NUMA架构的解释器访存优化设计与实现
2015年
为了提高非一致内存访问(NUMA)架构虚拟机解释器的访存性能,研究了解释器在NUMA架构下的访存优化技术,提出了一种NUMA架构下的解释器访存优化方案,而且设计并实现了解释器的静态指令分派优化方法和动态指令分派优化方法。根据这一方案虚拟机启动时首先获取NUMA节点信息,并在每个NUMA节点中自动生成解释器所需的全部数据结构;解释器在运行时,通过静态或动态的指令分派技术来实现其执行线程在NUMA节点上访存的局部化。试验结果表明,上述方法能够显著提升解释器在NUMA系统中的性能。在DaCapo测试集上的总体性能提升了8%,最高性能提升幅度高达23%,而且算法实现代价低,适用于绝大多数的NUMA服务器系统。
任彤傅杰靳国杰
关键词:虚拟机解释器响应速度启动性能
片上多核处理器的区域共享的双粒度目录
2015年
研究了双粒度目录(DGD)下片上多核处理器的访存行为以及DGD对不同共享行为的目录开销,以进一步降低DGD结构的面积开销。针对DGD需要为共享缓存区域创建额外的块目录项的问题,提出了创新的区域共享的双粒度目录(RSDGD)结构。该结构可用一个区域共享目录项同时维护最多3个共享者共享同一个缓存区域的一致性,从而能有效减少所需的块目录项数量,降低总的目录开销。实验结果表明,和原有的DGD相比,该结构平均减少了25%的目录空间需求,而仅产生了不到0.6%的性能损失。该结构有效地降低了芯片的面积开销,提高了目录结构的可伸缩性。
曾露陈新科王焕东
关键词:片上多核处理器缓存一致性区域共享
EDOA: an efficient delay optimization approach for mixed-polarity Reed-Muller logic circuits under the unit delay model被引量:1
2019年
Delay optimization has recently attracted signif-icant attention. However, few studies have focused on the delay optimization of mixed-polarity Reed-Muller (MPRM) logic circuits. In this paper, we propose an efficient delay op-timization approach (EDOA) for MPRM logic circuits under the unit delay model, which can derive an optimal MPRM logic circuit with minimum delay. First, the simplest MPRM expression with the fewest number of product terms is ob-tained using a novel Reed-Muller expression simplification approach (RMESA) considering don't-care terms. Second, a minimum delay decomposition approach based on a Huffman tree construction algorithm is utilized on the simplest MPRM expression. Experimental results on MCNC benchmark cir-cuits demonstrate that compared to the Berkeley SIS 1.2 and ABC, the EDOA can significantly reduce delay for most cir-cuits. Furthermore, for a few circuits, while reducing delay, the EDOA incurs an area penalty.
Zhenxue HELimin XIAOFei GULi RUANZhisheng HUOMingzhe LIMingfa ZHULongbing ZHANGRui LIUXiang WANG
关键词:DELAYLOGICCIRCUITSUNITDELAY
用于多核同步优化的cache一致性协议设计
2013年
通过对多核同步过程中的访存行为进行分析,提出了一种识别同步类型的方法,并设计了一种实现同步优化的新的cache一致性协议。该协议增加了一个用于记录同步信息的cache状态,通过阻塞的方式可以让多个处理器核串行地完成同步操作,保证同步操作中原子指令能够顺利执行成功,从而大大减少由多核同步冲突引发的访存请求数量,将多核同步过程中的访存行为优化到了几乎最好的情况。实验结果表明,通过同步优化,这个新的cache一致性协议能够使多核同步的性能提升到接近最理想的结果。实验表明,相比传统的cache一致性协议,实验中采用的几个标准多核性能测试程序优化后的同步性能提升了1倍,而并行程序整体运行时间降低25%。
陈李维张广飞张广飞汪文祥王焕东
关键词:CACHE一致性协议
龙芯UNCACHE加速原理及其在系统图形性能优化中的应用被引量:2
2015年
针对当前采用独立显卡的桌面计算机系统架构普遍存在的CPU(中心处理单元)访问GPU(图形处理单元)存储空间数据传输延迟较大的瓶颈,采用了龙芯GS464处理器核心实现的UA(uncache acceleration)机制对GPU驱动程序中的GPU存储空间访问接口进行优化,极大地提高了处理器向GPU等IO存储空间连续数据写入的速度。详细分析了龙芯处理器uA机制的原理及其相对于uncache方式IO写所能带来的性能提升。通过UA机制优化了龙芯3A+2H平台的GPU驱动性能,x11perf测试结果显示,采用UA优化GPU驱动后,Xserver的一些接口性能提升达5%~230%。将龙芯处理器的UA机制封装到了标准MMAP系统调用,并通过该扩展后的系统调用优化了Xserver的Xvideo扩展接口,实验结果显示,播放常见较高分辨率视频时该接口性能能够有6~12倍的性能提升。
张爽爽孟小甫汪文祥高翔
关键词:UA图像
共2页<12>
聚类工具0