马安国
- 作品数:22 被引量:31H指数:3
- 供职机构:中国人民解放军更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学电气工程电子电信更多>>
- 基于CUDA平台的遗传算法并行实现研究被引量:12
- 2009年
- CUDA技术方便程序员在GPU上进行通用计算,但并没有提供随机数产生的应用接口。为此,本文提出并实现在CUDA开发平台上并行产生均匀随机数算法,测试证明算法可行。在此基础上优化基本遗传算法,并在GPU上并行实现其所有操作,提高其运行速度和准确度;分析了种群大小和遗传代数对此算法加速比及准确度的影响,并与MAT-LAB工具箱进行比较。实验表明,相比MATLAB遗传算法工具箱,基于CUDA平台实现的遗传算法性能更高,准确度更好。
- 谭彩凤马安国邢座程
- 关键词:随机数遗传算法GPGPUCUDAGPU
- 微体系结构软错误易感性阶段特性研究被引量:1
- 2012年
- 软错误易感性的阶段特性对微处理器进行动态容错管理是当前软错误研究领域的热点。针对体系结构弱点因子AVF是最常用的软错误易感性评估指标之一,提出了一种快速有效的AVF评估框架,对微处理器关键部件的AVF值进行评估。基于基本块和性能参数信息捕获部件软错误易感性的阶段特性,并利用k路划分和回归树算法对部件的软错误易感性进行阶段划分。实验结果表明,结合性能参数信息和回归树算法能够最好地对软错误易感性的阶段特性进行识别。
- 成玉马安国张承义张民选
- 关键词:可靠性评估软错误
- 一种基于延迟分配的寄存器栈优化策略
- 本文介绍了IntelItanium体系结构中的寄存器栈和寄存器栈引擎(RSE),Itanium采用编译器控制的栈寄存器分配技术以减少与程序调用相关的访存耗费,RSE根据栈寄存器使用情况自动地控制寄存器栈并实现寄存器和存储...
- 马安国邢座程
- 关键词:寄存器分配存储器数据传输
- 文献传递
- 高扇入与/或逻辑的设计与实现被引量:2
- 2008年
- 针对高性能浮点乘加部件中的应用需求,全定制设计了高性能52位或门和108位与门。设计中使用HSPICE工具进行电路模拟,模拟时使用CSM 0.13μm最慢工艺参数,电源电压为1.2 V,温度为25℃。根据各种实现方式的电路特性,使用相应的理论上电路最大延时的输入激励进行模拟,输入激励的频率为1.25 GHz,斜率为输入激励周期的10%。输出延时是每个输入周期中输入电压的50%到输出电压的50%之间的时间,最大延时是所有输入数据中的最长延时。根据不同的逻辑类型,设计实现了5种52位或门;选取了静态互补CMOS逻辑、np-CMOS逻辑两种直接实现的108位与门,并选取了多米诺逻辑间接实现方式。对比模拟结果可以得到,全定制设计实现的52位或门和108位与门在速度、功耗和面积方面都具有较优的综合性能。
- 梅林张静波马安国
- 关键词:全定制动态逻辑
- 用于通用流处理器的可变访存模式的片上缓存结构
- 本发明公开了一种用于通用流处理器的可变访存模式的片上缓存结构,包括存储阵列单元、cache控制器、scratchpadmemory控制器以及存储阵列边界分割逻辑单元,所述存储阵列单元由通过存储阵列边界分割逻辑单元分割成的...
- 邢座程付桂涛陈小保马安国黄平汤先拓何锐王庆林晏小波李方圆邱建雄蔡放闵银皮梅家祥孟晓冬赵齐王宏燕
- 文献传递
- 基于编译的寄存器分配性能与功耗优化策略
- 近年来,处理器的功耗不但严重阻碍微处理器性能的提高和处理器设计的发展,而且限制了移动处理设备的使用时间。同时,随着计算机的普及,计算机消耗的电能也越来越巨大。因此,低功耗研究已成为近来受到热切关注的领域。人们在硬件和软件...
- 马安国
- 关键词:低功耗编译器寄存器分配
- 一种规则驱动的数据传输方法
- 本发明公开了一种规则驱动的数据传输方法。本方法为:1)对每一候选的数据传输网络,对其历史分发任务进行约束条件分解,得到该网络每一历史任务的特征属性;2)确定每一网络历史任务的共同特征属性,根据该共同特征属性建立该网络的业...
- 黄瑞芳黄俊领陈鹏马安国刘金胜潘晏涛高宁赵思楠王晓鸣李雪飞孟雷申伟强赵文斌
- 文献传递
- 一种快速有效的L2 Cache可靠性预测方法被引量:1
- 2013年
- 随着集成电路工艺的不断进步,微处理器的软错误问题日益突出.体系结构弱点因子AVF(architectural vulnerability factor)作为可靠性评估指标之一,常用于软错误的评估.AVF在程序执行过程中呈现明显的动态变化特性,使得基于AVF预测的动态容错管理技术成为当前软错误研究领域的热门课题.即根据AVF的变化来动态选择是否对微处理器部件进行容错设计,从而在满足软错误可靠性要求的前提下尽量降低容错技术的开销.因此,基于L2 Cache AVF的动态特性研究,提出使用贝叶斯累加树模型BART(Bayesian additive regression trees)对L2 Cache AVF进行准确预测,并使用块搜索(bump hunting)技术来提取由少数几个性能参数组成的、对具有高L2 Cache AVF的执行阶段进行判定的规则,从而实现了对L2 Cache AVF的快速有效预测.
- 成玉马安国王永文唐遇星张民选
- 关键词:软错误
- SoC体系结构级功耗模拟与优化技术
- 集成电路制造工艺水平发展到超深亚微米阶段,SoC(System on Chip)的功耗问题越来越突出,成为继续提升性能的主要障碍.功耗的显著增加不但引起能源消耗和制造成本增加,而且给SoC工作的稳定性和可靠性带来严峻的挑...
- 邢座程马安国张承义李晋文周宏伟王永文
- 关键词:SOC低功耗体系结构模拟器
- GPU异构系统中的存储层次和负载均衡策略研究被引量:11
- 2009年
- GPU体系结构的革新和相应开发平台的发展使得GPU广泛地应用于科学计算领域。通过深入地分析GPU体系结构和存储层次的优缺点以及GPU上的关键性能特征,阐明了GPU体系结构、编程模型和存储层次之间的关系。针对GPU异构系统上的应用映射提出三种基本负载均衡优化策略:预取、流化、任务划分。试验结果揭示了不同的优化因子与优化效率之间的具体关联。
- 马安国成玉唐遇星邢座程
- 关键词:GPGPU负载均衡策略流计算