您的位置: 专家智库 > >

国家重点基础研究发展计划(2005CB321601)

作品数:21 被引量:48H指数:4
相关作者:安虹王耀彬王莉徐光汪芳更多>>
相关机构:中国科学院中国科学技术大学中国人民解放军陆军军官学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术自然科学总论更多>>

文献类型

  • 21篇中文期刊文章

领域

  • 20篇自动化与计算...
  • 1篇自然科学总论

主题

  • 7篇处理器
  • 4篇片式
  • 3篇流处理器
  • 3篇龙芯
  • 3篇并行性
  • 3篇并行性分析
  • 2篇带宽
  • 2篇体系结构
  • 2篇龙芯2号
  • 2篇编程
  • 2篇编程模型
  • 2篇并行化
  • 1篇调度
  • 1篇动态优化
  • 1篇堆栈
  • 1篇多核
  • 1篇多线程
  • 1篇性能分析
  • 1篇性能监测
  • 1篇优先权

机构

  • 19篇中国科学院
  • 16篇中国科学技术...
  • 1篇中国科学院研...
  • 1篇中国人民解放...

作者

  • 18篇安虹
  • 8篇王耀彬
  • 5篇王莉
  • 5篇汪芳
  • 5篇徐光
  • 4篇任永青
  • 4篇路璐
  • 3篇姚平
  • 3篇许牧
  • 2篇郇丹丹
  • 2篇刘谷
  • 2篇胡伟武
  • 2篇曾斌
  • 2篇周丽萍
  • 2篇李祖松
  • 2篇刘志勇
  • 2篇王剑
  • 2篇闫洁
  • 2篇从明
  • 1篇刘奇

传媒

  • 10篇小型微型计算...
  • 4篇计算机科学
  • 3篇计算机研究与...
  • 3篇计算机工程
  • 1篇计算机工程与...

年份

  • 2篇2012
  • 2篇2011
  • 9篇2010
  • 5篇2009
  • 1篇2008
  • 2篇2007
21 条 记 录,以下是 1-10
排序方式:
基于超块的激进执行模型可预测性分析
2010年
分析基于超块的激进执行模型中超块级预测可行性,给出满足超块级预测的预测器设计方案。对不同应用深度预测可行性高低、期望预测深度及其影响因素等进行论证。实验结果表明,大部分应用具有较高的期望预测深度,适合激进执行,但不同的应用期望深度相差较大。
赵灿明安虹任永青从明
组网雷达估测降水系统并行化方案的设计与实现被引量:5
2012年
国家气象局天气组网雷达定量估测降水系统不仅拥有较大的计算量,而且具有较大的数据吞吐量,同时对实时性要求较高。如果缩短其执行时间,无疑将会带来巨大的收益。鉴于这些特点,使用VTune Amplifer XE对串行程序进行了热点分析和并行性分析,得出程序中有较多线程级并行性,从而制定了相应的并行化方案;然后使用Win32多线程和OpenMP两种技术对该程序在Intel四核处理器平台上进行了并行化。程序主要由单站处理和组网处理两部分组成。由于计算资源的限制,并行后的单站处理程序只有大约10%的性能提升,而组网处理程序则可以达到近似线性的性能提升。通过调整计算负载,并行化版本的加速比可以达到5.5。最后,可以得出该并行化方法适用于计算密集且数据吞吐量较大的一类应用。
吴石磊安虹李小强周伟刘谷魏学超
关键词:并行性分析OPENMP
Pview:一种基于PMU的支持并行程序性能分析的新方法被引量:4
2011年
近年来,随着并行编程的普及,性能监测和剖析已经成为计算机系统领域最重要的研究课题之一。PMU(Performance Monitoring Unit),即现代处理器里集成的微体系事件性能计数器,为性能监测提供了底层支持,使得在以极小的额外开销和极少的对目标程序的干扰的情况下对程序进行性能监测成为可能。Pview(Performance View)是一种在系统级支持对并行程序尤其是多线程程序进行性能监测与分析的工具,它同时支持全系统和针对特定进程(线程组)的性能事件直接计数或者抽样的分析方法。Pview在Linux操作系统平台上通过扩展内核2.6.30,实现了一个新的系统调用Pview来提供性能监测服务;同时与以模块方式实现的数据收集引擎协作,可以实现抽样并将大规模样本数据传输到用户空间供进一步分析。
闫洁徐恒阳安虹刘玉王耀彬
关键词:性能监测
激进块执行模型的数据依赖分析被引量:2
2010年
激进执行模型可以有效利用片上资源开发指令级并行性,与超块概念的结合又使得这一技术具有更好的适用性,但是数据依赖的存在很大程度上削弱了激进的块执行的实际效果,本文从块间数据依赖的分布、依赖深度和推测执行深度几个方面对块执行模型的数据依赖进行了分析;实验表明应用程序中固有的推测执行深度一般不超过10(4~8).此外本文也对寄存器值预测对激进块执行模型的块间数据依赖的影响进行了分析.
张军安虹从明任永青赵灿明
关键词:数据依赖
Cache自适应写分配策略被引量:4
2007年
处理器所能提供的有效带宽是目前制约处理器性能提高的关键因素.通过对Cache写失效行为的分析,提出了一种新的提高处理器带宽利用率的Cache写失效处理策略——Cache自适应写分配策略.该策略在访存失效队列中收集全修改Cache块,对全修改Cache块采用非写分配策略,并能够自适应地切换为写分配策略.与传统的Cache写失效处理策略相比,Cache自适应写分配策略硬件代价小,避免了不必要的数据传输,降低Cache污染,减少存储管理队列阻塞的频率.结果表明,采用Cache自适应写分配策略,STREAM基准测试程序带宽平均提高62.6%,SPECCPU2000程序的IPC值平均提高5.9%.
郇丹丹李祖松胡伟武刘志勇
关键词:CACHE带宽龙芯2号
利用连续两阶段在线剖析优化多线程推测执行被引量:2
2009年
针对当前推测多线程优化中使用的离线剖析受到训练输入集限制的问题,提出一种根据在线剖析结果自动变换推测多线程程序的动态优化方法.该方法在程序运行时执行剖析和优化工作,不需要单独的剖析过程以及通用的训练输入集.该方法也适用于那些运行时行为特征呈阶段性变化的程序.实验表明,在指导事务划分和选择并行循环方面,动态优化方法能够达到和静态优化方法相似的效果,完全可以在离线剖析失效时被使用.
刘圆安虹汪芳王莉王耀彬
关键词:推测多线程事务存储动态优化
面向应用的流存储系统评测与改进
2010年
有限的片外存储带宽是制约流处理器性能提升的瓶颈之一,流存储系统已经采用了多种方式来缓解这个问题,但当前的设计并没有充分考虑应用具体的访存模式对有效带宽利用率的影响.通过分析和实验,评估流存储系统主要设计参数对不同访存模式的优化效果;在此基础上针对不同的流访问并行度提出了相应的结构改进,加入宽发射和短作业优先调度支持,充分挖掘存储访问的局部性和并行性,改善了负载平衡,从而有效地提高了片外带宽的使用效率和流程序的整体性能.
汪芳安虹徐光许牧姚平
关键词:DRAM
流处理器结构上数据并行类应用的开发和评估被引量:1
2008年
流处理器体系结构是一种针对流应用中固有的计算和数据流动特点提出的一种新型的处理器体系结构,它结合了向量和超长指令字体系结构的特点,能有效地加速流应用的执行,而它的适用领域一直是当前国际上的热点讨论问题.本文从数据并行应用4个不同领域——数字信号处理、科学计算、网络和安全、以及多媒体处理选取了4个典型应用,详细剖析了这些应用在流体系结构上的流并行程序设计过程,归纳出数据并行类应用的流化步骤和方法,通过实验对这类应用在流体系结构上的适用性做出评估.
王其刚安虹徐光周丽萍汪芳
关键词:流编程模型
众核结构上线程级推测执行能力评估器设计
2011年
由成百上千处理器核构成的众核处理器在提供大量计算能力的同时,也对如何高效利用资源提出挑战;具有不同并行度的应用对处理器核资源有不同的需求,不合理的分配会造成资源浪费(分配过多)或者限制并行性开发(分配过少).针对众核结构上串行程序线程级推测执行面临的处理器核资源分配问题,提出一种基于硬件的推测执行能力监测和评估机制,设计三种线程级推测执行能力评估器;该评估器能够根据串行程序推测执行能力的动态变化,对应用分配的处理器核资源数量进行实时调整.实验结果表明,利用一个硬件开销极小的评估器对众核平台上串行程序的线程级推测执行进行资源分配指导,即可使性能和资源利用率达到有效的平衡.
任永青安虹孙涛
关键词:资源利用率
分片式处理器上的谓词执行技术优化被引量:1
2012年
谓词执行能使分片式处理器充分利用众多的执行单元,开发指令级并行性.但因此形成的超块也使得分支误预测代价增大,所以提高分支预测器的性能至关重要.本文提出一种基于剖析信息决策的谓词执行技术,该技术利用剖析信息对谓词执行前后的执行周期进行估算,从而对分支的谓词执行进行决策.该技术使分支预测器的命中率提高了0.68%~3.50%,使系统性能提高了1.67%~8.33%.同时,利用select指令表示谓词化指令也消除了重命名阶段寄存器多定义问题.
邓春华安虹路璐王耀彬
关键词:谓词执行分支预测器
共3页<123>
聚类工具0