您的位置: 专家智库 > >

国家高技术研究发展计划(2006AA01A102-5-2)

作品数:5 被引量:8H指数:2
相关作者:安虹王耀彬徐光周丽萍闫洁更多>>
相关机构:中国科学院中国科学技术大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 1篇多核
  • 1篇优先权
  • 1篇数据依赖
  • 1篇体系结构
  • 1篇评测
  • 1篇系统评测
  • 1篇流体系结构
  • 1篇DRAM
  • 1篇并行化
  • 1篇并行性
  • 1篇并行性分析

机构

  • 5篇中国科学院
  • 4篇中国科学技术...

作者

  • 5篇安虹
  • 2篇王耀彬
  • 2篇徐光
  • 1篇姚平
  • 1篇王莉
  • 1篇汪芳
  • 1篇路璐
  • 1篇曾斌
  • 1篇许牧
  • 1篇周丽萍
  • 1篇郭锐
  • 1篇闫洁

传媒

  • 3篇小型微型计算...
  • 2篇计算机科学

年份

  • 4篇2010
  • 1篇2009
5 条 记 录,以下是 1-5
排序方式:
激进块执行模型的数据依赖分析被引量:2
2010年
激进执行模型可以有效利用片上资源开发指令级并行性,与超块概念的结合又使得这一技术具有更好的适用性,但是数据依赖的存在很大程度上削弱了激进的块执行的实际效果,本文从块间数据依赖的分布、依赖深度和推测执行深度几个方面对块执行模型的数据依赖进行了分析;实验表明应用程序中固有的推测执行深度一般不超过10(4~8).此外本文也对寄存器值预测对激进块执行模型的块间数据依赖的影响进行了分析.
张军安虹从明任永青赵灿明
关键词:数据依赖
面向应用的流存储系统评测与改进
2010年
有限的片外存储带宽是制约流处理器性能提升的瓶颈之一,流存储系统已经采用了多种方式来缓解这个问题,但当前的设计并没有充分考虑应用具体的访存模式对有效带宽利用率的影响.通过分析和实验,评估流存储系统主要设计参数对不同访存模式的优化效果;在此基础上针对不同的流访问并行度提出了相应的结构改进,加入宽发射和短作业优先调度支持,充分挖掘存储访问的局部性和并行性,改善了负载平衡,从而有效地提高了片外带宽的使用效率和流程序的整体性能.
汪芳安虹徐光许牧姚平
关键词:DRAM
多媒体基准测试程序中的流并行性分析被引量:3
2009年
在分析多媒体基准测试程序Mediabench特征的基础上,以Imagine流处理器为例讨论了流体系结构对多媒体应用所提供的软硬件支持,并且利用流编程模型对多媒体应用中存在的流并行性进行了详细的剖析,最后通过对3个典型的多媒体应用进行流并行程序设计,在Imagine的时钟精确模拟器Isim上测试得到了多媒体应用在流体系结构上可以获得的加速性能。
周丽萍安虹徐光王耀彬
关键词:流体系结构
用线程级推测技术在多核体系结构上并行化科学计算应用被引量:2
2010年
线程级推测技术使在多核上加速传统上难以手工或自动并行化的串行程序成为可能,它不仅需要合理地选择线程的划分策略,而且需要合理地选择适合推测执行的应用.已有的大量研究主要集中在如SPEC CPU这样的桌面应用领域,为了全面地认识TLS技术的应用适用性,本文探讨TLS技术对科学计算应用的性能提升潜力,提出一套TLS适用性的基本判定准则,实验结果表明采用该技术加速SPLASH2中的多数应用可以有效利用16核及以上的计算资源.
王耀彬安虹郭锐闫洁路璐
关键词:多核
基于剖析信息和关键路径长度的软件扇出树生成算法被引量:1
2010年
开发利用ILP(Inst ruction-level Parallelism)是现代高性能处理器取得高性能的关键要素之一。宽发射的超标量处理器、超长指令字处理器和数据流处理器只有在并行执行多条相邻的指令时才能获得较高的性能。数据流处理器的一个关键问题是如何把指令的计算结果高效地播送给目标指令而不用读写集中式寄存器文件。对于每条目标数大于指令所能编码的目标数的指令,编译程序都要插入一棵由MOV指令构成的软件扇出树来把计算结果播送给多条目标指令。为了暴露更多的ILP给硬件执行基底,提出了一种改进的软件扇出树生成算法,本算法根据目标指令的执行概率大小以及目标指令到该指令所在块的出口的关键路径长度来计算目标指令的权值,然后对各个叶子的优先权值进行排序,再根据优先权值的顺序来构造一棵软件扇出树,以便把指令的计算结果播送给多条目标指令。实验结果发现,本算法相对于传统的软件扇出树生成算法其性能有较大的提高。
曾斌安虹王莉
关键词:优先权
共1页<1>
聚类工具0