闫洁
- 作品数:3 被引量:7H指数:2
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- Pview:一种基于PMU的支持并行程序性能分析的新方法被引量:4
- 2011年
- 近年来,随着并行编程的普及,性能监测和剖析已经成为计算机系统领域最重要的研究课题之一。PMU(Performance Monitoring Unit),即现代处理器里集成的微体系事件性能计数器,为性能监测提供了底层支持,使得在以极小的额外开销和极少的对目标程序的干扰的情况下对程序进行性能监测成为可能。Pview(Performance View)是一种在系统级支持对并行程序尤其是多线程程序进行性能监测与分析的工具,它同时支持全系统和针对特定进程(线程组)的性能事件直接计数或者抽样的分析方法。Pview在Linux操作系统平台上通过扩展内核2.6.30,实现了一个新的系统调用Pview来提供性能监测服务;同时与以模块方式实现的数据收集引擎协作,可以实现抽样并将大规模样本数据传输到用户空间供进一步分析。
- 闫洁徐恒阳安虹刘玉王耀彬
- 关键词:性能监测
- 多核平台上的并行程序性能调优技术与工具
- 片上多核已经成为当今处理器设计的主流。在多核时代,为了将不断增长的片上资源转变为程序性能提升,必须充分利用处理器硬件多线程并行执行的优势。但是,并行程序的设计是困难的,设计不好的并行程序将不能有效利用硬件资源。从最初的串...
- 闫洁
- 关键词:微处理器性能调优
- 文献传递
- 用线程级推测技术在多核体系结构上并行化科学计算应用被引量:2
- 2010年
- 线程级推测技术使在多核上加速传统上难以手工或自动并行化的串行程序成为可能,它不仅需要合理地选择线程的划分策略,而且需要合理地选择适合推测执行的应用.已有的大量研究主要集中在如SPEC CPU这样的桌面应用领域,为了全面地认识TLS技术的应用适用性,本文探讨TLS技术对科学计算应用的性能提升潜力,提出一套TLS适用性的基本判定准则,实验结果表明采用该技术加速SPLASH2中的多数应用可以有效利用16核及以上的计算资源.
- 王耀彬安虹郭锐闫洁路璐
- 关键词:多核