您的位置: 专家智库 > >

宋刚

作品数:5 被引量:28H指数:3
供职机构:中国科学院软件研究所更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 5篇自动化与计算...

主题

  • 4篇编程
  • 4篇并行编程
  • 2篇GZIP
  • 2篇OPENMP
  • 1篇多核
  • 1篇多线程
  • 1篇有限元
  • 1篇数据压缩
  • 1篇线程
  • 1篇块算法
  • 1篇共享存储
  • 1篇分块
  • 1篇分块算法
  • 1篇TLB

机构

  • 5篇中国科学院软...
  • 2篇中国科学院研...
  • 1篇中国科学院大...

作者

  • 5篇宋刚
  • 4篇张云泉
  • 4篇蒋孟奇
  • 3篇李玉成
  • 1篇柳锴
  • 1篇刘胜飞
  • 1篇陈靖

传媒

  • 2篇计算机工程
  • 1篇计算机工程与...
  • 1篇2006年全...

年份

  • 1篇2009
  • 2篇2008
  • 1篇2007
  • 1篇2006
5 条 记 录,以下是 1-5
排序方式:
有限元单元计算子程序的OpenMP并行化被引量:11
2008年
Intel和AMD双核乃至4核处理器的推出,使得并行计算已经普及到PC机。为了充分利用多核,需要对原有程序进行多线程改造,使其充分利用多核处理带来的性能提升。该文利用共享存储编程的工业标准OpenMP对有限元方法涉及的单元计算子程序进行了并行化实现。在机群的一个双CPU的SMP节点上的测试表明,共享并行化使得该单元子程序的性能提高了一倍。
宋刚蒋孟奇张云泉李玉成
关键词:并行编程多线程多核有限元
基于共享存储和Gzip的并行压缩算法研究被引量:8
2009年
Gzip无损压缩算法。尽管gzip算法能够取得很好的压缩比,但它在分析和压缩编码的过程需要进行大量的计算。为了缩短压缩时间,提出了一种基于共享存储的并行压缩策略。采用OpenMP标准和"生产者/消费者"模型实现了gzip的并行压缩版本。在Beowulf集群中的一个SMP节点(双CPU)和曙光天阔服务器(4路双核)上的测试表明,并行化的gzip程序取得了极大的性能提升,尤其是大文件的压缩。
宋刚蒋孟奇张云泉刘胜飞
关键词:共享存储并行编程数据压缩OPENMPGZIP
GOTOBLAS一般矩阵乘法高效实现机制的研究被引量:9
2008年
对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析。结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度。对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库。证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性。
蒋孟奇张云泉宋刚李玉成
关键词:分块算法
压缩算法的OpenMP并行化实现及并行解压缩初探
随着峰值速度达280.6万亿次 IBM BlueGene/L 机群的投入使用,高性能计算机正面临着飞速发展,双核处理器的出现使得用户面临无处不在的并行.如何将已有的串行算法并行化并在并行计算机上实现成为高性能计算发展面临...
宋刚蒋孟奇张云泉李玉成陈靖柳锴
关键词:并行编程GZIP
文献传递
共享存储并行编程应用研究及TLB对基于层次存储计算模型的影响初探
高性能计算技术近年来在国内外都得到了巨大发展,虽然在硬件方面突破较大(如高性能计算机的研制),但在并行应用软件方面的发展则比较缓慢,最终导致并行应用软件的开发严重滞后于并行硬件平台的发展。只有并行应用软件的发展跟上硬件平...
宋刚
关键词:并行编程
共1页<1>
聚类工具0