您的位置: 专家智库 > >

国家高技术研究发展计划(2009AA01A134)

作品数:9 被引量:23H指数:3
相关作者:孙广中陈国良徐小文方维龙柏更多>>
相关机构:北京应用物理与计算数学研究所安徽省高性能计算重点实验室中国科学技术大学更多>>
发文基金:国家高技术研究发展计划国家自然科学基金中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术理学自然科学总论更多>>

文献类型

  • 9篇中文期刊文章

领域

  • 6篇自动化与计算...
  • 2篇理学
  • 1篇自然科学总论

主题

  • 3篇并行计算
  • 2篇多核
  • 2篇索引
  • 1篇倒排索引
  • 1篇多核机群
  • 1篇多核心
  • 1篇引擎
  • 1篇知识发现
  • 1篇三层差分格式
  • 1篇数据预取
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇热传导方程
  • 1篇自适
  • 1篇自适应
  • 1篇维数
  • 1篇文本搜索
  • 1篇力学方程组
  • 1篇流体力学
  • 1篇流体力学方程

机构

  • 4篇北京应用物理...
  • 3篇中国科学技术...
  • 3篇安徽省高性能...
  • 1篇中国科学院研...
  • 1篇中国科学院软...

作者

  • 3篇陈国良
  • 3篇孙广中
  • 2篇方维
  • 2篇龙柏
  • 2篇徐小文
  • 1篇左风丽
  • 1篇吴超
  • 1篇夏芳
  • 1篇袁光伟
  • 1篇刘青凯
  • 1篇吴俊峰
  • 1篇曹小林
  • 1篇张爱清
  • 1篇张云泉
  • 1篇王婷
  • 1篇曹立强
  • 1篇肖玄基
  • 1篇莫则尧
  • 1篇熊焰
  • 1篇崔霞

传媒

  • 2篇计算物理
  • 1篇计算机研究与...
  • 1篇电子学报
  • 1篇华中科技大学...
  • 1篇小型微型计算...
  • 1篇计算机科学
  • 1篇High T...
  • 1篇中国科学:信...

年份

  • 1篇2013
  • 2篇2012
  • 5篇2011
  • 1篇2010
9 条 记 录,以下是 1-9
排序方式:
一种并行计算平台KD-60上的可实时更新文本搜索
2012年
实时性是影响搜索引擎性能的重要因素.针对这个因素,提出一种可实时更新的倒排索引结构并将其应用于国产万亿次高性能计算平台KD-60.该方案采用主、辅倒排索引和内容过滤索引相结合的方式,实现了搜索过程的实时性.同时,我们将其应用于高性能绿色计算平台KD-60,使之在一定的程度上实现了搜索的高效能.实验证明,基于KD-60平台的倒排索引结构有效的解决了搜索引擎的实时性问题,并可作为绿色计算的实际应用的一个典型实例.
龙柏方维孙广中陈国良
关键词:搜索引擎倒排索引
基于JASMIN框架的快速多极子并行解法器被引量:2
2010年
快速多极子方法将N体问题的计算复杂度从O(N2)降到O(NlogN)或O(N),已应用于电磁散射和位错动力学等领域.在将快速多极子方法分离为共性和个性两部分后,设计了可供多个领域应用程序共享使用的快速多极子并行解法器,并在JASMIN框架内实现.该解法器封装共性部分,提供抽象接口支持用户按串行方式实现个性部分.共性部分包括多个网格层的分布存储、层间和层内数据通信以及组织计算等.个性部分包括与应用紧密相关的多极展开和局部展开以及转移算子等.该解法器已应用于两个领域的并行程序.数值模拟测试表明,它在1024个处理器上的并行效率可达到80%以上.
曹小林莫则尧刘旭徐小文张爱清
关键词:快速多极子方法N体问题
Cache performance optimization of irregular sparse matrix multiplication on modern multi-core CPU and GPU
2013年
This paper focuses on how to optimize the cache performance of sparse matrix-matrix multiplication(SpGEMM).It classifies the cache misses into two categories;one is caused by the irregular distribution pattern of the multiplier-matrix,and the other is caused by the multiplicand.For each of them,the paper puts forward an optimization method respectively.The first hash based method removes cache misses of the 1 st category effectively,and improves the performance by a factor of 6 on an Intel 8-core CPU for the best cases.For cache misses of the 2nd category,it proposes a new cache replacement algorithm,which achieves a cache hit rate much higher than other historical knowledge based algorithms,and the algorithm is applicable on CELL and GPU.To further verify the effectiveness of our methods,we implement our algorithm on GPU,and the performance perfectly scales with the size of on-chip storage.
刘力LiuLiYang Guang wen
关键词:矩阵乘法GPU缓存替换算法多核心
PLASMA自适应调优与性能优化的设计与实现
2012年
PLASMA是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行以及乱序执行机制等大大提高了程序的性能。但PLASMA仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的LAPACK和PLASMA的实现机制,分析了PLASMA中存在的优势和不足,介绍了两种弥补PLASMA自身不足的方法。针对PLASMA的架构,经过大量的测试与分析,提出了边缘矩阵的概念并分析了其对性能的影响,据此提出了一种自适应调优的方法。并通过数据拷贝与计算并行的运行方式,进一步提高了PLASMA性能,最后通过大量的测试验证了该优化方法的效果。
吕渐春张云泉王婷肖玄基
关键词:LAPACKPLASMA
大规模时变可视化数据的预取加速研究
2011年
针对读取数据这一制约绘制性能的主要因素,从时变数据场的相邻帧相似性入手,利用前一帧图像的绘图区域预测下一帧图像的绘图区域,进而转换成I/O参数,实现连续绘制中的数据预取.并在多帧图像绘制过程中形成载入、处理、绘制三级流水线,提高可视化的速度.微机测试表明,由于图像相邻帧相似度的不同,时变可视化数据预取将可视化性能提高17.2%~47.5%.
曹立强夏芳沈卫超
关键词:可视化知识发现数据预取
一种基于多核机群架构的混合索引结构被引量:3
2011年
本文提出了一种HKD-tree(Hybrid K-Dimensional tree)混合索引结构.该结构将KD-tree(K-Dimensional tree)和LSH(Locality Sensitive Hashing)两种索引结构进行组合,利用KD-tree作为上层结构的主干而LSH充当叶子节点,从而可以利用多核机群系统的层次并行结构特性.与传统的索引结构相比,该混合索引结构具有高效并行处理、可扩展性好等特点,适于多核机群系统平台及高维数据索引.实验结果表明,该混合索引结构在多核机群系统上的性能优于传统的索引结构.
龙柏孙广中熊焰陈国良
关键词:索引高维数据多核机群
一种求解流体力学方程组的自适应显式时间积分算法及其应用被引量:9
2011年
针对交替方向显式离散格式,提出一个基于结构网格局部加密技术(SAMR)的求解流体力学方程组的自适应时间积分算法;基于该算法,在JASMIN框架上研制多介质流体力学并行自适应数值模拟程序;在512个处理器上模拟惯性约束聚变中的二维内爆模型.数值模拟结果和并行性能分析显示了算法的正确性和并行实现的高效率.
刘青凯徐小文吴俊峰
关键词:并行计算
一种三维快速傅里叶变换并行算法被引量:9
2011年
三维快速傅里叶变换在物理计算领域中被广泛地使用.传统并行算法所使用的面划分和块划分方法并不适合稀疏三维向量的傅里叶变换.提出了一种新三维快速傅里叶变换的并行算法,针对稀疏三维向量的傅里叶变换,新算法通过重新调整x,y,z三个方向的计算顺序,能最大限度地减少计算量以及进程间的通信量,从而减少计算时间,提高并行加速比.详尽的理论分析以及多个高性能计算平台上的实验结果证明:在对稀疏三维向量作傅里叶变换时,新算法优于传统算法.
方维孙广中吴超陈国良
关键词:并行计算加速比
热传导方程三层并行差分格式初始条件的计算
2011年
给出二维热传导问题的三层差分格式初始条件的一种显式计算方法,对于由此形成的内边界预估校正三层并行差分算法,证明稳定性和收敛性定理.并行数值试验表明,方法稳定,且与通常采用隐式格式计算初始条件的方法相比,易于程序实现;与已有的扰动算法相比,能大幅度减小误差.
左风丽崔霞袁光伟
关键词:三层差分格式
共1页<1>
聚类工具0