您的位置: 专家智库 > >

国家自然科学基金(40245023)

作品数:14 被引量:37H指数:3
相关作者:齐星云窦文华陈永然迟利华刘杰更多>>
相关机构:国防科学技术大学西安电子科技大学北京应用物理与计算数学研究所更多>>
发文基金:国家自然科学基金国家重点实验室开放基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术天文地球电子电信更多>>

文献类型

  • 14篇中文期刊文章

领域

  • 13篇自动化与计算...
  • 2篇天文地球
  • 1篇电子电信

主题

  • 5篇并行计算
  • 3篇谱模式
  • 3篇机群
  • 2篇数值天气预报
  • 2篇全球谱模式
  • 2篇可扩展
  • 2篇加速比
  • 1篇大型稀疏线性...
  • 1篇信号
  • 1篇信号处理
  • 1篇信号重构
  • 1篇性能评价
  • 1篇性能评价模型
  • 1篇隐式
  • 1篇三对角方程组
  • 1篇三维变分
  • 1篇数据依赖
  • 1篇通信延迟
  • 1篇同化
  • 1篇剖分

机构

  • 14篇国防科学技术...
  • 2篇西安电子科技...
  • 1篇北京应用物理...
  • 1篇装备指挥技术...

作者

  • 4篇陈永然
  • 4篇窦文华
  • 4篇齐星云
  • 3篇胡庆丰
  • 3篇刘杰
  • 3篇张卫民
  • 3篇迟利华
  • 3篇李晓梅
  • 2篇朱小谦
  • 2篇宋君强
  • 2篇单润红
  • 2篇曹小林
  • 2篇龚西平
  • 2篇高峰
  • 2篇赵文涛
  • 2篇钱悦
  • 2篇李金才
  • 1篇孔金珠
  • 1篇刘兴平
  • 1篇赵军

传媒

  • 7篇计算机研究与...
  • 4篇计算机工程与...
  • 1篇计算机学报
  • 1篇国防科技大学...
  • 1篇计算机工程与...

年份

  • 4篇2007
  • 1篇2006
  • 3篇2005
  • 4篇2004
  • 2篇2003
14 条 记 录,以下是 1-10
排序方式:
气象资料三维变分同化阶段区域分解并行实现被引量:9
2005年
变分同化由于能明显改善同化质量,正在成为数值天气预报的主流同化方法.研究三维变分同化的并行计算,提出了三维变分同化的阶段区域分解、观测资料的自适应划分算法、计算与通信重叠的矩阵转置和周边区域通信以及文件IO方法,在此基础上实现了MPI并行三维变分原型系统,在由8个双CPU节点组成的Linux机群上并行加速比达到了11.9.
张卫民朱小谦赵军
关键词:变分同化并行计算
数值并行计算可扩展性评价与测试被引量:14
2005年
分析了几种可扩展性能评价模型存在的问题,针对实际评价与测试的需要,提出了一种基于等平均负载的数值并行计算可扩展性评价模型.该评价模型对可扩展性能加速比和可扩展性进行了重新定义,给出了使用该模型的进行可扩展加速比和可扩展性测试的方法,结合曲线拟合或并行计算时间模型可以预测并行系统的可扩展性,对NPBBT,SP和矩阵乘法进行了可扩展性预测.
迟利华刘杰胡庆丰
关键词:可扩展性加速比性能评价模型
数值天气预报全球谱模式并行计算研究被引量:3
2004年
本文首先给出数值天气预报全球谱模式的控制方程;接着,利用数值天气预报全球谱模式计算的复杂性和数据整体相关性,给出了基于二维数据剖分方法的并行算法,并从负载平衡、减少通信延迟以及Cache与I/O优化三个方面给出了并行实现策略。
李金才龚西平赵文涛
关键词:谱模式通信延迟I/O数值天气预报剖分
一种改进的适合并行计算的TFQMR算法被引量:3
2005年
TFQMR算法是一种Krylov子空间算法,常用来求解大型稀疏线性方程组.通过改变TFQMR算法的计算次序,提出了一种改进的TFQMR(ITFQMR)算法.对比TFQMR算法,ITFQMR算法的数值稳定性和TFQMR算法相同,几乎没有增加计算量,但考虑了在MIMD并行机上实现时并行算法的性能,其同步开销减少为TFQMR算法的一半,并且所有内积计算以及矩阵向量乘是独立的,没有数据相关性,可以进行计算与通信的重叠.从理论和实验两个角度来讨论ITFQMR算法的性能,当处理机台数较多时,ITFQMR算法的计算速度快于TFQMR算法.实验说明了在有64台处理机机群上进行,最快的并行ITFQMR算法的计算速度大约比TFQMR算法快20%.
刘杰迟利华胡庆丰李晓梅
关键词:并行计算机群大型稀疏线性方程组
一种改进的适合并行计算的共轭剩余算法被引量:6
2006年
通过改变CR算法的计算次序,提出了一种改进的共轭剩余(ICR)算法.对比CR算法,ICR算法的数值稳定性和CR算法相同,几乎没有增加计算量,但考虑了在MIMD并行机上实现时并行算法的性能,其同步开销减少为CR算法的一半,并且所有内积计算以及矩阵向量乘是独立的,没有数据相关性,可以进行计算与通信的重叠.从理论和实验两个角度来讨论ICR算法的性能,当处理机台数较多时ICR算法的计算速度快于CR算法.在64台处理机机群上进行的数值实验表明,并行ICR算法的计算速度大约比CR算法快30%.
刘杰刘兴平迟利华胡庆丰
关键词:并行计算机群
PMPS:一个并行系统性能模型被引量:1
2007年
传统的性能评价方法已经无法满足规模不断扩大的并行系统性能分析的要求。近几年来,新的性能评价方法——性能模型得到了广泛的研究。本文通过对现有模型的研究,提出一个开放式性能模型(PMPS),并研究了实现该模型的关键技术。
陈永然齐星云窦文华
近似三对角Toeplitz方程组的快速分布式并行算法被引量:1
2004年
利用近似三对角Toeplitz矩阵的特殊结构 ,提出了一种新的求解近似三对角Toeplitz方程组的快速算法 在三对角Toeplitz矩阵的近似LU分解的基础上 ,利用“分而治之”的思想 ,并结合秦九韶技术和特殊的数学技巧减少大量的冗余计算 ,提出了求解近似Toeplitz三对角方程组的快速分布式并行算法 ,并在理论上证明了算法具有近似于线性的加速比 最后通过数值实验证明 ,新的并行算法具有较高的并行效率 ,并且当矩阵阶数n足够大时 。
单润红高峰宋君强李晓梅
关键词:TOEPLITZ三对角方程组加速比
半隐式半Lagrangian时间积分及其可扩展并行算法设计
2003年
目前谱模式仍然是全球数值天气预报业务模式的主流。针对全球数值天气预报谱模式,研究两个时间层的半隐式半Lagrangian时间积分格式以及用于计算起始点的准三次空间插值方法,提出了按需通讯的可扩展并行算法设计,在由4个双CPUSMP结点组成的Linux机群环境下,该算法的8任务相对于4任务的加速比达到了1.65,取得了良好的并行效果。
张卫民朱小谦曹小林
关键词:谱模式可扩展并行算法
基于PCGM的周期非均匀采样信号重构被引量:1
2004年
本文利用Teoeplitz矩阵和正弦变换基预条件矩阵的性质,结合预条件共轭梯度法(PCGM),对非均匀采样信号提出了一种新的重构方法,该方法针对文献[1]所构造的模型,在不增加运算量的前提下,扩展了原算法的适用空间,提高了信号重构的效率。
单润红高峰宋君强李晓梅
关键词:信号处理非均匀采样信号信号重构共轭梯度法
基于系统抽样的并行程序性能特征分析方法及其实现被引量:2
2007年
程序性能特征分析是理解程序行为的基础,对识别程序性能瓶颈、了解软硬件资源利用状况具有重要作用.特别在大规模并行系统的性能评价中,受时间和空间的约束无法分析完整应用性能特征.一个有效的方法是通过抽样的方法分析应用程序部分代码的性能特征,以此代表完整应用的性能特征.分析了Profiler程序负载来源,提出了基于抽样的程序性能特征分析方法,并基于该方法实现了性能特征分析器SamplePro.与其他方法比较,基于系统抽样的程序性能特征方法在最小样本容量下得到最优的分析结果,仅需抽样分析1%~3%的程序指令就能实现小于3%的分析误差.
陈永然窦文华钱悦齐星云
共2页<12>
聚类工具0