唐滔
- 作品数:93 被引量:84H指数:5
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
- 相关领域:自动化与计算机技术文化科学电子电信理学更多>>
- 基于监督学习的稀疏矩阵乘算法优选
- 2025年
- 稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了一种基于机器学习的最优稀疏矩阵乘算法选择模型,以给定矩阵集作为数据源,抽取稀疏矩阵的特征,并使用SPA、HASH、ESC计算获得的性能数据进行训练和验证,获得的模型能够仅使用稀疏矩阵的特征即可完成对新数据集的算法优选。实验结果表明,该模型可以获得91%以上的预测准确率,平均性能达到最优选择的98%,是单一算法性能的1.55倍以上,并且可在实际库函数中使用,具有良好的泛化能力和实用价值。
- 彭林张鹏陈俊峰唐滔黄春
- 关键词:HASH算法
- 一种基于转置的向量三角函数快速查表方法及系统
- 本发明公开了一种基于转置的向量三角函数快速查表方法及系统,本发明方法包括:输入索引向量vi与基址地址pb,将索引向量vi保存的偏移量值拆分到标量中,并与基址地址pb相加得到VL个地址,使用向量加载指令将VL个地址处共VL...
- 沈洁 龙标黄春唐滔彭林方建滨 崔英博张鹏 廖霞
- Jacobi和Laplace算法在GPU平台上的设计与实现被引量:5
- 2009年
- 随着半导体工艺的发展,GPU的浮点计算能力迅速提高。如何把GPU处理技术应用到非图形计算领域成为体系结构以及高性能计算领域的热点研究问题。Jacobi和Laplace是科学计算领域常用的计算核心。本文基于AMD的流处理GPU平台设计并实现了这两个算法,相对于CPU平台取得了很好的加速效果。
- 唐滔林一松
- 关键词:GPU
- 一种基于MPI并行的SPH程序加速方法及装置
- 本发明涉及光滑粒子动力学领域,公开了一种基于MPI并行的SPH程序加速方法及装置,本发明对空间中的求解域划分获得预设数量子区域,将子区域分配给处理器;处理器中对子区域进行配置并确定处理器边界数值;在处理器进行并行邻近粒子...
- 杨灿群龙思凡葛振郭晓威范小康李超唐滔崔英博
- 一种面向多物理场应用的分离式耦合数值模拟方法和装置
- 本申请涉及一种面向多物理场应用的分离式耦合数值模拟方法和装置。所述方法包括:在流‑固耦合的多物理场应用的数值模拟中,通过格子玻尔兹曼法求解流体区域,有限体积法求解固体区域,采用开源耦合库提供的一致性数据映射方案对耦合区域...
- 杨灿群刘毅郭晓威李超唐滔范小康张森
- 一种SPH的向量化并行计算方法及装置
- 本申请涉及一种SPH的向量化并行计算方法、装置、计算机设备和存储介质。所述方法包括:通过将邻近粒子搜索范围内粒子的原始AoS数据重新组织为SoA数据,使得SoA数据符合所使用的SIMD指令集要求,通过SIMD技术的向量化...
- 杨灿群龙思凡郭晓威范小康李超崔英博黄春唐滔彭林方建滨张鹏夏泽宇
- 面向死锁检查的非阻塞MPI程序符号执行方法、系统及介质
- 本发明涉及计算机高性能计算的可靠性保证领域,公开了一种面向死锁检查的非阻塞MPI程序符号执行方法、系统及介质。针对非阻塞MPI程序的异步性和非确定性,本发明通过为通信操作的不同消息匹配情况和不同交叠执行情况创建不同待探索...
- 于恒彪黄春王戟陈振邦傅先进彭林唐滔左克姜浩沈洁方建滨
- 面向可变长向量架构的超字级自动向量化方法
- 本发明公开一种面向可变长向量架构的超字级自动向量化方法,包括:步骤1.搜索目标源标量代码的基本块中所有存储指令;步骤2.将搜索到的所有存储指令添加进存储指令组;步骤3.根据存储指令组构造SLP图,构造SLP图过程中,以存...
- 范小康黄春唐滔彭林方建滨沈洁于恒彪易昕苏醒
- 一种基于无误差变换的计算编译优化实现方法及系统
- 本发明公开了基于无误差变换的计算编译优化实现方法及系统,本发明方法包括将待优化程序源代码通过LLVM编译器转换成程序初始位码文件;将初始位码文件中的信息利用搜索工具获取初始位码文件中的信息,形成初始变量精度配置文件和待搜...
- 姜浩周一帆苏醒黄春唐滔易昕鲁轻风陈磊漆海俊
- 一种面向CPU-GPU异构系统的容错方法被引量:6
- 2011年
- 近年来,为了缓解日益严重的功耗问题,异构并行体系结构已成为超级计算机发展的一个重要趋势.图形处理器(graphics processing unit,简称GPU)凭借其超高的计算性能和性能功耗比,作为一种高效的加速部件已被广泛应用于高性能计算领域.但是,GPU先天的可靠性缺陷势必加剧超级计算机的可靠性问题.目前,国际上关于CPU-GPU异构系统容错技术的研究工作主要将GPU从异构系统中独立出来,以每次调用为粒度对其进行容错处理.设计了一种面向CPU-GPU异构系统的Lazy容错方法,给出了基于编译指导命令的容错框架及其约束,并讨论了相关的编译实现和优化方法,最后通过实验验证了该方法的正确性.实验结果表明,与现有的容错方法相比,利用所设计的LazyFT容错方法对GPGPU(general purpose computation on graphics hardware)程序进行容错处理,可以明显降低容错代价.
- 徐新海杨学军林宇斐林一松唐滔
- 关键词:GPGPU异构系统容错检查点