李会元 作品数:21 被引量:32 H指数:4 供职机构: 中国科学院软件研究所 更多>> 发文基金: 国家自然科学基金 中国科学院战略性先导科技专项 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 理学 一般工业技术 更多>>
任意三角形Laplace特征值问题谱方法的数值对比研究 被引量:1 2015年 本文选取多项式、有理多项式以及三角函数等五类函数作为基函数,设计相应的谱方法逼近格式并实现相应算法,对任意三角形上Laplace特征值问题进行数值求解对比研究.比较实验结果显示,谱方法相较于经典有限差分、有限元等低阶方法有较多的可信特征值;其中的Koornwinder多项式谱方法与基于Koornwinder多项式的有理谱方法,其可信特征值的数量达到全部计算特征值的4/π^2,并且达到“指数阶收敛”;而三角函数谱方法,则保持了稳定的收敛阶且有较多的可信特征值. 单炜琨 李会元关键词:谱方法 LAPLACE特征值 非规则区域傅氏变换与快速算法 孙家昶 李会元 杨志杰 杨超 该成果是将逼近与偏微分方程相结合,把Fourier方法推广到一类非规则区域,理论上推广到任意m维的m+1方向分割,并建立了相应的离散快速算法(HFFT)。关键词:关键词:傅氏变换 六边形区域快速傅里叶变换的CUDA-MPI算法及其实现 被引量:4 2012年 本文研究六边形区域上快速傅里叶变换(FFTH)的CUDA—MPI算法及其实现.首先,我们通过充分利用CUDA的层次化并行机制及其库函数,设计了FFTH的高效率的CUDA算法.对于规模为3X2048。的双精度复数类型数据,我们设计的CUDA程序与CPU串行程序相比可以达到12倍加速比,如果不计内存和显存之间的数据传输,则加速比可达40倍;其计算效率与CUFFT所提供的二维方形区域FFT程序的效率基本一致.在此基础上,我们通过研究GPU上分布式并行数据的转置与排序算法,优化设计了FFTH的CUDA-MPI算法.在3×8192^2的数据规模、10节点X6GPU的计算环境下,我们的CUDA-MPI程序与CPU串行程序相比达到了55倍的加速;其效率比MPI并行版FFTW以及基于CUFFT本地计算和FFTW并行转置的方形区域并行FFT的效率都要高出很多.FFTH的CUDA-MPI算法研究和测试为大规模CPU+GPU异构计算机系统的可扩展新型算法的探索提供了参考. 陈家杰 李会元 张先轶基于浮点数压缩技术的大规模FFT实现方法及装置 本公开涉及一种基于浮点数压缩技术的大规模FFT实现方法及装置,所述方法包括:对第i个维度的FFT计算结果进行共享指数浮点数压缩,并将压缩结果打包成第i个维度的压缩数据之后,拷贝至所述主机端;获取所述第i个维度的压缩数据后... 赵玉文 刘芳芳 马文静 李会元 彭远驰六边形Fourier谱方法 被引量:3 2013年 首先,建立了晶格Fourier分析的一般理论,并具体研究了六边形区域上周期函数的数值逼近.在此基础上,提出了六边形区域上的椭圆型偏微分方程的周期问题求解的六边形Fourier谱方法,设计了相应谱格式快速实现算法,建立了Fourier谱方法的稳定性与收敛性理论.同方形区域上的经典Fourier谱方法一样,六边形Fourier谱方法可以充分利用快速Fourier变换,并具备了"无穷阶"的谱收敛速度. 李会元 乔海军关键词:周期 FOURIER谱方法 椭圆偏微分方程 基于浮点数压缩技术的大规模FFT实现方法及装置 本公开涉及一种基于浮点数压缩技术的大规模FFT实现方法及装置,所述方法包括:对第i个维度的FFT计算结果进行共享指数浮点数压缩,并将压缩结果打包成第i个维度的压缩数据之后,拷贝至所述主机端;获取所述第i个维度的压缩数据后... 赵玉文 刘芳芳 马文静 李会元 彭远驰二维各向同性湍流直接数值模拟的六边形谱方法及GPU实现和优化 被引量:1 2013年 本文在六边形傅里叶分析及六边形快速傅里叶变换的基础上,提出了二维各向同性湍流直接数值模拟的对偶六边形傅里叶谱方法和六边形傅里叶谱方法,基于二维Navier-Stokes方程的涡度-速度形式,构造了两种六边形傅里叶谱方法的离散格式,设计了其快速求解算法,并且在GPU高性能平台上研制并优化了相应的数值模拟程序.根据方程的具体形式和六边形傅里叶谱方法的特点,从算法层面对方程的求解过程,尤其是非线性Jacobian项快速计算进行优化,经过优化之后,方程求解算法的计算复杂度减少了约30%;根据GPU的体系结构和数值模拟程序的功能要求,将计算模块全部设计为在GPU上运行的kernel函数,尽量避免内存与显存之间的数据拷贝,并在软件工程层面上对代码进行性能优化.优化后的GPU程序获得了高达50倍的加速比.在此基础上,我们对二维各向同性湍流进行了初步的数值模拟,并考察了在不同初始雷诺数条件下,能量和拟涡能随着时间的演变曲线.计算结果表明六边形傅里叶谱方法与传统的傅里叶谱方法一样高效精确. 乔海军 李会元关键词:CUDA 直接数值模拟 一种适合复杂异构系统的HPL矩阵更新优化方法 本发明公开了一种适合复杂异构系统的HPL矩阵更新优化方法,其特征在于,对HPL矩阵更新的行交换进行优化:在执行HPL的第一分段行交换完成、上一次循环矩阵更新和当前进程接收到下一次循环的行交换信息之后,执行第一分段的下一次... 黎雷生 马文静 赵海涛 孙家昶 李会元文献传递 一种基于CW-RNN的多时间尺度序列建模推荐算法 被引量:5 2020年 序列化推荐试图利用用户与物品的历史交互序列,预测下次即将交互的物品。针对序列化推荐中推荐物品依赖于用户的长时间全局兴趣、中时间兴趣还是短时间局部兴趣的不确定性,该文提出了一种基于CW-RNN的多时间尺度序列建模推荐算法。首先,该算法引入CW-RNN层,从用户与物品的历史交互序列中抽取多个时间尺度的用户兴趣特征。然后,通过尺度维卷积来建模对不同时间尺度的用户兴趣特征的依赖,生成多时间尺度用户兴趣特征的统一表示。最后,利用全连接层建模统一的多尺度用户兴趣特征和隐式物品特征的交互关系。在MovieLens-1M和Amazon Movies and TV两个公开数据集上的实验结果表明,相比于现有最优的序列推荐算法,该文提出的算法在准确率上分别提升了3.80%和8.63%。 袁涛 牛树梓 李会元关键词:多时间尺度 动态建模 非线性守恒律高阶谱粘性法的收敛性 2011年 讨论守恒型方程周期边界问题的高阶谱粘性方法逼近解的收敛性.在逼近解一致有界的假设下,通过建立其高阶导数的上界估计,证明了高阶谱粘性方法逼近解具有同二阶谱粘性方法逼近解相类似的高频衰减性质.以此为基础,用补偿列紧法证明了高阶谱粘性方法逼近解收敛于守恒型方程的物理解. 纪园园 李会元关键词:守恒型方程 收敛性