您的位置: 专家智库 > >

吴长茂

作品数:15 被引量:25H指数:3
供职机构:中国科学院软件研究所更多>>
发文基金:国家自然科学基金河南省科技攻关计划中国科学院战略性先导科技专项更多>>
相关领域:自动化与计算机技术理学机械工程更多>>

文献类型

  • 7篇期刊文章
  • 7篇专利
  • 1篇会议论文

领域

  • 10篇自动化与计算...
  • 2篇机械工程
  • 2篇理学

主题

  • 4篇异构
  • 4篇并行计算
  • 3篇稀疏矩阵向量...
  • 3篇向量
  • 3篇矩阵
  • 3篇处理器
  • 2篇遗传算法
  • 2篇运行性
  • 2篇运行性能
  • 2篇自适
  • 2篇自适应
  • 2篇网络
  • 2篇缓存
  • 2篇缓存机制
  • 2篇光线
  • 2篇光线追踪
  • 2篇光学
  • 2篇法器
  • 2篇非零
  • 2篇CPU

机构

  • 15篇中国科学院软...
  • 3篇中国科学院大...
  • 3篇河南工学院
  • 1篇北京大学
  • 1篇国家测绘局
  • 1篇中国科学技术...
  • 1篇中国科学院研...
  • 1篇中国科学院上...
  • 1篇杭州光学精密...

作者

  • 15篇吴长茂
  • 5篇杨超
  • 4篇刘芳芳
  • 4篇徐帆江
  • 4篇唐秋艳
  • 2篇张云泉
  • 2篇孙乔
  • 1篇黎雷生
  • 1篇吕品
  • 1篇李力刚
  • 1篇邓攀
  • 1篇赵海涛
  • 1篇任刚
  • 1篇尹亮

传媒

  • 2篇软件学报
  • 2篇河南工学院学...
  • 1篇物理学报
  • 1篇计算机研究与...
  • 1篇数值计算与计...
  • 1篇2012全国...

年份

  • 5篇2023
  • 2篇2021
  • 1篇2020
  • 1篇2019
  • 2篇2018
  • 2篇2017
  • 1篇2013
  • 1篇2012
15 条 记 录,以下是 1-10
排序方式:
一种基于空域阵列卷积的精细光学图像仿真方法
本发明公开了一种基于空域阵列卷积的精细光学图像仿真方法。本方法为:1)对待仿真的空间相机的视场范围进行网格划分,得到一视场阵列;计算所述视场阵列中每个网格区域的中心视场;2)根据所述空间相机的光学系统参数和设定的干扰大气...
徐帆江崔爽唐秋艳唐熊忻吴长茂魏花王晓东李程
基于链表的多光束相干和非相干合成传输仿真方法及系统
本发明公开了基于链表的多光束相干和非相干合成传输仿真方法及系统,涉及光学仿真领域,通过链表中的一系列结点来存储子光束的光场特性信息,通过光束的相关和非相关理论来计算合成光场信息并存储为新的节点,如此结点可以在运行时动态生...
徐帆江唐秋艳唐熊忻吴长茂张丽霞魏花王晓东刘贺
一种光学系统结构参数高精度求解方法
本发明公开了一种光学系统结构参数高精度求解方法,其步骤包括:1)将光学系统的N个结构参数记为x(x<Sub>1</Sub>,…,x<Sub>N</Sub>);将光学系统所限定的像差F,像差函数记为f;2)根据步骤1)的限...
吴长茂夏媛媛唐熊忻唐秋艳
基于Spark大数据计算模型的多种群并行进化遗传算法被引量:2
2021年
由于经典SPGA缺乏多种群并行进化能力,当问题规模较大时,计算效率偏低。为此,深入研究Spark大数据计算模型并行机制与多种群并行进化机制的潜在关系,将多种群并行进化机制引入经典SPGA,形成一种新的SPGA——MPE-SPGA;将提出的算法应用于TSP,选取EIL51、CH130和TSP225三种数据集,分别代表小型、中型和大型数据集。实验结果表明,提出的MPE-SPGA在小型数据集上计算时间比原算法减少3%,计算性能有小幅提升;在中型和大型数据集上,计算时间分别减少了22%和31%,性能提升显著。
任刚吴长茂魏勇刘小杰郜广兰王鲜芳
关键词:并行遗传算法大数据
一种基于国产申威26010处理器的稀疏矩阵向量乘异构众核实现方法
本发明公开了一种基于国产申威26010处理器的稀疏矩阵向量乘异构众核实现方法,由于稀疏矩阵的非零元分布很不规则,该方法设计了静态、动态两种不同的任务划分方法,以适应不同的稀疏矩阵;提出了一套动静态的缓存机制,以提升向量x...
刘芳芳杨超吴长茂
一种基于申威26010处理器的稀疏矩阵向量乘异构众核实现方法
本发明公开了一种基于申威26010处理器的稀疏矩阵向量乘异构众核实现方法,由于稀疏矩阵的非零元分布很不规则,该方法设计了静态、动态两种不同的任务划分方法,以适应不同的稀疏矩阵;提出了一套动静态的缓存机制,以提升向量x的访...
刘芳芳杨超吴长茂
文献传递
用于空间相机设计的高精度光线追迹方法
2023年
空间光学系统在应用需求牵引下,向着大尺度、高精度、复杂化等方向发展,像差随着焦距与口径的增大呈幂指数增长,微小的误差扰动就会引起像质的大幅退化,因此对光线追迹算法的精度和稳定性提出了更严苛要求.本文从误差分析理论出发,提出了光线追迹精度表示模型,依据模型分析了计算过程误差来源,并设计了高精度光线追迹算法.数值仿真实验和典型空间相机设计案例结果表明,本文方法在精度上较原有方法提高了5—6个数量级,残差平均比Zemax小近3个数量级,数值稳定性也得到了极大提升.
吴长茂唐熊忻夏媛媛杨瀚翔徐帆江
关键词:光线追迹光学设计空间相机
GOP-MRPGA:基于MapReduce大数据计算模型的遗传算子前置并行遗传算法被引量:2
2020年
提出了一种新的基于MapReduce大数据计算模型的PGA,该算法将遗传算子计算从Reduce阶段提前到Map阶段,从而获得了更好的并行度。通过四组实验验证了提出算法的性能,实验结果表明,提出的算法具有较高的计算效率。
任刚狄文辉郜广兰王鲜芳吴长茂武文佳赵开新
关键词:并行遗传算法
面向国产申威26010众核处理器的SpMV实现与优化被引量:10
2018年
世界首台峰值性能超过100P的超级计算机——神威太湖之光已经研制完成,该超级计算机采用了国产申威异构众核处理器,该处理器不同于现有的纯CPU,CPU-MIC,CPU-GPU架构,采用了主-从核架构,单处理器峰值计算能力为3TFlops/s,访存带宽为130GB/s.稀疏矩阵向量乘SpMV(sparse matrix-vector multiplication)是科学与工程计算中的一个非常重要的核心函数,众所周知,其是带宽受限型的,且存在间接访存操作.国产申威处理器给稀疏矩阵向量乘的高效实现带来了很大的挑战.针对申威处理器提出了一种CSR格式SpMV操作的通用异构众核并行算法,该算法从任务划分、LDM空间划分方面进行精细设计,提出了一套动静态buffer的缓存机制以提升向量x的访存命中率,提出了一套动静态的任务调度方法以实现负载均衡.另外还分析了该算法中影响SpMV性能的几个关键因素,并开展了自适应优化,进一步提升了性能.采用Matrix Market矩阵集中具有代表性的16个稀疏矩阵进行了测试,相比主核版最高有10倍左右的加速,平均加速比为6.51.通过采用主核版CSR格式SpMV的访存量进行分析,测试矩阵最高可达该处理器实测带宽的86%,平均可达到47%.
刘芳芳杨超杨超吴长茂敖玉龙
关键词:稀疏矩阵向量乘自适应优化
基于CPU-MIC异构众核环境的行星流体动力学数值模拟被引量:1
2017年
数值模拟是行星流体动力学研究的主要工具.本文介绍CPU-MIC异构众核平台的行星流体动力学数值模拟,计算并模拟地球外核的磁流体运动.本文在已有工作的基础上^([1-3]),添加了CPU-MIC异构众核环境的数值模拟支持.首先描述了CPU-MIC异构众核环境的上的数值模拟流程,然后给出了MIC上的分布式并行GMRES(m)众核解法器的实现算法.其次,实现了解法器的计算核心稀疏矩阵向量乘(SpMV)在MIC上的分布式并行算法,该SpMV实现了计算-通信重叠、数据传输-计算重叠.再次,为加速行星流体动力学方程收敛,给出了MIC上以SpMV为基本操作的分布式并行多项式预条件子.最后,提出了一些MIC众核平台的优化措施,如多线程、流存储和数据传输优化等.天河2号数值模拟表明相比CPU版的数值模拟,CPU-MIC异构众核环境下数值模拟在单MIC卡和64块MIC卡分别取得了6.93和6.0倍的加速比.
吴长茂杨超尹亮刘芳芳孙乔李力刚
关键词:并行计算GMRES
共2页<12>
聚类工具0