王晨旭
- 作品数:4 被引量:1H指数:1
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向异构体系结构的GA模型拓展被引量:1
- 2017年
- 科学与工程应用对计算性能要求的不断增加使得异构计算得到了迅速发展,然而CPU与加速单元之间没有共享内存的特点增加了异构编程难度,编程人员必须显式地指定数据在不同设备之间的传递情况.全局数组(global arrays,GA)模型基于聚合远程内存拷贝接口(ARMCI)为分布式存储系统提供异步单边通信、共享内存的编程环境,但ARMCI接口拓展的复杂性使得GA不能根据特定计算平台的特点迅速在该平台上实现.CoGA模型是对GA模型的异构拓展,旨在为CPU+英特尔至强融核(MIC)的异构系统提供全局数组结构,隐藏数据传输细节从而简化异构编程难度.CoGA基于MIC上的对称传输接口(SCIF)实现对CPU和MIC的内存管理,并结合SCIF远程内存访问特点优化CPU与MIC间的数据传输性能.最后,通过数据传输带宽、通信延迟和稀疏矩阵乘问题的测试,证明了CoGA简化编程并优化数据传输性能的有效性和实用性.
- 程鹏卢宇彤高涛王晨旭
- 关键词:异构计算编程模型
- 面向高性能计算的深度学习分布式训练关键技术研究
- 随着深度学习在计算机视觉、自动驾驶、虚拟现实、生物医药和自然语言处理等领域的广泛应用,其已经成为目前学术界和工业界广受关注的研究热点。然而,随着数据量的爆炸性增长,训练所用的数据集变得越来越大,模型变得越来越复杂,大大增...
- 王晨旭
- 关键词:决策树
- 面向众核体系结构的图算法并行优化技术研究
- 跨入新时代,计算机融入到人们生活的方方面面,随之也产生了数量巨大的数据需要处理。云计算、物联网、物理学、生物学、环境生态学等领域更需要对海量数据进行挖掘和处理,这预示着我们进入了“大数据”时代。“大数据”时代处理的数据量...
- 王晨旭
- 关键词:异构计算负载平衡
- 文献传递
- 面向高性能计算的深度学习分布式训练关键技术研究
- 随着深度学习在计算机视觉、自动驾驶、虚拟现实、生物医药和自然语言处理等领域的广泛应用,其已经成为目前学术界和工业界广受关注的研究热点。然而,随着数据量的爆炸性增长,训练所用的数据集变得越来越大,模型变得越来越复杂,大大增...
- 王晨旭
- 关键词:通信优化