何王全
- 作品数:83 被引量:33H指数:4
- 供职机构:江南计算技术研究所更多>>
- 发文基金:国家高技术研究发展计划国家重点基础研究发展计划国家重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 一种自适应任务调度方法
- 本发明公开一种自适应任务调度方法,包括在课题开始运行后运行时系统对计算资源进行初始化,初始化节点类型,划分区域,选取节点类型,初始化任务池;课题正式运行时进行任务分配与调度,随着叶子计算节点完成任务后动态生成新任务并进行...
- 董恩铭何王全于康杨小川李雁冰方燕飞文延华刘齐徐正茂
- 文献传递
- 基于迭代逼近的RDMA缓冲区动态分配方法
- 本发明公开一种基于迭代逼近的RDMA缓冲区动态分配方法,包括以下步骤:S1、初始化时,RDMA发起方做以下设置:将请求分配的缓冲区数量记为rbuf_thresh,初始值设为4,rbuf_thresh扩张时的时间记为epo...
- 何王全漆锋滨陈淑平李祎王申卢德平周慧霖钱炜
- F2^m上并行Pollard rho算法的优化实现
- 2005年
- 并行Pollard rho算法是目前攻击椭圆曲线密码体制(E lliptic Curve Cryptosystem,简称ECC)的最好算法,国内外的研究十分活跃。本文首先介绍了攻击F2m上ECC的并行Pollard rho算法及我们的实现流程,然后给出了核心基本运算(包括求逆、一般乘法、平方、求模等)的优化算法。实验数据表明,根据本文优化算法编制的MPI并行程序在多机上加速比良好,运算速度优于互联网上公开的程序。
- 何王全漆锋滨韩文报
- 关键词:ECC
- 基于性能数据时空特性的分析装置
- 本发明公开了一种基于性能数据时空特性的分析装置,包括代码采集装置、性能采集装置、处理装置和显示装置,所述代码采集装置用于统计比重大于1%的代码空间、相同或具有90%以上重叠的代码空间、相同代码空间出现的时间节点和时间间隔...
- 刘勇何王全冯赟龙陈华蓉宋佳伟王敬宇彭达佳孙川罗威张威梁艳邹通
- 面向众核多层次存储系统的数据高效传输支持方法
- 本发明公开了一种面向众核多层次存储系统的数据高效传输支持方法,包括典型访存通信模式性能库和运行时最优模式选择模块,所述典型访存通信模式性能库是通过以下步骤构建形成的,总结科学计算程序中的典型通信访存模式;对每种典型通信访...
- 方燕飞李雁冰董恩铭杨小川何王全尉红梅
- 文献传递
- 通信域的集中式管理方法
- 本发明公开了一种通信域的集中式管理方法,创建通信域数据结构;通信域的根进程向全局主进程发起申请,全局主进程收到申请后分配管理索引;全局主进程收从资源列表中读取资源信息,通过通信优化策略从资源列表中选择生成可用资源信息,并...
- 于康方燕飞董恩铭李雁冰何王全漆锋滨
- 文献传递
- 用于超大Infiniband网络的负载均衡多播路由被引量:1
- 2022年
- 高性能计算中,硬件支持的多播操作对应用程序性能具有至关重要的影响。Infiniband网络中现有的两类多播路由算法中,MINIHOP-MC未考虑路由均衡性问题,导致链路edge forwarding index(EFI)指数很大,严重影响多播消息性能;SSSP-MC虽然部分考虑了路由均衡性问题,但其运行时间很长,不能满足超大规模互连网络的需求。提出一种负载均衡的快速多播路由算法FULB-MC,可用于存在大量多播组的超大规模互连网络环境。该算法采用自底向上的多播树构建方法,并综合利用两种负载均衡策略根据局部负载信息进行多播路由选择。还提出了新的加入/离开多播组机制,避免频繁计算多播路由问题。在各种拓扑结构、各种通信模式下对FULB-MC进行了大量测试。结果表明,在运行时间方面,FULB-MC显著低于SSSP-MC;在链路EFI指数方面,FULB-MC明显优于MINIHOP-MC,而与SSSP-MC基本相当。
- 陈淑平周慧霖何王全漆锋滨
- 关键词:多播路由负载均衡INFINIBAND
- 一种基于哈希算法的库函数安全增强方法
- 本发明提供了一种基于哈希算法的库函数安全增强方法,包括:对同一函数的多次调用,将已经回溯的栈信息用链表保存起来,此后再次调用该函数时,以函数返回地址作为关键字检索链表以查找所述函数的栈信息,如果在链表中查找到所述函数的栈...
- 姜军漆锋滨谢汶兵何王全王雅慧石培森
- 文献传递
- OpenCL的动态执行模式在静态编译支持下的实现被引量:1
- 2014年
- OpenCL的动态执行模式要求底层平台支持device文件的动态生成、编译和加载运行。对于不具备这些特性的平台,必须从软件层面考虑支持方法。通过采用函数更名技术解决同名函数正确识别问题,基于动态执行流的predo策略可以在静态编译环境下实现OpenCL的动态执行模式。
- 文延华何王全尉红梅
- 关键词:执行流
- 面向国产异构众核系统的Parallel C语言设计与实现被引量:8
- 2017年
- 异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、提升并行程序的性能都具有重要的意义.提出统一架构的多模式并行编程模型,包括异构融合的加速运算模型和按同构方式编程的自主运算模型,根据编程模型设计了Parallel C语言,能够有效地描述国产众核系统的异构并行性.与其他众核系统上MPI+X的使用模式相比,编程和系统优化都具有全局视角,在多级局部性描述、单边消息、兼容已有多核应用等方面具有特色;基于Open64构建了Parallel C编译系统,全面支持加速运算模型和自主运算模型,提出并实现了数据布局与自动DMA、编译指导的线程代理和拓扑位置感知的集合通信等优化.Micro Benchmark和实际应用在神威太湖之光计算机系统上的测试数据结果表明:Parallel C语言和编译系统具有良好的性能和可扩展性,能够有效支撑大型应用.
- 何王全刘勇方燕飞魏迪漆锋滨
- 关键词:编程模型并行语言PARALLEL编译器