您的位置: 专家智库 > >

张兵

作品数:2 被引量:0H指数:0
供职机构:中国人民大学信息学院更多>>
发文基金:中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇星形模型
  • 1篇图形处理器
  • 1篇联机分析
  • 1篇联机分析处理
  • 1篇分析处理
  • 1篇OLAP
  • 1篇CO
  • 1篇GPU
  • 1篇处理器
  • 1篇CACHE
  • 1篇SUPERS...

机构

  • 2篇中国人民大学

作者

  • 2篇张兵
  • 2篇陈红
  • 1篇王珊
  • 1篇张宇
  • 1篇张延松
  • 1篇李翠平
  • 1篇孙辉
  • 1篇王雯
  • 1篇范旭

传媒

  • 1篇华东师范大学...
  • 1篇计算机应用

年份

  • 1篇2016
  • 1篇2014
2 条 记 录,以下是 1-2
排序方式:
Co-OLAP:CPU&GPU混合平台上面向星形模型基准的协同OLAP(英文)
2014年
当前GPU(图形处理器),即使是中端服务器配置的中端GPU也拥有强大的并行计算能力.不同于近期的研究成果,中端服务器可能配置有几块高端CPU和一块中端GPU,GPU能够提供额外的计算能力而不是提供比CPU更加强大的计算能力.本文以中端工作站上的CoOLAP(协同OLAP)为中心,描述如何使中端GPU与强大的CPU协同以及如何在计算均衡的异构平台上分布数据和计算以使Co-OLAP模型简单而高效.根据实际的配置,基于内存容量,GPU显存容量,数据集模式和订制的AIR(数组地址引用)算法提出了最大高性能数据分布模型.CoOLAP模型将数据划分为驻留于内存和GPU显存的数据集,OLAP计算也划分为CPU和GPU端的自适应计算负载来最小化CPU和GPU内存之间的数据传输代价.实验结果显示,在SF=20的SSB(星形模型基准)测试中,两块至强六核处理器的性能略优于一块NVIDA Quadra 5 000GPU(352个cuda核心)的处理性能,Co-OLAP模型可以将负载均衡分布在异构计算平台并使每个平台简单而高效.
张宇张延松张兵陈红王珊
基于Supersonic的并行分组聚集
2016年
针对在分析型联机分析处理(OLAP)应用中频繁出现的数据密集型操作符——分组聚集耗时较多的问题,提出Cache友好的分组聚集算法对该操作进行性能优化。首先,为充分发挥列存储在数据密集型计算方面的优势,采用基于开源的列存储查询执行引擎Supersonic,并在此之上设计Cache友好的分组聚集算法;其次,为加速查询的执行,使用并行技术,将单线程的分组聚集算法改为多线程并行的分组聚集算法。基于Supersonic设计并实现4种并行分组聚集算法:无共享Hash表并行分组聚集(NSHPGA)算法、表锁共享Hash表并行分组聚集(TLSHPGA)算法、桶锁共享Hash表并行分组聚集(BLSHPGA)算法、节点锁共享Hash表并行分组聚集(NLSHPGA)算法,且在不同的分组势集、不同的线程数的情况下,针对上述4种算法做了多组实验。通过对比3种不同粒度的共享Hash表并行分组聚集算法的加速比,得出NLSHPGA算法在加速比和并发度两方面表现最好,部分查询可达到10倍加速比;通过比较NSHPGA算法和NLSHPGA算法的加速比、Cache miss内存使用等情况,得出NLSHPGA算法在分组势集大于8时,加速比超过NSHPGA算法,并且Cache miss更低,使用的内存更少。
张兵孙辉范旭李翠平陈红王雯
关键词:SUPERSONIC
共1页<1>
聚类工具0