您的位置: 专家智库 > >

“核心电子器件、高端通用芯片及基础软件产品”国家科技重大专项(2010ZX01042-001-002)

作品数:1 被引量:4H指数:1
相关作者:周烜张延松王珊更多>>
相关机构:中国人民大学教育部更多>>
发文基金:中国人民大学科学研究基金国家自然科学基金国家科技重大专项更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇元组
  • 1篇三元组
  • 1篇联机分析
  • 1篇联机分析处理
  • 1篇内存
  • 1篇分析处理
  • 1篇OLAP
  • 1篇表连接
  • 1篇大数据

机构

  • 1篇教育部
  • 1篇中国人民大学

作者

  • 1篇王珊
  • 1篇张延松
  • 1篇周烜

传媒

  • 1篇软件学报

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
一个基于三元组存储的列式OLAP查询执行引擎被引量:4
2014年
大数据与传统的数据仓库技术相结合产生了大数据实时分析处理需要(volume+velocity),它要求大数据背景下的数据仓库不能过多地依赖物化、索引等高存储代价的优化技术,而要提高实时处理能力来应对大数据分析中数据量大、查询分析复杂等特点.这些查询分析操作一般表现为在事实表和维表之间连接操作的基础上对结果集上进行分组聚集等操作.因此,表连接和分组聚集操作是ROLAP(relational OLAP)性能的两个重要决定因素.研究了新硬件平台下针对大规模数据的OLAP查询的性能,设计新的列存储OLAP查询执行引擎CDDTA-MMDB(columnar direct dimensional tuple access-main memory databasequeryexecutionengine,直接维表元组访问的内存数据库查询执行引擎).基于三元组的物化策略,使得CDDTA-MMDB能够减少内存列存储模型上表连接操作访问基表和中间数据结构的次数.首先,CDDTA-MMDB将查询分解为作用在维表和事实表上的子查询,如果只涉及过滤操作,子查询将生成<代理键,布尔值>二元组;否则,子查询生成<代理键,关键字,值>三元组.然后,只需一趟扫描事实表,利用事实表的外键映射函数直接定位相应三元组或者二元组,完成相应的过滤、连接或聚集操作.CDDTA-MMDB充分考虑了内存列存储数据库的设计原则,尽量减少随机内存访问.实验结果表明:CDDTA-MMDB是高效的,与具代表性的列存储数据库相比,比MonetDB 5.5快2.5倍,比C-store的invisible join快5倍;并且,CDDTA-MMDB在多核处理器上具有线性加速比.
朱阅岸张延松周烜王珊
关键词:联机分析处理
共1页<1>
聚类工具0