郝晓飞
- 作品数:2 被引量:28H指数:1
- 供职机构:内蒙古科技大学信息工程学院更多>>
- 发文基金:教育部“春晖计划”内蒙古自治区自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- Hadoop平台上Apriori算法并行化研究与实现被引量:27
- 2013年
- 分析传统串行关联规则Apriori算法的计算过程以及存在的一些缺点,针对串行算法执行效率低,时间复杂度高以及传统并行计算模式不能处理节点失效,难以处理负载均衡等问题,提出基于Hadoop平台实现并行关联规则算法的设计方法,对传统关联规则Apriori算法进行了改进,并给出改进算法在Hadoop平台的MapReduce编程模型上的执行流程;在Hadoop平台上对改进后的算法进行单机测试和集群测试,实验结果证明,改进后的算法具有较高的执行效率,良好的加速比和可移植性。
- 郝晓飞谭跃生王静宇
- 关键词:HADOOP关联规则算法并行计算APRIORI
- Hadoop平台下关联规则算法并行化研究与实现
- 关联规则算法用来描述事物之间的联系和挖掘事物之间的相关性,其核心是通过统计数据项获得频繁项集,被广泛应用于分类设计、捆绑式销售、仓储货存配置等领域,关联规则的挖掘已经成为数据挖掘中一个非常重要的研究方向。近年来,随着网络...
- 郝晓飞
- 关键词:关联规则算法HADOOP平台并行计算数据挖掘
- 文献传递