您的位置: 专家智库 > >

刘明明

作品数:1 被引量:3H指数:1
供职机构:河北大学更多>>
发文基金:河北省高等学校科学技术研究指导项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇数据挖掘
  • 1篇HADOOP
  • 1篇K-近邻
  • 1篇MAPRED...

机构

  • 1篇河北大学

作者

  • 1篇翟俊海
  • 1篇王婷婷
  • 1篇张明阳
  • 1篇刘明明

传媒

  • 1篇河北大学学报...

年份

  • 1篇2016
1 条 记 录,以下是 1-1
排序方式:
2种加速K-近邻方法的实验比较被引量:3
2016年
K-近邻(K-NN:K-nearest neighbors)是著名的数据挖掘算法,应用非常广泛.K-NN思想简单,易于实现,其计算时间复杂度和空间复杂度都是O(n),n为训练集中包含的样例数.当训练集比较大时,特别是面对大数据集时,K-NN算法的效率会变得非常低,甚至不可行.本文用实验的方法比较了2种加速K-NN的方法,2种加速方法分别是压缩近邻(CNN:condensed nearest neighbor)方法和基于MapReduce的K-NN.具体地,在Hadoop环境下,用MapReduce编程实现了K-NN算法,并与CNN算法在8个数据集上进行了实验比较,得出了一些有价值的结论,对从事相关研究的人员具有一定的借鉴作用.
翟俊海王婷婷张明阳王耀达刘明明
关键词:K-近邻数据挖掘MAPREDUCEHADOOP
共1页<1>
聚类工具0