刘明明
- 作品数:1 被引量:3H指数:1
- 供职机构:河北大学更多>>
- 发文基金:河北省高等学校科学技术研究指导项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 2种加速K-近邻方法的实验比较被引量:3
- 2016年
- K-近邻(K-NN:K-nearest neighbors)是著名的数据挖掘算法,应用非常广泛.K-NN思想简单,易于实现,其计算时间复杂度和空间复杂度都是O(n),n为训练集中包含的样例数.当训练集比较大时,特别是面对大数据集时,K-NN算法的效率会变得非常低,甚至不可行.本文用实验的方法比较了2种加速K-NN的方法,2种加速方法分别是压缩近邻(CNN:condensed nearest neighbor)方法和基于MapReduce的K-NN.具体地,在Hadoop环境下,用MapReduce编程实现了K-NN算法,并与CNN算法在8个数据集上进行了实验比较,得出了一些有价值的结论,对从事相关研究的人员具有一定的借鉴作用.
- 翟俊海王婷婷张明阳王耀达刘明明
- 关键词:K-近邻数据挖掘MAPREDUCEHADOOP