陈亚
- 作品数:1 被引量:2H指数:1
- 供职机构:武汉大学计算机学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 数据挖掘中一种高效的聚类通用框架研究被引量:2
- 2014年
- 随着传感器和互联网技术高速发展,数据集的规模激增,但系统的存储和处理能力仍然滞后。针对目前的数据聚类算法所需的测量值数目较多、时间开销大的不足,为了高效地解决大型数据集中的数据聚类问题,提出了一种主动式分层聚类通用框架,通过在小型数据集上重复运行离线聚类算法,既保证了算法性能,又降低了测量值计算复杂度和运行时间复杂度。然后,基于谱聚类算法讨论了本文框架,理论分析结果表明,利用O(n lg2n)个相似性数据可以恢复规模为Ω(lgn)的所有聚类,对包含n个对象的数据集,其运行时间为O(n lg3n)。最后,通过全面的仿真实验,证明了所提框架的其他优异性能。
- 高芹陈亚
- 关键词:数据集聚类测量值运行时间