肖宇鹏
- 作品数:4 被引量:26H指数:4
- 供职机构:哈尔滨理工大学计算机科学与技术学院更多>>
- 发文基金:黑龙江省教育厅科学技术研究项目黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于模糊C-均值的空间不确定数据聚类被引量:7
- 2015年
- 针对现实世界中样本对象的不确定性及样本对象间界限划分的模糊性,提出基于模糊C-均值的空间不确定数据聚类算法UFCM。但由于UFCM算法在聚类过程中涉及大量期望距离的复杂积分计算,导致UFCM算法性能不理想,进而给出改进算法I_UFCM,将空间不确定对象聚类问题转化为传统的确定对象聚类问题,采用相似度计算公式减少期望距离的计算量,提高聚类结果的质量。实验结果表明,与UFCM和UK-Means算法相比,I_UFCM算法在空间不确定数据集上具有更好的聚类性能,CUP耗时降低了90%以上。
- 肖宇鹏何云斌万静李松
- 关键词:模糊C-均值不确定数据概率密度函数质心
- 空间聚类与方向关系的融合技术研究被引量:5
- 2016年
- 在大数据量的环境下,传统空间数据的空间关系仅描述两个空间物体,从而出现数据存储冗余,检索速度慢等问题。提出改进的聚类算法对空间物体聚类,再在聚类结果的基础上表示空间物体的方向关系。提出了基于密度的K-均值算法和空间聚类与方向关系融合的新方法。所提方法增强了空间数据库对空间数据对象的空间方向关系的智能处理能力,节省了存储空间,提高了数据的查询速度。
- 万静孙永倩董怀国肖宇鹏齐坡
- 关键词:空间聚类K均值
- 空间聚类分析的研究
- 聚类分析技术作为数据挖掘领域中的一个重要分支,在识别数据内在结果方面扮演着极其重要的角色。聚类分析技术是一种无监督的学习过程,其主要目的是将没有标记的空间样本数据划分为有意义的组或簇。在某一组中,所有空间样本数据在某种意...
- 肖宇鹏
- 关键词:人工蜂群算法不确定数据K-均值算法数据挖掘知识发现
- 文献传递
- 基于密度期望和有效性指标的K-均值算法被引量:10
- 2013年
- 传统K-均值聚类算法虽然收敛速度快,但存在聚类数k无法预先确定,并且算法对初始中心点敏感的缺点。针对上述缺点,提出了基于密度期望和聚类有效性Silhouette指标的K-均值优化算法。给出了基于密度期望的初始中心点选取方案,将处于密度期望区间内相距最远的k个样本作为初始聚类中心。该方案可有效降低K-均值算法对初始中心点的依赖,从而获得较高的聚类质量。在此基础上,可进一步通过选择合适的聚类有效性指标Silhouette指标分析不同k值下的每次聚类结果,确定最佳聚类数,则可有效改善k值无法预先确定的缺点。实验及分析结果验证了所提出方案的可行性和有效性。
- 何云斌肖宇鹏万静李松
- 关键词:K-均值聚类