搜索到3814篇“ 最佳聚类数“的相关文章
- 基于自组织的聚类算法及最佳聚类数的确定研究
- 戴清旭
- 基于加权二分图的K均值最佳聚类数确定算法被引量:5
- 2023年
- 针对传统K均值算法无法精确预设初始聚类中心数目的问题,提出基于加权二分图的K均值最佳聚类数确定算法。设计等比例随机采样的方式,从原始大数据集中产生小数据集集合并从中产生聚类中心点点集,提高应对大规模数据集的能力;用聚类中心点点集形成二分图,针对聚类算法特性改进其赋权函数;设计评价数,改进Kuhn-Munkres算法,将其用于求取二分图的最大权完美匹配,确定最佳聚类数。实验结果表明,相较其它6种对比算法,所提算法有更高的准确性,更好的稳定性,以及更强的处理大规模数据集能力。
- 林伟杰王勇周林
- 关键词:K均值初始聚类中心随机采样二分图最佳聚类数完美匹配
- 基于类加权不稳定性的最佳聚类数确定方法
- 在数据分析方法中,聚类分析是数据处理的重要手段,它可以依据数据的相似特征对样本进行划分,挖掘数据中的潜在信息。聚类分析经过了几十年的研究,学者们提出了适用于不同数据结构的聚类算法和有效性指标,广泛应用于其他领域。数据集的...
- 顾鉴桥
- 关键词:聚类分析最佳聚类数
- 聚类分析中的最佳聚类数确定方法研究
- 作为无监督学习方法的一种,聚类分析是从无标记数据集中获取信息和知识的重要手段,是数据挖掘、统计学、模式识别等领域的重要研究内容。通过有效的聚类分析,数据集的内在结构与特征可以被很好地发掘出来。随着数据挖掘和人工智能技术的...
- 张远翔
- 关键词:聚类分析最佳聚类数时间复杂度
- 文献传递
- 基于K-means算法的最佳聚类数研究被引量:15
- 2020年
- 针对聚类算法在实现的过程中需要预先设定最终聚类数目的问题,提出了基于同类全部样本的类内紧密度和类间离差度的一种新聚类有效性指标,通过该指标能够有效地确定数据集的最佳聚类簇数。在确定最佳聚类数的过程中采用K-means算法,针对K-means算法随机选择初始聚类中心的缺陷,提出以欧式距离度量样本相似度,基于样本方差,选出方差最小的前K个样本作为初始聚类中心,避免噪声点成为初始聚类中心,使得选择的初始聚类中心位于样本集稠密区域,Kmeans聚类的结果稳定有效。使用优化K-means算法和新的聚类有效性指标确定数据集的簇数,通过在UCI数据集和人工模拟数据集上测试,证明文本算法在球形且噪声点较少的样本集中,能够有效地找出最佳的类数且算法运行速度快。
- 王艳娥梁艳司海峰丁心安
- 关键词:K-MEANS聚类数有效性指标聚类分析
- 一种自动识别数据集中最佳聚类数的方法
- 本发明公开了一种自动识别数据集中最佳聚类数的方法,包括:在候选范围内各聚类数实例化K‑means后获得的质心基础上,通过平均畸变函数、质心、数据集以及0‑10正则化进行转换以及封装成数据对,利用反余弦函数对其进行进一步的...
- 石聪明黄永灿马靳鲜葛艳敏董晨沛宋旭柳翠寅刘应波梅盈
- 混合数据最佳聚类数的确定方法与应用
- 随着“大数据”一词的频繁出现,数据挖掘也成了一个热点名词,它代表着将大而杂的数据转换成信息的一个综合过程,聚类分析是它的重要研究方向之一。聚类算法是聚类分析的重要工具,而聚类数目往往是决定聚类算法性能的关键,鉴于大部分聚...
- 李杏丽
- 关键词:数据挖掘聚类算法聚类有效性D-S证据理论
- 文献传递
- 聚类分析中最佳聚类数确定方法研究
- 聚类分析作为数据挖掘、机器学习领域中的重要分析方法,近几十年来得到了许多专家学者的深入研究。如今,随着互联网的发展,各种数据源大量涌现,聚类分析方法也因此得到了较快的发展,并取得了许多成果。 然而,聚类分析目前仍存在许...
- 张雄
- 关键词:新闻文本聚类分析最佳聚类数K-MEANS算法
- 确定最佳聚类数的二阶差分统计法被引量:1
- 2017年
- 多元统计数据的聚类是分析数据的一类非常重要方法,但是如何确定最佳聚类数往往是比较困难的.针对分析多元统计数据中应用最广泛的方法之一——K均值聚类方法,提出了一种新的二阶差分统计确定最佳聚类数的方法,并将其与CH统计法、Gap统计法进行了对比.实证分析表明,论文所提方法更为简单而且有效.
- 崔建斌姬安召张科
- 关键词:二阶差分聚类最佳聚类数
- K-means算法最佳聚类数评价指标研究被引量:22
- 2017年
- 聚类分析广泛应用于商务智能、图像模式识别、Web搜索、生物学等领域,是一种无指导的观察式学习。然而,绝大多数聚类分析算法都面临着一个非常棘手的问题——最佳聚类数的确定。K-means是典型的基于划分的聚类方法,它需要用户输入聚类数K,但这通常非常困难。聚类数的确定是决定聚类质量的关键因素。虽然有许多被用来估计最优聚类数的聚类评价指标,但对于不同的聚类算法,不同的评价指标效果差异很大。为确定针对K-means聚类算法效果最好的评价指标,采用4种典型的不同聚类结构特征的人工模拟数据以及来自UCI的真实数据集对7种评价指标的性能进行实验比较,结果表明CH指标和I指标在评估K-means算法的最佳聚类数时效果较好。
- 郭靖侯苏
- 关键词:K-MEANS算法聚类分析聚类数
相关作者
- 周世兵

- 作品数:28被引量:411H指数:9
- 供职机构:江南大学物联网工程学院
- 研究主题:聚类有效性指标 聚类数 最佳聚类数 聚类分析 UML
- 诸克军

- 作品数:160被引量:947H指数:13
- 供职机构:中国地质大学经济管理学院
- 研究主题:遗传算法 软计算 模糊规则 人力资本 神经网络
- 徐振源

- 作品数:104被引量:540H指数:10
- 供职机构:江南大学理学院
- 研究主题:混沌系统 混沌 吸引子 MELNIKOV方法 同步化
- 唐旭清

- 作品数:59被引量:537H指数:9
- 供职机构:江南大学理学院
- 研究主题:聚类分析 分层聚类 气候因子 结构聚类 粒度空间
- 边鹏

- 作品数:3被引量:18H指数:3
- 供职机构:中国科学院国家科学图书馆
- 研究主题:最佳聚类数 推荐系统 聚类数 文本聚类 检索词