搜索到3814篇“ 最佳聚类数“的相关文章
基于自组织的算法及最佳的确定研究
戴清旭
基于加权二分图的K均值最佳确定算法被引量:5
2023年
针对传统K均值算法无法精确预设初始中心目的问题,提出基于加权二分图的K均值最佳确定算法。设计等比例随机采样的方式,从原始大据集中产生小据集集合并从中产生中心点点集,提高应对大规模据集的能力;用中心点点集形成二分图,针对算法特性改进其赋权函;设计评价,改进Kuhn-Munkres算法,将其用于求取二分图的最大权完美匹配,确定最佳。实验结果表明,相较其它6种对比算法,所提算法有更高的准确性,更好的稳定性,以及更强的处理大规模据集能力。
林伟杰王勇周林
关键词:K均值初始聚类中心随机采样二分图最佳聚类数完美匹配
基于加权不稳定性的最佳确定方法
据分析方法中,分析是据处理的重要手段,它可以依据据的相似特征对样本进行划分,挖掘据中的潜在信息。分析经过了几十年的研究,学者们提出了适用于不同据结构的算法和有效性指标,广泛应用于其他领域。据集的...
顾鉴桥
关键词:聚类分析最佳聚类数
分析中的最佳确定方法研究
作为无监督学习方法的一种,分析是从无标记据集中获取信息和知识的重要手段,是据挖掘、统计学、模式识别等领域的重要研究内容。通过有效的分析,据集的内在结构与特征可以被很好地发掘出来。随着据挖掘和人工智能技术的...
张远翔
关键词:聚类分析最佳聚类数时间复杂度
文献传递
基于K-means算法的最佳研究被引量:15
2020年
针对算法在实现的过程中需要预先设定最终目的问题,提出了基于同全部样本的内紧密度和间离差度的一种新有效性指标,通过该指标能够有效地确定据集的最佳。在确定最佳的过程中采用K-means算法,针对K-means算法随机选择初始中心的缺陷,提出以欧式距离度量样本相似度,基于样本方差,选出方差最小的前K个样本作为初始中心,避免噪声点成为初始中心,使得选择的初始中心位于样本集稠密区域,Kmeans的结果稳定有效。使用优化K-means算法和新的有效性指标确定据集的簇,通过在UCI据集和人工模拟据集上测试,证明文本算法在球形且噪声点较少的样本集中,能够有效地找出最佳且算法运行速度快。
王艳娥梁艳司海峰丁心安
关键词:K-MEANS聚类数有效性指标聚类分析
一种自动识别据集中最佳的方法
本发明公开了一种自动识别据集中最佳的方法,包括:在候选范围内各实例化K‑means后获得的质心基础上,通过平均畸变函、质心、据集以及0‑10正则化进行转换以及封装成据对,利用反余弦函对其进行进一步的...
石聪明黄永灿马靳鲜葛艳敏董晨沛宋旭柳翠寅刘应波梅盈
混合最佳的确定方法与应用
随着“大据”一词的频繁出现,据挖掘也成了一个热点名词,它代表着将大而杂的据转换成信息的一个综合过程,分析是它的重要研究方向之一。算法是分析的重要工具,而目往往是决定算法性能的关键,鉴于大部分...
李杏丽
关键词:数据挖掘聚类算法聚类有效性D-S证据理论
文献传递
分析中最佳确定方法研究
分析作为据挖掘、机器学习领域中的重要分析方法,近几十年来得到了许多专家学者的深入研究。如今,随着互联网的发展,各种据源大量涌现,分析方法也因此得到了较快的发展,并取得了许多成果。  然而,分析目前仍存在许...
张雄
关键词:新闻文本聚类分析最佳聚类数K-MEANS算法
确定最佳的二阶差分统计法被引量:1
2017年
多元统计据的是分析据的一非常重要方法,但是如何确定最佳往往是比较困难的.针对分析多元统计据中应用最广泛的方法之一——K均值方法,提出了一种新的二阶差分统计确定最佳的方法,并将其与CH统计法、Gap统计法进行了对比.实证分析表明,论文所提方法更为简单而且有效.
崔建斌姬安召张科
关键词:二阶差分聚类最佳聚类数
K-means算法最佳评价指标研究被引量:22
2017年
分析广泛应用于商务智能、图像模式识别、Web搜索、生物学等领域,是一种无指导的观察式学习。然而,绝大多分析算法都面临着一个非常棘手的问题——最佳的确定。K-means是典型的基于划分的方法,它需要用户输入K,但这通常非常困难。的确定是决定质量的关键因素。虽然有许多被用来估计最优评价指标,但对于不同的算法,不同的评价指标效果差异很大。为确定针对K-means算法效果最好的评价指标,采用4种典型的不同结构特征的人工模拟据以及来自UCI的真实据集对7种评价指标的性能进行实验比较,结果表明CH指标和I指标在评估K-means算法的最佳时效果较好。
郭靖侯苏
关键词:K-MEANS算法聚类分析聚类数

相关作者

周世兵
作品数:28被引量:411H指数:9
供职机构:江南大学物联网工程学院
研究主题:聚类有效性指标 聚类数 最佳聚类数 聚类分析 UML
诸克军
作品数:160被引量:947H指数:13
供职机构:中国地质大学经济管理学院
研究主题:遗传算法 软计算 模糊规则 人力资本 神经网络
徐振源
作品数:104被引量:540H指数:10
供职机构:江南大学理学院
研究主题:混沌系统 混沌 吸引子 MELNIKOV方法 同步化
唐旭清
作品数:59被引量:537H指数:9
供职机构:江南大学理学院
研究主题:聚类分析 分层聚类 气候因子 结构聚类 粒度空间
边鹏
作品数:3被引量:18H指数:3
供职机构:中国科学院国家科学图书馆
研究主题:最佳聚类数 推荐系统 聚类数 文本聚类 检索词