您的位置: 专家智库 > >

国家自然科学基金(11201070)

作品数:1 被引量:10H指数:1
相关作者:文翰肖南峰更多>>
相关机构:佛山大学华南理工大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇文本聚类
  • 1篇聚类
  • 1篇半监督聚类

机构

  • 1篇佛山大学
  • 1篇华南理工大学

作者

  • 1篇肖南峰
  • 1篇文翰

传媒

  • 1篇模式识别与人...

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
基于强类别特征近邻传播的半监督文本聚类被引量:10
2014年
为处理高维稀疏的大规模文档数据,提出一种基于强类别特征近邻传播(SCFAP)的半监督文本聚类算法.聚类过程中,利用少量带类别标签的监督数据,提取具有强类别区分能力的特征项以构建更有效的样本间相似性测度.并在每轮迭代完成后将类别确定性程度最高的未标记样本转移到已标注集,使算法执行效率提高.实验结果表明,这种改进对于近邻传播算法的性能和准确度的提升有较大帮助,在Reuter-21578和20Newsgroups两个相异数据集上,SCFAP算法表现较好的适用性.综合考察聚类微平均Fμ指标和类簇纯度Pt指标,该算法在少量监督信息辅助下能快速获得较好的聚类结果.
文翰肖南峰
关键词:半监督聚类
共1页<1>
聚类工具0