您的位置: 专家智库 > >

李秦

作品数:1 被引量:2H指数:1
供职机构:西安交通大学数学与统计学院更多>>
发文基金:中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇文本聚类
  • 1篇聚类
  • 1篇均值聚类
  • 1篇K均值
  • 1篇K均值聚类

机构

  • 1篇西安交通大学
  • 1篇太原卫星发射...

作者

  • 1篇褚蕾蕾
  • 1篇李秦
  • 1篇常文波

传媒

  • 1篇工程数学学报

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
文本聚类中的改进特征权重算法被引量:2
2012年
本文提出了一种新的基于词频和文档频率的特征词权重计算方法ETFC.首先构造了新的函数作为特征词的类别区分度,加强了低文档频数特征词的类别区分能力.然后运用k-means算法进行聚类实验.结果表明,改进后的权重算法ETFC比现有的权重算法TFIDF和TFC在聚类纯度和算法的稳定性方面均有较大提高,从而表明改进策略是可行的.
褚蕾蕾常文波李秦
关键词:文本聚类K均值聚类
共1页<1>
聚类工具0