您的位置: 专家智库 > >

王华勇

作品数:2 被引量:81H指数:2
供职机构:东北大学更多>>
发文基金:国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...
  • 1篇文化科学

主题

  • 2篇中文
  • 2篇中文文本
  • 2篇中文文本分类
  • 2篇文本分类
  • 1篇向量
  • 1篇改进KNN算...
  • 1篇KNN

机构

  • 2篇东北大学

作者

  • 2篇李莹
  • 2篇王华勇
  • 2篇张晓辉
  • 1篇赵宏
  • 1篇常桂然

传媒

  • 1篇小型微型计算...
  • 1篇东北大学学报...

年份

  • 1篇2004
  • 1篇2003
2 条 记 录,以下是 1-2
排序方式:
应用特征聚合进行中文文本分类的改进KNN算法被引量:66
2003年
针对以KNN为代表的VSM模型存在的向量各特征项孤立处理问题 ,提出了一种应用特征聚合方式的改进算法·该算法通过CHI概率统计计算文本特征词对分类的贡献 ,将对分类有相同贡献的文本特征词聚合 ,使用它们共同的分类贡献模式代替传统算法中单个词对应向量一维的方式·该算法提高了稀有词对分类的贡献、强化了关联词的分类效果、并降低了文本向量的维数·与传统KNN算法进行的对比实验证明 。
张晓辉李莹王华勇赵宏
关键词:改进KNN算法中文文本分类
一种应用向量聚合技术的KNN中文文本分类方法被引量:19
2004年
针对 KNN文本分类方法中不考虑特征词关联的问题 ,提出一种改进方法 .这种方法基于对体现词和类别间相关程度的 CHI统计值分布的分析 ,应用向量聚合技术很好地解决了关联特征词的提取问题 .其特点在于 :聚合文本向量中相关联的特征词作为特征项 ,从而取代传统方法中一个特征词对应向量一维的做法 ,这样不但缩减了向量的维数 ,而且加强了特征项对文本分类的贡献 .实验表明该方法明显提高了分类的准确率和召回率 .
李莹张晓辉王华勇常桂然
关键词:KNN中文文本分类
共1页<1>
聚类工具0