您的位置: 专家智库 > >

国家自然科学基金(60503050)

作品数:2 被引量:102H指数:2
相关作者:索红光曹淑英刘玉树杨涛更多>>
相关机构:中国石油大学(华东)北京理工大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇信息处理
  • 1篇知网
  • 1篇特征选取
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇文档
  • 1篇文档聚类
  • 1篇向量
  • 1篇向量空间
  • 1篇向量空间模型
  • 1篇聚类
  • 1篇聚类方法
  • 1篇类方
  • 1篇互信息
  • 1篇关键词标引
  • 1篇关键词抽取
  • 1篇WEB文档
  • 1篇标引
  • 1篇抽取

机构

  • 2篇中国石油大学...
  • 1篇北京理工大学

作者

  • 2篇索红光
  • 1篇刘玉树
  • 1篇曹淑英
  • 1篇杨涛

传媒

  • 1篇广西师范大学...
  • 1篇中文信息学报

年份

  • 1篇2007
  • 1篇2006
2 条 记 录,以下是 1-2
排序方式:
一种基于词汇链的关键词抽取方法被引量:98
2006年
关键词在文献检索、自动文摘、文本聚类/分类等方面有十分重要的作用。词汇链是由一系列词义相关的词语组成,最初被用于分析文本的结构。本文提出了利用词汇链进行中文文本关键词自动标引的方法,并给出了利用《知网》为知识库构建词汇链的算法。通过计算词义相似度首先构建词汇链,然后结合词频与区域特征进行关键词选择。该方法考虑了词汇之间的语义信息,能够改善关键词标引的性能。实验结果表明,与单纯的词频、区域方法相比,召回率提高了7.78%,准确率提高了9.33%。
索红光刘玉树曹淑英
关键词:中文信息处理关键词标引关键词抽取词汇链知网
基于互信息的Web文档聚类方法被引量:4
2007年
由于网络信息的激增,如何充分利用大量的信息,并有效地为Web用户服务成为一个急需解决的问题。相关研究表明利用Web文档聚类的方法可以缩小信息检索的范围,提高查询准确率。通过分析Web文档的特征以及常用Web文档聚类方法的优缺点,提出了一种基于互信息理论的Web文档聚类的方法。在聚类的过程中,计算特征词之间的互信息值,根据阈值判断特征词是否属于同一类别。实验结果表明,该方法与K-Means聚类算法相比较,在准确率和召回率方面均有提高。
索红光杨涛
关键词:文档聚类互信息特征选取向量空间模型
共1页<1>
聚类工具0