您的位置: 专家智库 > >

国家自然科学基金(JJ0500092301)

作品数:1 被引量:13H指数:1
相关作者:王少龙宋胜利陈平更多>>
相关机构:西安电子科技大学更多>>
发文基金:中央高校基本科研业务费专项资金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇语义图
  • 1篇知识表示
  • 1篇中文
  • 1篇文本分类
  • 1篇文本语义
  • 1篇相似度

机构

  • 1篇西安电子科技...

作者

  • 1篇陈平
  • 1篇宋胜利
  • 1篇王少龙

传媒

  • 1篇西安电子科技...

年份

  • 1篇2013
1 条 记 录,以下是 1-1
排序方式:
面向文本分类的中文文本语义表示方法被引量:13
2013年
为了解决词频统计文本表示方法中词语间语义信息缺失的问题,在考虑文本中词语上下文语境和语义背景信息的基础上,提出了一种新的中文文本表示模型——文本语义图.该方法利用维基百科作为知识背景计算文本中实意特征词语的语义关联,将具有较强语义关系的词语合并成词包作为图的节点,节点权值用词包所包含词语的数目及词频计算;不同词包中词语间的上下文关系作为图的有向边,有向边权值用其邻接节点的最大权值表示.该模型在较大程度地保留文本中词语上下文信息的同时强化了词语间语义内涵.通过中文文本分类实验,文本语义图分类方法相对于支持向量机分类效率提升了7.8%,同时错误率减少了1/3,且表现出更好的稳定性.实验结果表明在文本分类应用中,文本语义图模型能够有效地表示文本内容.
宋胜利王少龙陈平
关键词:知识表示相似度
共1页<1>
聚类工具0