您的位置: 专家智库 > >

徐超

作品数:1 被引量:0H指数:0
供职机构:北京航空航天大学计算机学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇语言模型
  • 1篇统计语言模型
  • 1篇文本聚类
  • 1篇聚类
  • 1篇LDA

机构

  • 1篇北京航空航天...

作者

  • 1篇沈磊
  • 1篇周一民
  • 1篇徐超

传媒

  • 1篇电子与信息学...

年份

  • 1篇2010
1 条 记 录,以下是 1-1
排序方式:
一种面向隐含主题的上下文树核
2010年
该文针对上下文树核用于文本表示时缺乏语义信息的问题,提出了一种面向隐含主题的上下文树核构造方法。首先采用隐含狄利克雷分配将文本中的词语映射到隐含主题空间,然后以隐含主题为单位建立上下文树模型,最后利用模型间的互信息构造上下文树核。该方法以词的语义类别来定义文本的生成模型,解决了基于词的文本建模时所遇到的统计数据的稀疏性问题。在文本数据集上的聚类实验结果表明,文中提出的上下文树核能够更好地度量文本间主题的相似性,提高了文本聚类的性能。
徐超周一民沈磊
关键词:文本聚类统计语言模型
共1页<1>
聚类工具0