您的位置: 专家智库 > >

中国博士后科学基金(2013M541861)

作品数:1 被引量:20H指数:1
相关作者:张开旭周昌乐更多>>
相关机构:厦门大学更多>>
发文基金:中国博士后科学基金国家教育部博士点基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇中文
  • 1篇中文分词
  • 1篇无监督学习
  • 1篇分词
  • 1篇词汇
  • 1篇词汇特征
  • 1篇词性
  • 1篇词性标注

机构

  • 1篇厦门大学

作者

  • 1篇周昌乐
  • 1篇张开旭

传媒

  • 1篇中文信息学报

年份

  • 1篇2013
1 条 记 录,以下是 1-1
排序方式:
基于自动编码器的中文词汇特征无监督学习被引量:20
2013年
大规模未标注语料中蕴含了丰富的词汇信息,有助于提高中文分词词性标注模型效果。该文从未标注语料中抽取词汇的分布信息,表示为高维向量,进一步使用自动编码器神经网络,无监督地学习对高维向量的编码算法,最终得到可直接用于分词词性标注模型的低维特征表示。在宾州中文树库5.0数据集上的实验表明,所得到的词汇特征对分词词性标注模型效果有较大帮助,在词性标注上优于主成分分析与k均值聚类结合的无监督特征学习方法。
张开旭周昌乐
关键词:中文分词词性标注
共1页<1>
聚类工具0