您的位置: 专家智库 > >

夏飞

作品数:1 被引量:23H指数:1
供职机构:华盛顿大学更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇语料
  • 1篇语料库
  • 1篇上古
  • 1篇上古汉语
  • 1篇淮南子
  • 1篇古汉语
  • 1篇汉语
  • 1篇汉语分词
  • 1篇分词
  • 1篇《淮南子》
  • 1篇词性
  • 1篇词性标注

机构

  • 1篇香港城市大学
  • 1篇香港理工大学
  • 1篇华盛顿大学

作者

  • 1篇宋彦
  • 1篇夏飞

传媒

  • 1篇中文信息学报

年份

  • 1篇2013
1 条 记 录,以下是 1-1
排序方式:
上古汉语分词及词性标注语料库的构建——以《淮南子》为范例被引量:23
2013年
该文介绍了以《淮南子》为文本的上古汉语分词及词性标注语料库及其构建过程。该文采取了自动分词与词性标注并结合人工校正的方法构建该语料库,其中自动过程使用领域适应方法优化标注模型,在分词和词性标注上均显著提升了标注性能。分析了上古汉语的词汇特点,并以此为基础描述了一些显式的词汇形态特征,将其运用于我们的自动分词及词性标注中,特别对词性标注系统带来了有效帮助。总结并分析了自动分词和词性标注中出现的错误,最后描述了整个语料库的词汇和词性分布特点。提出的方法在《淮南子》的标注过程中得到了验证,为日后扩展到其他古汉语资源提供了参考。同时,基于该文工作得到的《淮南子》语料库也为日后的古汉语研究提供了有益的资源。
留金腾宋彦夏飞
关键词:分词词性标注
共1页<1>
聚类工具0