您的位置: 专家智库 > >

刘殷

作品数:3 被引量:4H指数:1
供职机构:北京信息科技大学更多>>
发文基金:国家自然科学基金北京市教委科技发展计划国家社会科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇语料
  • 1篇异源
  • 1篇映射
  • 1篇随机场
  • 1篇条件随机场
  • 1篇中文
  • 1篇自顶向下
  • 1篇自动识别
  • 1篇分词
  • 1篇复杂句
  • 1篇词类

机构

  • 3篇北京信息科技...
  • 2篇清华信息科学...
  • 1篇北京拓尔思信...

作者

  • 3篇吕学强
  • 3篇刘殷
  • 2篇周强
  • 1篇毛婷婷

传媒

  • 1篇小型微型计算...
  • 1篇计算机工程与...
  • 1篇中文信息学报

年份

  • 3篇2016
3 条 记 录,以下是 1-3
排序方式:
融合从底向上与自顶向下的中文复杂句人工标注方法被引量:1
2016年
大规模、高质量的中文树库的建立对中文句法分析的发展有着重要的意义,但是对于字数多、结构层次复杂的中文复杂句的标注仍费时费力并且标注质量不高.这严重影响了中文树库的建立速度,阻碍了中文句法分析的发展.因此,该文提出一种融合了从底向上和自顶向下的中文复杂句标注方法,该方法将复杂句切分成结构较简单的块进行分析.实验表明,与传统的从底向上的标注方法相比,该文中的方法的校对速度快于传统方法,且整体差异率和分阶段的差异率降低了约20%,说明该文中的方法在对中文复杂度的标注是有效的且实用的.
毛婷婷吕学强周强刘殷
异源语料融合研究
2016年
语料资源与自然语言处理领域的各项研究息息相关,具有很大的应用价值。由于不同的研究机构对于语料标注的规则和标记的类型不尽相同,使得不同的语料库很难组合为一个更大的语料库来进行使用。针对该问题,该文从不同标注库及词类映射层面考虑,对其产生的词性歧义问题进行了研究,提出了一种将异源语料融合到一种体系下的方法,对词类信息进行映射和消歧,并进行了实验验证,融合后的词性信息准确率可达87%,实验结果表明该方法具有一定的有效性和可扩展性。
吕学强仵永栩周强刘殷
条件随机场与多层算法模型的实体自动识别被引量:3
2016年
实体自动识别技术是人们获取信息的有力手段,也是自然语言处理研究的关键技术之一。目前命名实体识别的研究较多,且已趋于成熟,而对汉语文本中的其他实体(名词性、代词性)研究较少。因此提出了一体化识别命名实体识别和名词性实体的方法,该方法将实体的汉字、分词、词性标注等信息引入条件随机场;再利用多层算法模型优化已经识别出的实体,以及召回未识别出的实体。在标准ACE语料库上进行实验,正确率达到75.56%,召回率达到72.52%。结果表明该方法对于实体识别问题是有效的。
刘殷吕学强刘坤
关键词:条件随机场分词
共1页<1>
聚类工具0