您的位置: 专家智库 > >

陕西省教育厅科研计划项目(11JK1029)

作品数:2 被引量:0H指数:0
相关作者:王莎杜金华刘丁更多>>
相关机构:西安理工大学更多>>
发文基金:国家自然科学基金陕西省教育厅科研计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇语言
  • 2篇语言学
  • 2篇语言学特征
  • 2篇统计机器
  • 2篇统计机器翻译
  • 2篇最大熵
  • 2篇最大熵分类器
  • 2篇后验概率
  • 2篇机器翻译
  • 2篇翻译
  • 2篇分类器
  • 1篇多特征融合
  • 1篇译文
  • 1篇最大熵模型

机构

  • 2篇西安理工大学

作者

  • 2篇杜金华
  • 2篇王莎
  • 1篇刘丁

传媒

  • 1篇北京大学学报...
  • 1篇西安理工大学...

年份

  • 2篇2013
2 条 记 录,以下是 1-2
排序方式:
基于特征比较和最大熵模型的统计机器翻译错误检测
2013年
首先介绍3种典型的用于翻译错误检测和分类的单词后验概率特征,即基于固定位置的词后验概率、基于滑动窗的词后验概率和基于词对齐的词后验概率,分析其对错误检测性能的影响;然后,将其分别与语言学特征如词性、词及由LG句法分析器抽取的句法特征等进行组合,利用最大熵分类器预测翻译错误,并在汉英NIST数据集上进行实验验证和比较。实验结果表明,不同的单词后验概率对分类错误率的影响是显著的,并且在词后验概率基础上加入语言学特征的组合特征可以显著降低分类错误率,提高译文错误预测性能。
杜金华王莎
关键词:语言学特征最大熵分类器
基于多特征融合的统计机器翻译译文错误检测
2013年
抽取了3种典型的单词后验概率特征(基于固定位置的词后验概率、基于目标位置窗的词后验概率、基于词对齐的词后验概率)和3种语言学特征(词、词性、句法分析器抽取的句法特征),并在此基础上抽取了一个来自源端的单词特征,然后基于中英NIST数据集,采用最大熵分类器来验证不同单词后验概率特征(WPP)独立使用及与其它特征组合后使用时对错误检测性能的影响。实验结果表明,采用不同方法计算得到的单词后验概率特征对分类错误率的影响是显著的,并且在单词后验概率和语言学特征组合基础上加入源端单词特征,可以显著降低分类错误率(CER),提高译文错误检测能力。
王莎杜金华刘丁
关键词:最大熵分类器语言学特征
共1页<1>
聚类工具0