陕西省教育厅科研计划项目(11JK1029)
- 作品数:2 被引量:0H指数:0
- 相关作者:王莎杜金华刘丁更多>>
- 相关机构:西安理工大学更多>>
- 发文基金:国家自然科学基金陕西省教育厅科研计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于特征比较和最大熵模型的统计机器翻译错误检测
- 2013年
- 首先介绍3种典型的用于翻译错误检测和分类的单词后验概率特征,即基于固定位置的词后验概率、基于滑动窗的词后验概率和基于词对齐的词后验概率,分析其对错误检测性能的影响;然后,将其分别与语言学特征如词性、词及由LG句法分析器抽取的句法特征等进行组合,利用最大熵分类器预测翻译错误,并在汉英NIST数据集上进行实验验证和比较。实验结果表明,不同的单词后验概率对分类错误率的影响是显著的,并且在词后验概率基础上加入语言学特征的组合特征可以显著降低分类错误率,提高译文错误预测性能。
- 杜金华王莎
- 关键词:语言学特征最大熵分类器
- 基于多特征融合的统计机器翻译译文错误检测
- 2013年
- 抽取了3种典型的单词后验概率特征(基于固定位置的词后验概率、基于目标位置窗的词后验概率、基于词对齐的词后验概率)和3种语言学特征(词、词性、句法分析器抽取的句法特征),并在此基础上抽取了一个来自源端的单词特征,然后基于中英NIST数据集,采用最大熵分类器来验证不同单词后验概率特征(WPP)独立使用及与其它特征组合后使用时对错误检测性能的影响。实验结果表明,采用不同方法计算得到的单词后验概率特征对分类错误率的影响是显著的,并且在单词后验概率和语言学特征组合基础上加入源端单词特征,可以显著降低分类错误率(CER),提高译文错误检测能力。
- 王莎杜金华刘丁
- 关键词:最大熵分类器语言学特征