王楠
- 作品数:5 被引量:10H指数:2
- 供职机构:北京交通大学计算机与信息技术学院更多>>
- 发文基金:中央高校基本科研业务费专项资金国际科技合作与交流专项项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 融合语态特征的日英层次短语翻译模型
- 针对不同语种的被动和可能语态的句法结构差异影响机器翻译质量的问题,提出融合语态特征的最大熵翻译模型。首先从日语端分出被动语态、可能语态和其他语态,然后从英语端对被动和可能语态进一步分类,抽取双语特征训练最大熵规则分类模型...
- 王楠徐金安明芳陈钰枫张玉洁
- 关键词:被动语态统计机器翻译最大熵模型
- 融合被动和可能态模型的日汉统计机器翻译被引量:1
- 2016年
- 日语中谓词语态有不同的词尾变形,其中被动态和可能态具有相同的词尾变化,在统计机器翻译中难以对其正确区分及翻译。因此,该文提出一种利用最大熵模型有效地对日语可能态和被动态进行分类,然后把日语的可能态和被动态特征有效地融合到对数线性模型中改进翻译模型的方法,以提高可能态和被动态翻译规则选择的准确性。实验结果表明,该方法可以有效提升日语可能态和被动态句子的翻译质量,在大规模日汉语料上,最高翻译BLEU值能够由41.50提高到42.01,并在人工评测中,翻译结果的整体可理解度得到了2.71%的提升。
- 王楠徐金安明芳陈钰枫张玉洁
- 关键词:被动态可能态统计机器翻译最大熵模型
- 融合时态特征的日英层次短语翻译模型
- 2017年
- 针对基于层次短语翻译模型的统计机器翻译使用上下文信息有限,时态翻译质量不高的问题,提出一种融合时态特征的日英统计机器翻译方法。该方法通过引入翻译规则的时态分类约束信息,解码器可以根据每条规则的潜在时态分类,为相应时态的句子匹配到最合适的规则进行翻译。首先从双语训练语料中抽取时态特征构建最大熵分类模型,然后再抽取包含各类时态信息的层次短语规则的时态特征,最后将规则的时态分类结果作为一类新特征,融入基于层次短语的翻译系统中。实验结果表明,与基线系统相比,该方法在多个测试集上提高了翻译质量,在一定程度上解决了日英层次短语模型的时态翻译问题。
- 明芳徐金安王楠陈钰枫张玉洁
- 一种基于Android平台的即时通信方案被引量:7
- 2013年
- 个人移动终端设备的迅速发展,使得人们对信息的传递有了更高的要求。目前即时通信的研究大多针对集中式固定系统,不能最大化地发挥移动终端的特性。基于Android智能平台及无线自组技术,设计并实现一套即时通信方案,能实现小范围内的陌生用户之间的即时通信,控制短信使其具有定时发送、定时删除的功能。通过搭建实际测试环境,验证该方案能够准确地完成自组织通信以及智能短信的收发。
- 王楠宋飞周华春
- 关键词:ANDROID
- 融合语态特征的日英层次短语翻译模型被引量:2
- 2017年
- 针对不同语种的被动和可能语态的句法结构差异影响机器翻译质量的问题,提出融合语态特征的最大熵翻译模型。首先从日语端分出被动语态、可能语态和其他语态,然后从英语端对被动和可能语态进一步分类,抽取双语特征训练最大熵规则分类模型,将语态特征融合到对数线性模型中以改善翻译模型。提高解码器在翻译被动语态和可能语态时规则选择的准确性。实验结果表明,该方法可以有效地改善日英统计机器翻译的句法结构调序和词汇翻译,提升被动语态和可能语态句子的翻译质量。
- 王楠徐金安明芳陈钰枫张玉洁
- 关键词:被动语态统计机器翻译最大熵模型