苏劲松
- 作品数:7 被引量:9H指数:2
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 题录信息的机器翻译方法
- 2011年
- 该文针对题录信息中的人名、地址、机构名和公司名的不同特征,分别设计了不同的翻译方法,并依靠词典和翻译规则,实现了大部分内容的翻译。对于人名翻译,该文设计了拼音转换、假名转换和同音转换的翻译方法;对于地址、机构名和公司名的翻译,该文提出了先切分、再翻译、最后调序的翻译流程。实验表明,利用该文的方法翻译人名、地址、机构名及公司名,能够取得不错的翻译效果。
- 李贤华于淼苏劲松吕雅娟
- 关键词:机器翻译人名翻译地址翻译
- 面向科技文献的机器翻译关键技术研究
- 吕雅娟米海涛姜文斌冯洋苏劲松蔡舒王志洋曹杰
- 科技文献自动翻译具有重要的研究意义和实用价值。该项目以统计机器翻译技术为基础,研究了适合科技文献翻译的机器翻译关键技术和方法。主要研究内容包括三个方面:句子骨干翻译模板的自动获取;传统语言学知识和统计机器翻译模型的融合策...
- 关键词:
- 关键词:机器翻译语言学自适应方法
- 一种基于短语搭配和高频骨干词的层次短语约束抽取方法
- 层次短语翻译模型融合了短语模型和句法模型的优点,是当前统计机器翻译的主流模型之一.然而,传统的层次短语抽取方法在抽取过程中,只考虑了对齐一致性和规则长度的限制,没有考虑到句子中存在的短语搭配和高频骨干词,因此抽取出了大量...
- 苏劲松吕雅娟刘群
- 关键词:机器翻译语言模型对数似然比
- 文献传递
- 一种考虑对齐不一致的短语翻译概率估计方法
- 2011年
- 在统计机器翻译中,短语翻译概率特征对最终的翻译结果有着重大的影响。传统的估计方法只考虑了双语短语同时出现,满足对齐一致性的情况,而没有对其他情况进行统计,因而短语翻译概率的估计不够准确。该文中,我们修改了传统的短语概率计算公式,在估计概率的过程中充分地考虑短语的各种出现情况。多个测试集上的实验结果证明了我们方法的有效性。
- 苏劲松刘群吕雅娟
- 关键词:统计机器翻译
- 利用上下文信息的统计机器翻译领域自适应被引量:4
- 2010年
- 统计机器翻译系统用于翻译领域文本时,常常会遇到跨领域的问题:当待翻译文本与训练语料来自同一领域时,通常会得到较好的翻译效果;当领域差别较大时,翻译质量会明显下降。某个特定领域的双语平行语料是有限的,相对来说,领域混杂的平行语料和特定领域的单语文本更容易获得。该文充分利用这一特点,提出了一种包含领域信息的翻译概率计算模型,该模型联合使用混合领域双语和特定领域源语言单语进行机器翻译领域自适应。实验显示,自适应模型在IWSLT机器翻译评测3个测试集上均比Baseline有提高,证明了该文方法的有效性。
- 曹杰吕雅娟苏劲松刘群
- 关键词:统计机器翻译领域自适应上下文信息
- 规则和统计相结合的中文地址翻译方法
- 本文研究了一种规则和统计相结合的中文地址翻译方法。首先利用区划词典、关键字词典和模式表进行分词及词语类型标注,并根据词语类型划分地址单元;然后,以统计翻译模型为基础结合少量的翻译词典和人工模板对地址单元进行翻译;最后,将...
- 于淼吕雅娟苏劲松李贤华
- 关键词:中文地址机器翻译统计翻译模型
- 文献传递
- 规则和统计相结合的中文地址翻译方法被引量:5
- 2012年
- 该文研究了一种规则和统计相结合的中文地址翻译方法。首先利用区划词典、关键字词典和模式表进行分词及词语类型标注,并根据词语类型划分地址单元;然后,以统计翻译模型为基础结合少量的翻译词典和人工模板对地址单元进行翻译;最后,将地址单元的翻译结果以逆序粘合在一起,形成最终译文。实验表明,利用该方法翻译中文地址能够取得较好地翻译效果。
- 于淼吕雅娟苏劲松李贤华
- 关键词:中文地址机器翻译