辽宁省自然科学基金(20072032)
- 作品数:2 被引量:13H指数:2
- 相关作者:王会珍朱靖波张俐李超朱慕华更多>>
- 相关机构:东北大学更多>>
- 发文基金:沈阳市科学技术计划项目辽宁省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于领域类别信息C-value的多词串自动抽取
- 文本的多词串抽取是自然语言处理领域一项重要的研究内容,其中C-value是目前广泛应用的多词串抽取方法。然而C-value方法不能有效利用领域类别信息,即使文本的领域类别已知或者容易获得。针对这种情况,本文提出了一种多类...
- 李超王会珍朱慕华张俐朱靖波
- 关键词:领域信息
- 文献传递
- 基于文本-模板直接匹配的机器翻译系统
- 模板匹配是影响基于模板的机器翻译(PBMT)性能的关键因素。本文提出了一种面向机器翻译的文本-模板直接匹配算法。该算法可绕过模板抽取步骤,将待翻译句子和实例库中的模板直接进行匹配,以避免复杂的语法分析。同时我们构建了基于...
- 吴闯吴宏林张俐刘绍明
- 文献传递
- 基于领域类别信息C-value的多词串自动抽取被引量:8
- 2010年
- 该本的多词串抽取是自然语言处理领域一项重要的研究内容。该文提出了一种多类别C-value(Multi-Class C-value)方法,利用多词串在不同领域的分布信息改善领域相关的多词串抽取的性能。在汽车、科技和旅行三个领域的数据上进行实验,评价多词串的准确率,在top-100级别上,较传统的C-value方法在三个领域中分别提高了12、12和13个百分点。实验结果验证了方法的有效性。
- 李超王会珍朱慕华张俐朱靖波
- 关键词:中文信息处理领域信息
- 面向统计机器翻译的重对齐方法研究被引量:5
- 2010年
- 词对齐是统计机器翻译中的重要技术之一。该文提出了一种重对齐方法,它在IBM models获得的正反双向词对齐的基础上,确定出正反双向对齐不一致的部分。之后,对双向词对齐不一致的部分进行重新对齐以得到更好的对称化的词对齐结果。此外,该文提出的方法还可以利用大规模单语语料来强化对齐结果。实验结果表明,相比在统计机器翻译中广泛使用的基于启发信息的词对齐对称化方法,该文提出的方法可以使统计机器翻译系统得到更高的翻译准确率。
- 肖桐李天宁陈如山朱靖波王会珍
- 关键词:人工智能机器翻译统计机器翻译词对齐
- 面向统计机器翻译的重对齐方法研究
- 词对齐是统计机器翻译中的重要技术之一。本文提出了一种重对齐方法,它在IBM models获得的正反双向词对齐的基础上,确定出正反双向对齐不一致的部分。之后,对双向词对齐不一致的部分进行重新对齐以得到更好的对称化的词对齐结...
- 肖桐李天宁陈如山朱靖波王会珍
- 关键词:统计机器翻译词对齐
- 文献传递