李天侠
- 作品数:3 被引量:2H指数:1
- 供职机构:南京大学计算机科学与技术系更多>>
- 发文基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 汉语分词中交集型歧义消解的研究
- 汉语自动分词是信息提取、信息检索、机器翻译、文本分类、自动文摘、语音识别、文本语音转换、自然语言理解等中文信息处理领域的基础研究课题。尽管已被研究了二十多年,分词仍然是中文信息处理的瓶颈问题。
本文针对交集型歧义这...
- 李天侠
- 关键词:自然语言处理汉语自动分词交集型歧义中文信息处理
- 基于混合模型的交集型歧义消歧策略被引量:2
- 2008年
- 针对交集型歧义这一汉语分词中的难点问题,提出了一种规则和统计相结合的交集型歧义消歧模型。首先,根据标注语料库,通过基于错误驱动的学习思想,获取交集型歧义消歧规则库,同时,利用统计工具,构建N-Gram统计语言模型;然后,采用正向/逆向最大匹配方法和消歧规则库探测发现交集型歧义字段;最后,通过消歧规则库和评分函数进行交集型歧义的消歧处理。这种基于混合模型的方法可以探测到更多的交集型歧义字段,并且结合了规则方法和统计方法在处理交集型歧义上的优势。实验表明,这种方法提高了交集型歧义处理的精度,为解决交集型歧义提供了一种新的思路。
- 李天侠戴新宇陈家骏
- 关键词:交集型歧义统计语言模型全切分
- 面向奥运的日汉翻译引擎
- 陈家骏戴新宇尹存燕王启祥彭曦周俊生孙明欣王迪王飞浦珂李天侠倪瑞煜张建华金自翔李元龙
- 该成果实现了一个面向奥运领域的具有较高翻译质量的日汉机器翻译引擎,该翻译引擎提供了词、短语、句子、纯文本以及html文本的翻译,实现的日汉机器翻译引擎采用了基于转换翻译技术和翻译记忆技术,具体实现技术还包括多线程翻译、实...
- 关键词:
- 关键词:机器翻译日语汉语