教育部人文社会科学研究基金(07JC740009)
- 作品数:3 被引量:6H指数:2
- 相关作者:王永生更多>>
- 相关机构:同济大学更多>>
- 发文基金:教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 自动获取不同义项的相似词算法
- 2015年
- 词汇相似度广泛应用于自然语言处理的多个领域。然而词汇相似度的计算一般都是基于词而不是基于词的义项来进行的。针对这种情况,提出一种相似词的分类算法。算法首先采用PMImax工具来计算目标词的相似词,然后以Word Net的义项为参照,采用一种改进后的Lesk算法自动将这些相似词按照不同的义项进行分类,每一类相似词只跟对应的义项相似。实验结果表示,该算法的分类正确率可达到84.27%。
- 王永生
- 关键词:词汇相似度WORDNET
- 英汉机器翻译系统中的词性标注研究被引量:2
- 2010年
- 词性标注是英汉机器翻译系统中一个基础性的研究课题。提出了一种基于决策树的词性标注的非监督学习算法,在只有一个词库的有限条件下,通过决策树进行词性标注的非监督学习,生成词性标注规则。
- 王永生
- 关键词:英汉机器翻译词性标注决策树
- 基于改进的Lesk算法的词义排歧算法被引量:4
- 2013年
- 英文中的一词多义现象非常普遍,这给英文的词义排歧带来了极大的困难。针对这种情况,提出了一种基于改进的Lesk算法的词义排歧算法,即以语义词典WordNet为基础,借助CBC算法扩充目标词的相似词集合,通过改进的Lesk算法进行词义排歧。算法以英文Senseval-2任务作为测试目标,通过对目标词的义项进行筛选,去除其中一些不常用的义项,实验结果表明,总体排歧正确率达到58.4%。
- 王永生
- 关键词:词义排歧WORDNET