胡鹏龙
- 作品数:4 被引量:2H指数:1
- 供职机构:哈尔滨工业大学计算机科学与技术学院语言语音教育部-微软重点实验室更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 结构化学习的噪声可学习性分析及其应用被引量:2
- 2013年
- 噪声可学习性理论指出,有监督学习方法的性能会受到训练样本标记噪声的严重影响.然而,已有相关理论研究仅针对二类分类问题.致力于探究结构化学习问题受噪声影响的规律性.首先,注意到在结构化学习问题中,标注数据的噪声会在训练过程中被放大,使得训练过程中标记样本的噪声率高于标记样本的错误率.传统的噪声可学习性理论并未考虑结构化学习中的这一现象,从而低估了问题的复杂性.从结构化学习问题的噪声放大现象出发,提出了新的结构化学习问题的噪声可学习性理论.在此基础上,提出了有效训练数据规模的概念,这一指标可用于在实践中描述噪声学习问题的数据质量,并进一步分析了实际应用中的结构化学习模型在高噪声环境下向低阶模型回退的情况.实验结果证明了该理论的正确性及其在跨语言映射和协同训练方法中的应用价值和指导意义.
- 于墨赵铁军胡鹏龙郑德权
- 关键词:词性标注自然语言处理半监督学习
- CWMT2011哈工大机器智能与翻译研究室技术报告
- 本文详细介绍了哈尔滨工业大学机器智能与翻译研究室(HIT-MITLA)参加2011年全国机器翻译研讨会(cwMT2011)翻译评测任务的情况。在本次评测中,HIT-MITLAB共使用了5个翻译系统,它们分别是DINO,M...
- 梁华参刘乐茂于墨刘宇鹏胡鹏龙李婷婷张春越曹海龙赵铁军
- 关键词:机器翻译短语翻译
- 文献传递
- 基于半监督结构化学习的跨语言词性标注研究
- 自然语言处理技术在当今信息时代取得了巨大的成功,人们的生活方方面面都离不开自然语言处理技术。随着人们文化交流的需要,对一些小语种也有自然语言处理需求,往往这些语言的标注资源稀缺,限制了自然语言技术在这些语言上的发展。人们...
- 胡鹏龙
- CWMT2011哈工大机器智能与翻译研究室技术报告
- 本文详细介绍了哈尔滨工业大学机器智能与翻译研究室(HIT-MITLA)参加2011年全国机器翻译研讨会(CWMT2011)翻译评测任务的情况。在本次评测中,HIT-MITLAB共使用了5个翻译系统,它们分别是DINO,M...
- 梁华参刘乐茂于墨刘宇鹏胡鹏龙李婷婷张春越曹海龙赵铁军
- 关键词:机器翻译短语翻译