您的位置: 专家智库
>
资助详情>
教育部“春晖计划”(Z2012102)
教育部“春晖计划”(Z2012102)
- 作品数:5 被引量:49H指数:4
- 相关作者:赵海兴刘群姜文斌更多>>
- 相关机构:青海师范大学陕西师范大学中国科学院更多>>
- 发文基金:教育部“春晖计划”国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 判别式藏语文本词性标注研究被引量:9
- 2014年
- 该文在分析了现有藏文词性标注方法的基础上,提出感知机训练模型的判别式藏语词性标注方法,重点研究了符合藏语词法特性的模型训练特征模板、模型训练和词性标注方法。并且在人工标注的测试集上获得了98.26%的词性标注精确率,可以实际应用到藏语自然语言处理中。
- 华却才让刘群赵海兴
- 关键词:词性标注
- 藏文复合句的依存句法分析被引量:8
- 2016年
- 为解决藏文复合句引起的依存句法分析性能下降的主要问题,该文提出了一种基于判别式的藏文复合句切分标注方法,先根据藏文固有的虚词语法结构和连词特征,将复合句子切分标注为句法分析的基本单元,然后将句法分析之后的各个部分依据主分句关系进行合并,生成复合句的完整分析结果。实验结果表明该方法在一定程度上降低了藏文复合句依存句法分析的复杂度,最终句法分析的准确率达到88.72%。
- 华却才让赵海兴
- 关键词:句法分析
- 基于感知机模型藏文命名实体识别被引量:27
- 2014年
- 藏文命名实体识别是藏文分词和标注系统中必须要解决的问题。通过对命名实体构词规律及分词歧义进行分析,提出基于音节特征感知机训练模型的藏文命名实体识别方案。重点研究了利用藏文紧缩格识别音节的方法,命名实体内部和边界音节的模型训练特征模板,训练模型,以及命名实体分类识别方法。提出的藏文命名实体识别方法在测试集上获得86.03%的F值,相对基于分词的基线系统高出10.5%个点。
- 华却才让姜文斌赵海兴刘群
- 关键词:藏文音节
- 基于词对依存分类的藏语树库半自动构建研究被引量:8
- 2013年
- 依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。
- 华却才让姜文斌赵海兴刘群
- 藏文屏幕取词和翻译关键技术研究
- 2015年
- 藏语屏幕取词翻译及关键技术对屏幕信息获取和自然语言处理具有重要的意义.本文提出了藏语屏幕取词翻译的基本框架,采用截获系统文本处理消息、识别藏文文本、分词和词典翻译方法,初步实现了支持不同Windows平台和应用软件环境的藏汉英屏幕取词翻译系统.
- 华却才让赵海兴
- 关键词:屏幕取词藏文分词