贡保才让
- 作品数:7 被引量:28H指数:3
- 供职机构:青海师范大学更多>>
- 发文基金:青海省科技计划项目国家自然科学基金教育部重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术语言文字电子电信更多>>
- 深层神经网络的藏文命名实体识别研究
- 藏文命名实体识别是藏语自然语言处理的关键技术之一,也是机器翻译、信息提取和智能问答等综合应用的重要基础。藏文命名实体识别的工作目前主要使用统计方法,而统计的命名实体识别方法在处理文本形式、内容的多样化而面临效率低的问题,...
- 贡保才让
- 关键词:自然语言处理神经网络
- 汉藏科技机器翻译系统
- 李延福德盖才郎韩维良才让加贡保才让扎洛张国喜等
- 该成果先后在汉藏英电子词典、汉藏规则库、汉语自动分词系统、汉藏转换生成系统以及汉藏英词汇互译系统等方面取得了突破性进展,研制成功了汉藏科技机器翻译系统CTMT863Ver1.0。该翻译系统词典规模合理,机译规则,具有词...
- 关键词:
- 关键词:机器翻译计算机应用
- 藏文音节拼写检查的CNN模型被引量:10
- 2019年
- 藏文音节拼写检查是藏语自然语言处理的基本任务,在藏文文字处理、文字识别、文本生成等领域具有广泛的应用。该文首先针对藏文音节的结构提出了音节向量化的方法,即音节矩阵。然后构建了适合于藏文音节拼写检查的CNN模型,使用1 364 880个藏文音节进行训练。最后对68 244个藏文音节进行测试。实验结果显示,藏文音节拼写检查CNN模型的结果优于规则、RNN和LSTM等模型,不仅对符合藏文文法的音节能正确识别外,而且对梵音藏文音节也能有效识别,正确率、召回率以及F值分别为99.52%、99.30%和99.41%。
- 色差甲贡保才让才让加
- 关键词:藏文音节拼写检查
- 融合藏族人名音节特征的性别自动识别被引量:2
- 2017年
- 藏族人名的性别自动识别是自然语言处理中非常重要的基础性问题之一.文章中提出了融合音节特征的SVM模型藏族人名性别识别方法,采用支持向量机(SVM)模型为基本框架,依据藏族人名的构词特征和统计分析,设计了特征模板,使支持向量机模型有效地处理藏族人名性别识别问题.实验结果表明,在包含18 821个藏族人名的103974个句子中,随机抽取3 764个藏族人名作为测试语料,对SVM的高斯核、线性核、多项式核和S型核等4个常用核函数做了实验,性别自动识别的准确率分别达到99.98%、98.81%、96.98%和95.45%.
- 夏吾吉华却才让色差甲贡保才让扎西吉
- 关键词:性别识别
- 基于卷积神经网络的藏文手写数字识别被引量:5
- 2019年
- 藏文字处理和藏文数字自动识别等对藏文信息处理技术的潜在需求越来越高,目前已经成为藏区重要的研究课题之一。文中首先采集并构建藏文手写数字数据共15 000个样本,其中13 000个样本为训练数据,2 000个样本为测试数据,并对其进行预处理,后采用卷积神经网络(CNN)模型对藏文手写数字样本进行训练。经实验验证在测试集上的识别正确率达97.85%。
- 夏吾吉色差甲扎西吉贡保才让华却才让
- 关键词:CNN数据预处理自动识别
- 基于最大熵和HMM的藏文新词识别对比研究被引量:2
- 2018年
- 藏文新词在科技、新闻和网络等领域不断出现,对藏文自动分析带来了挑战.本文将使用序列标注方法来识别藏文新词,首先用规则方式将时间词、数词、后接成份嵌入到统计模型中,然后利用统计学习的方法对包括新闻、法律、小说、诗歌、中小学教材和地名等多种题材的共15万藏文句子进行统计建模,最后对3087句(其中包含12348个新词)开放语料进行测试,实验结果表明将规则嵌人到最大熵模型比嵌入到HMM模型中的正确率、召回率、F值分别高1.772、0.3905、1.0912个百分点,对于藏文新词识别最大熵模型优于HMM模型.
- 色差甲贡保才让才让加
- 关键词:最大熵模型HMM模型自动分词
- 基于Naive Bayes的藏文人名性别自动识别被引量:2
- 2017年
- 藏文指代消解是藏文信息处理的重要内容也是难点之一.本文利用Naive Bayes模型实现了藏文人名性别的自动识别,从而达到人称代词消解的目的.本方法根据人名的结构和用字(syllable)信息,利用Naive Bayes模型进行机器学习,对3463个藏族人名数据进行开放语料的测试,男女综合人名的准确率达到了99.31%.
- 贡保才让色差甲慈祯嘉措桑杰端珠才让加
- 关键词:NAIVEBAYES自动识别