柔特
- 作品数:19 被引量:18H指数:3
- 供职机构:青海师范大学计算机学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金教育部“春晖计划”更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 支持舆情服务的藏汉机器翻译关键技术及应用
- 2020年
- 课题主要通过建设藏文语料库、藏汉平行语料库、藏文情感词词典等基础资源,研究主流藏文编码的识别与转换技术、藏文信息处理的规范化和标准化、藏文自动分析技术、藏语语料库处理技术、藏汉平行语料库处理技术、藏文字符排序及藏语舆情分析技术,设计基于统计的藏汉机器翻译模型与藏语倾向性分析模型,解决藏语舆情分析与机器翻译系统的无缝链接技术问题,开发支持舆情服务的藏汉机器翻译系统,利用该系统将藏文网络舆情信息即时翻译成汉文,为藏文网络舆情的可控性提供技术支持和理论依据.
- 赵海兴才让加才藏太才智杰华却才让黄鹤鸣吉太加柔特索南才让头旦才让周毛先
- 关键词:机器翻译系统平行语料库藏文信息处理无缝链接
- 注意力的端到端模型生成藏文律诗
- 2019年
- 文本自动撰写在自然语言处理中是一个重要的研究领域,可通过人工智能的方法来提升文本的生成结果。目前主流的生成方法是基于深度学习的方法,而该文则提出了一种基于注意力的端到端模型生成藏文律诗法。该方法基本框架是一个双向LSTM的编码—解码模型,在此基础上引入了藏文字嵌入、注意力机制和多任务学习法。实验结果表明,该文提出的方法在藏文律诗生成结果中BLEU值和ROUGE值分别能达到59.27%、62.34%,并无需任何人为的特征设置。
- 色差甲华果才让才让加慈祯嘉措柔特
- 藏语语料库切分标注规范-词语分类体系及标记集
- 才让加吉太加才藏太华却才让扎洛才智杰索南仁欠陈玉忠柔特王永生卢亚军尼玛卓玛
- 该课题研究制定了基于藏语语料库的藏语词语分类体系。制定完成的《藏语语料库词类标记集》,具有科学性和实用性。新的分类体系在大类的划分上与传统藏语语法分类体系保持衔接,分类方法科学合理,对藏语语料库的建设将起到积极的促进作用...
- 关键词:
- 关键词:文字处理软件藏语语料库
- 班智达藏文自动标注系统
- 才让加才智杰扎洛才藏太华却才让索南仁欠吉太加柔特卢亚军尼玛卓玛
- 《班智达藏文标注系统》是国家语委科研项目《藏语语料库切分标注规范及其辅助工具研究》的子项目,项目编号:MZ05-118,项目起止时间:2005年9月-2008年5月,成果是以光盘形式的软件产品。该软件可将藏文文本自动切分...
- 关键词:
- 关键词:藏文藏语
- 班智达藏文自动切分系统
- 才让加才智杰扎洛才藏太华却才让索南仁欠吉太加陈玉忠柔特卢亚军尼玛卓玛王永生
- 该软件可将藏文文本自动切分成藏语语法最小的基本单位词,可以切分纯藏文文本和含有英文、阿拉伯数字及各种符号的藏文文本,同时提供了100万字节的切分语料。该系统界面友好,易操作,运行稳定,所建立的切分语料库的切分准确率达97...
- 关键词:
- 关键词:文字处理软件藏文文本
- 一种端到端的藏文La格浅层语义分析
- 2023年
- 该文通过详细分析La格的用法及特征,在研制La格(■)浅层语义标记规范的基础上,提出一种端到端的长短时记忆神经网络藏文La格浅层语义分析方法,该方法首先借鉴LSTM的设计思路,通过在LSTM的垂直方向上装置一个新颖的“门控高速连接”机制(Gated high-speed connection mechanism,GM),学习了输入句子的时序语义特征。GM包含对单元内部输入和输出的线性连接,使信息可以通畅地在不同层之间传播;然后使用Softmax计算每一时刻语义标签的局部归一化分布,以供输出层进行约束解码;最后使用维特比算法进行解码时通过强制执行该文设定的BIO和La格浅层语义标注约束,规范了输出语义标签之间的结构关系。虽然这个模型比较简单,不需要输入任何额外特征,但取得了理想的实验结果,在测试集上的藏文La格浅层语义分析准确率达到90.59%。
- 班玛宝色差甲才让加张瑞柔特
- 关键词:自然语言处理浅层语义分析
- 基于WordNet的藏文语义词典半自动构建方法研究被引量:3
- 2014年
- 语义词典是人工智能、语义网与知识工程等研究领域的热点,它可以支持机器学习、自然语义理解、数据挖掘及机器翻译等技术。文章在藏语独特的文法理论研究基础上,利用对比英文和藏文词之间的语义关系、构建双语大型数据库和制定映射过程中词汇空缺等方法,构建了基于半自动匹配的藏文语义词典。本语义词典既兼容了国际通用的英文WordNet,又保留了藏语的特点,为藏文信息处理提供了重要的数据资源。
- 柔特
- 关键词:半自动WORDNET
- 现代藏文字构件分解系统
- 才智杰才让卓玛才让加柔特才藏太华却才让尖木措尚麻王宁芳胡枫
- “现代藏文字构件分解系统”研究了藏文信息处理领域中藏文字构件分解问题,该系统设计理念先进、研究方法科学、操作性强,分解准确可靠。该课题为分析、统计藏文字各部件出现的频率、分布规律和构成藏文字部件数等特征提供了技术支持。该...
- 关键词:
- 关键词:机器翻译系统
- 基于循环卷积神经网络的藏文句类识别被引量:3
- 2019年
- 句子是语言的最小使用单位,句类识别是为了进一步细化句法和句义研究。由于藏文句尾通常没有特殊的标点符号来识别不同句类,因此这一藏文语言特性就变成了一大难题。该文提出了基于语境和功能特征为一体的句子用途分类方案。首先,该文介绍了文法中藏文句子分类及其特征。其次,收集了大量藏文句子并对其进行了人工标注。最后,采用循环卷积神经网络对藏文句类进行了自动识别。实验表明,该模型对藏文句类识别有较为显著的效果。
- 柔特才让加
- 藏文句义分割方法被引量:2
- 2020年
- 句子是字或词根据语法规则进行组合的编码,句义分割是句子组合规律的解码问题,即对句义进行解析。在藏文分词后直接进行语义分析,其颗粒度过小,容易出现词语歧义,而以句子为分析单位,则颗粒度过大,不能较好地揭示句子的语义。为此,提出一种藏文句义分割方法,通过长度介于词语和句子之间的语义块单元进行句义分割。在对句子进行分词和标注的基础上,重新组合分词结果,将句子分割为若干个语义块,并采用空洞卷积神经网络模型对语义块进行识别。实验结果表明,该方法对藏文句义分割的准确率达到94.68%。
- 柔特色差甲才让加
- 关键词:语义块语义分析藏文