您的位置: 专家智库 > >

国家自然科学基金(61262054)

作品数:7 被引量:42H指数:4
相关作者:于洪志李亚超袁斌江涛加羊吉更多>>
相关机构:西北民族大学中国科学院自动化研究所更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金甘肃省科技重大专项计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 7篇中文期刊文章

领域

  • 7篇自动化与计算...

主题

  • 4篇藏文
  • 4篇藏语
  • 2篇隐马尔可夫模...
  • 2篇语料
  • 2篇语音
  • 2篇马尔可夫
  • 2篇马尔可夫模型
  • 1篇音节
  • 1篇音子
  • 1篇语料库
  • 1篇语义
  • 1篇语义空间
  • 1篇语音合成
  • 1篇语音识别
  • 1篇三音子
  • 1篇三音子模型
  • 1篇情感
  • 1篇情感分类
  • 1篇情感倾向
  • 1篇子模

机构

  • 7篇西北民族大学
  • 1篇中国科学院自...

作者

  • 6篇于洪志
  • 2篇江涛
  • 2篇加羊吉
  • 2篇李冠宇
  • 2篇李亚超
  • 2篇袁斌
  • 1篇李照耀
  • 1篇江静
  • 1篇何向真
  • 1篇李永宏
  • 1篇李艾林
  • 1篇张金溪
  • 1篇汪昆
  • 1篇肖俊生
  • 1篇马宁
  • 1篇冷本扎西
  • 1篇吴志强

传媒

  • 3篇中文信息学报
  • 2篇计算机工程与...
  • 1篇计算机应用研...
  • 1篇西北民族大学...

年份

  • 2篇2017
  • 1篇2016
  • 1篇2014
  • 2篇2013
  • 1篇2012
7 条 记 录,以下是 1-7
排序方式:
融合音节特征的最大熵藏文词性标注研究被引量:15
2013年
藏文词性标注是藏文信息处理中非常重要的基础性问题,该文以最大熵模型为基本框架,根据藏文的构词特征及统计分析结果,定义并选取特征模板,研究了融合语言特征的最大熵藏文词性标注模型。实验结果表明,最大熵模型能够较好的处理藏文词性标注问题,音节特征可以显著提高藏文词性标注的效果,与基准系统相比使错误率降低了6.4%。
于洪志李亚超汪昆冷本扎西
关键词:藏文词性标注最大熵
基于决策树的藏语拉萨话三音子模型被引量:3
2013年
对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集。建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案。
李冠宇于洪志李永宏马宁
关键词:藏语隐马尔可夫模型三音子模型
基于多特征的藏文微博情感倾向性分析被引量:7
2017年
中英文微博大都以单一语种来表述,而将近80%的藏文微博都是以藏汉混合文本形式呈现,若只针对藏文内容或中文内容进行情感倾向性分析会造成情感信息丢失,无法达到较好效果。根据藏文微博的表述特点,该文提出了基于多特征的情感倾向性分析算法,算法使用情感词、词性序列、句式信息和表情符号作为特征,并针对藏文微博常出现中文表述的情况,将中文的情感信息也作为特征进行情感计算,利用双语情感特征有效提高了情感倾向性分析的效果。实验显示,该方法对纯藏文表述的微博情感倾向性分析正确率可达到79.8%,针对藏汉双语表述的微博在加入中文情感词、中文标点符号等特征后,正确率能够达到82.8%。
江涛袁斌于洪志加羊吉
关键词:情感倾向
融合无监督特征的藏文分词方法研究被引量:9
2017年
藏文分词是藏文信息处理的基础性关键问题,目前基于序列标注的藏文分词方法大都采用音节位置特征和类别特征等。该文从无标注语料中抽取边界熵特征、邻接变化数特征、无监督间隔标注等无监督特征,并将之融合到基于序列标注的分词系统中。从实验结果可以看出,与基线藏文分词系统相比,分词F值提高了0.97%,并且未登录词识别结果也有较大的提高。说明,该文从无标注数据中提取出的无监督特征较为有效,和有监督的分词模型融合到一起显著提高了基线分词系统的效果。
李亚超加羊吉江静何向真于洪志
关键词:藏文分词
基于语义空间的藏文微博情感分析方法被引量:10
2016年
藏文微博具有独特的语法特点,传统方法对藏文文本进行情感分类很难取得较好效果。结合藏文句法结构和语义特征向量构建语义特征空间,提出了一种基于语义空间的藏文微博情感分析方法。首先使用句法树生成句法结构并结合语义特征向量构建特征空间,运用K-means方法聚类形成语义簇质心,将基于簇的TF-IDF值作为最终的微博情感特征值。实验结果表明,该方法的情感分类效果均优于SVM+TF-IDF和naive Bayes+最大熵的方法。
袁斌江涛于洪志
关键词:情感分类语义空间文本聚类
面向语音合成的藏语音素切分算法研究
2012年
文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩短建库周期,尤其对于大语料库的建立会有明显的优势.这种方法既节省了切分与标注的大量时间和人力成本,又提高了语音语料库标注信息的精确度和一致性.
张金溪李照耀肖俊生李艾林
关键词:藏语语音合成语料库
一种语料缺乏条件下的藏语音素自动切分方法被引量:2
2014年
藏语语音合成及语音学研究中,经常需要切分音素。人工切分费时费力,但是由于藏语语料缺乏,训练的藏语声学模型不够精确和鲁棒,自动切分的音素边界不够准确。以藏语拉萨方言为研究对象,在确定拉萨方言音素集、建立拉萨方言发音词典的基础上,通过计算音素模型间的距离,确定了拉萨方言和英语的共同音素,融合拉萨方言和英语GMM-HMM模型,并自动判断语音中的静音和短时停顿,构造语音对应的词网络,查询发音词典,将词网络扩展为模型(音素)网络,使用Viterbi算法将每一帧特征参数对应到模型的每一个状态上,进而对音素进行切分。实验表明,切分效果要优于单纯的藏语模型方法。
李冠宇于洪志吴志强
关键词:藏语维特比算法隐马尔可夫模型
共1页<1>
聚类工具0