李冠宇
- 作品数:7 被引量:31H指数:3
- 供职机构:西北民族大学更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金甘肃省自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于HTK的藏语拉萨话大词表连续语音识别的研究与实现被引量:3
- 2011年
- 在分析藏语拉萨话特点的基础上,确定拉萨话音素集并制定了面向语音识别的拉丁转写方案.根据藏语字音转换规则,建立以单音节为单位的拉萨话发音字典,以音素为建模单元,训练得到三音子连续隐马尔可夫(HiddenMarkov Model,HMM)模型,探索藏语拉萨话语音识别的方法和总体框架,实现了基于HTK的藏语拉萨话特定人大词表连续语音识别.
- 李冠宇
- 关键词:HTK藏语连续语音识别隐马尔可夫模型
- 基于谱减法语音增强效果研究被引量:5
- 2017年
- 文章就语音增强的发展历程以及面向藏语语音的研究现状和语音特征作了介绍和分析,并选择藏语拉萨话作为语音增强实验的语种.文章选择经典的谱减法作为语音增强方法,并介绍了谱减法原理,同时设计实验方案,实验语料使用纯净语音和噪音混合成的带噪语音,按照不同信噪比进行语音测试,得到了大量数据结果.在分析结果的基础上得出结论:使用谱减法能够明显提升语音质量,提升效果随着噪音语音相关度的多少而变化.
- 代龙翔李冠宇马宁
- 关键词:谱减法语音增强藏语
- 基于决策树的藏语拉萨话三音子模型被引量:4
- 2013年
- 对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集。建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案。
- 李冠宇于洪志李永宏马宁
- 关键词:藏语隐马尔可夫模型三音子模型
- 隐马尔可夫模型及其在语音识别中的应用
- 2011年
- 本文论述了马尔可夫链及隐马尔可夫模型的定义,分析了将隐马尔可夫模型用于语音识别时需要解决的三个重要问题,论述了连续语音识别系统的总体框架。
- 李冠宇
- 关键词:隐马尔可夫模型HMM语音识别马尔可夫链
- 基于曲率的灰度图像拼接研究被引量:2
- 2009年
- 在图像处理过程中,经常需要对剪切后的图像碎片进行拼接,提取灰度图像碎片的边界,计算出边界上各离散点处的曲率,每条边界上各点处的曲率构成了信号序列,分段计算两个信号序列的相关系数。由于曲率的位移不变性和旋转不变性,两条切口上各吻合点处的曲率理论上相等。本文验证了当相关系数取得最大值时,两条切口恰好吻合,从而实现灰度图像的自动拼接。
- 李冠宇游茂
- 关键词:曲率灰度图像
- 藏语拉萨话大词表连续语音识别声学模型研究被引量:16
- 2012年
- 根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语音识别。实验结果表明,在最优情况下,该模型词错误率只有7.8%。
- 李冠宇孟猛
- 关键词:藏语连续语音识别隐马尔可夫模型声学模型
- 一种语料缺乏条件下的藏语音素自动切分方法被引量:2
- 2014年
- 藏语语音合成及语音学研究中,经常需要切分音素。人工切分费时费力,但是由于藏语语料缺乏,训练的藏语声学模型不够精确和鲁棒,自动切分的音素边界不够准确。以藏语拉萨方言为研究对象,在确定拉萨方言音素集、建立拉萨方言发音词典的基础上,通过计算音素模型间的距离,确定了拉萨方言和英语的共同音素,融合拉萨方言和英语GMM-HMM模型,并自动判断语音中的静音和短时停顿,构造语音对应的词网络,查询发音词典,将词网络扩展为模型(音素)网络,使用Viterbi算法将每一帧特征参数对应到模型的每一个状态上,进而对音素进行切分。实验表明,切分效果要优于单纯的藏语模型方法。
- 李冠宇于洪志吴志强
- 关键词:藏语维特比算法隐马尔可夫模型