您的位置: 专家智库 > >

袁胜龙

作品数:2 被引量:15H指数:1
供职机构:中国科学技术大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 1篇电子电信
  • 1篇自动化与计算...

主题

  • 2篇语音
  • 2篇语音识别
  • 1篇神经网
  • 1篇神经网络
  • 1篇数据驱动
  • 1篇资源受限
  • 1篇连续语音
  • 1篇连续语音识别
  • 1篇关键词
  • 1篇关键词检索
  • 1篇ASR
  • 1篇DNN
  • 1篇藏语

机构

  • 2篇中国科学技术...

作者

  • 2篇袁胜龙
  • 1篇郭武
  • 1篇戴礼荣

传媒

  • 1篇模式识别与人...

年份

  • 1篇2016
  • 1篇2015
2 条 记 录,以下是 1-2
排序方式:
资源受限情况下基于ASR的关键词检索研究
基于自动语音识别(Automatic Speech Recognition,ASR)的检索技术是关键词检索(Spoken Term Detection,STD)的主流技术,资源受限情况下(Limited-resource...
袁胜龙
关键词:资源受限关键词检索语音识别
基于深层神经网络的藏语识别被引量:14
2015年
文中首次涉及藏语的自然对话风格大词汇电话连续语音识别问题.作为一种少数民族语言,藏语识别面临的最大的困难是数据稀疏问题.文中在基于深层神经网络(DNN)的声学模型建模中,针对数据稀疏的问题,提出采用大语种数据训练好的DNN作为目标模型的初始网络进行模型优化的策略.另外,由于藏语语音学的研究很不完善,人工生成决策树问题集的方式并不可行.针对该问题,文中利用数据驱动的方式自动生成决策树问题集,对三音子隐马尔可夫模型(HMM)进行状态绑定,从而减少需要估计的模型参数.在测试集上,基于混合高斯模型(GMM)声学建模的藏字识别率为30.86%.在基于DNN的声学模型建模中,采用三种大语种数据训练好的DNN网络作为初始网络,并在测试集上验证该方法的有效性,藏字识别正确率达到43.26%.
袁胜龙郭武戴礼荣
关键词:藏语连续语音识别数据驱动
共1页<1>
聚类工具0