张继勇
- 作品数:7 被引量:45H指数:3
- 供职机构:清华大学计算机科学与技术系更多>>
- 相关领域:电子电信自动化与计算机技术语言文字更多>>
- 一种基于HTK的词图搜索算法
- 在连续语音识别中,为了能够在搜索的过程中实现更有效的剪枝策略,必须充分应用语言模型提供的信息.对于在一遍搜索过程中同时使用声学模型和语言模型的搜索算法而言,虽然能够获得比较高的识别率,但是耗时比较多.为此,本文实现了一种...
- 罗春华张继勇郑方徐明星
- 文献传递
- 连续汉语语音识别中基于归并的音节切分自动机被引量:14
- 1999年
- 文章研究并实现了汉语连续语音中的音节自动切分算法─—基于归并的音节切分自动机(merging-basedSyllabledeteCtionautomaton,简称MBSDA)算法.MBSDA算法利用了包括语音的短时能量、过零率和基音周期在内的多种特征参数,把特征参数高度相似的相邻帧(1帧或若干帧)的语音信号进行“归并(merging)”,形成“归并类似段(mergedsimilarsegment,简称MSS)”,它们被认定属于同一音节的相同状态.这些MSS经过一个包含若干状态的“音节切分自动机(syllabledetectionautomaton,简称SDA)”后,输出音节的切分点.每个确定的切分段中所包合音节个数的范围(rangeofsyllablenumber,简称RSN)也由MBSDA算法给出.
- 张继勇sp.cs.tsinghua.edu.cn郑方sp.cs.tsinghua.edu.cn杜术徐明星宋战江
- 关键词:语音识别
- 汉语连续语音识别中声学模型基元比较:音节、音素、声韵母
- 本文研究的是汉语连续语音识别中声学模型基元的选择问题.根据汉语语音的特点,本文分别采用音节、音素和声韵母等三种语音识别基元进行声学建模.为了描述连续语音中的协同发音现象,本文针对音素和声韵基元,设计了相应的问题集,利用基...
- 李净徐明星张继勇郑方吴文虎方棣棠
- 文献传递
- 一种基于HTK的词图搜索算法
- 罗春华张继勇郑方徐明星
- 汉语连续语音识别中上下文相关的声韵母建模被引量:28
- 2004年
- 声学建模是汉语连续语音识别中的关键步骤之一。根据汉语语音的特点,采用扩展声韵母(XIF)作为识别基元,并针对XIF基元设计了相应的问题集,利用基于决策树的状态共享策略建立上下文相关声韵模型(Tri-XIF)。将Tri-XIF模型与上下文相关音素模型(Tri-phone)、上下文无关音节模型进行了对比。提出了几种方法用于改善标注、改进问题集和降低模型规模。实验结果表明,Tri-XIF模型与Tri-phone模型、音节模型相比,识别性能有了很大提高,其音节误识率分别降低了24.53%和41.65%。采用了所提出的优化策略后,模型规模降低20%以上,而性能下降很少。
- 李净郑方张继勇吴文虎
- 关键词:连续语音识别上下文相关声母韵母决策树
- 汉语语音识别中声学建模及参数共享策略的研究
- 声学建模是语音识别领域中的关键问题之一.该文对汉语连续语音识别中的声学建模技术和参数共享策略进行了深入的研究.主要针对两个方面:一、提出并实现了半连续分段概率模型(SCSPM);二、研究基于决策树状态共享的上下文相关建模...
- 张继勇
- 汉语连续语音识别中声学模型基元比较:音节、音素、声韵母
- 李净徐明星张继勇郑方吴文虎方棣棠