刘勇进
- 作品数:2 被引量:3H指数:1
- 供职机构:厦门大学信息科学与技术学院计算机科学系更多>>
- 发文基金:福建省自然科学基金国家留学基金福建省重点科技计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 利用人类计算技术的语音语料库标注方法及其实现被引量:2
- 2009年
- 提出一种基于人类计算的语音语料库标注方法.该标注方法的主要思路是通过一个基于Web的语言学习系统来收集由大量学习者(用户)输入的词汇标注和音标标注,并从中选择出现概率最大的用户输入作为语料的正确标注.为了保证通过这种人类计算方法获得的标注文本的质量,使用了一些计算机辅助机制来校验收集到的标注的可靠性.采用这种方法实现语音语料库标注的主要优点在于将语料库标注和语言学习相结合,无需专门投入大量的人力来进行枯燥乏味的语料库标注工作,从而节省了语料库标注的成本.对这种基于人类计算的语音语料库标注技术进行了探讨,说明了用于收集用户输入的语言学习系统的设计以及标注生成系统的设计.系统的应用表明,该标注方法能够有效、低成本地生成语音语料库的词汇标注和音标标注.
- 沈映泉刘勇进蔡骏史晓东
- 基于HTK的语音识别的并行化研究与实现被引量:1
- 2009年
- 详细地分析了语音识别的过程,给出了相应的算法描述,并分析了语音识别并行化的可能性。将并行计算的思想应用于语音识别的算法中,使用多线程技术,并引入避免竞争条件的机制,在多核计算机上并行地计算HMM模型节点的似然率,从而得到语音识别的并行化算法。分析了该并行化算法的性能,同时在语音识别工具包HTK 3.4上实现了这种并行化算法。基于WSJ0语料库的实验结果表明该并行化算法在不影响识别结果的前提下能够有效地提高语音识别的实时性能。
- 刘勇进史晓东
- 关键词:多核HTK并行计算语音识别