公共文化服务平台

共 2 条记录，以下是 1-2

全选清除导出

排序方式：

基于CUDA的GMM模型快速训练方法被引量：3: 2012年; 由于能够很好地近似描述任何分布,混合高斯模型(GMM)在模式在识别领域得到了广泛的应用。GMM模型参数通常使用迭代的期望最大化(EM)算法训练获得,当训练数据量非常庞大及模型混合数很大时,需要花费很长的训练时间。NVIDIA公司推出的统一计算设备架构(Computed unified device architecture,CUDA)技术通过在图形处理单元(GPU)并发执行多个线程能够实现大规模并行快速计算。本文提出一种基于CUDA,适用于特大数据量的GMM模型快速训练方法,包括用于模型初始化的K-means算法的快速实现方法,以及用于模型参数估计的EM算法的快速实现方法。文中还将这种训练方法应用到语种GMM模型训练中。实验结果表明,与Intel DualCore PentiumⅣ3.0GHz CPU的一个单核相比,在NVIDIA GTS250GPU上语种GMM模型训练速度提高了26倍左右。; 吴奎宋彦戴礼荣; 关键词：混合高斯模型语种识别图形处理单元统一计算设备架构

基于因子分析建模的电话语音说话人聚类被引量：1: 2013年; 现有基于混合高斯模型的说话人聚类方法主要依据最大后验准则,从通用背景模型中自适应得到类别的混合高斯模型,然而自适应数据较少,模型的准确性不够.对此,文中尝试基于本征语音(EV)空间和全变化(TV)空间分析的两种因子分析建模方法,通过对差异空间的建模,减少估计类别混合高斯模型时需要估计的参数个数.结果表明,在美国国家标准技术研究所2008年说话人识别评测的电话语音数据集上,相对于基于最大后验概率准则的基线系统而言,文中所使用的基于EV和TV空间分析的建模方法都可使聚类错误率有较大幅度的下降,并且TV空间分析建模相对于EV空间分析建模能获得更低的聚类错误率.; 吴奎宋彦戴礼荣; 关键词：说话人聚类

全选清除导出

共1页<1>

吴奎