您的位置: 专家智库 > >

吴奎

作品数:2 被引量:4H指数:1
供职机构:中国科学技术大学信息科学技术学院电子工程与信息科学系更多>>
发文基金:国家自然科学基金安徽省自然科学基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 1篇电子电信
  • 1篇自动化与计算...

主题

  • 1篇电话语音
  • 1篇语音
  • 1篇语种识别
  • 1篇说话人聚类
  • 1篇统一计算设备...
  • 1篇图形处理单元
  • 1篇聚类
  • 1篇混合高斯
  • 1篇混合高斯模型
  • 1篇计算设备
  • 1篇架构
  • 1篇高斯
  • 1篇高斯模型
  • 1篇本征
  • 1篇CUDA

机构

  • 2篇中国科学技术...

作者

  • 2篇戴礼荣
  • 2篇宋彦
  • 2篇吴奎

传媒

  • 1篇模式识别与人...
  • 1篇数据采集与处...

年份

  • 1篇2013
  • 1篇2012
2 条 记 录,以下是 1-2
排序方式:
基于CUDA的GMM模型快速训练方法被引量:3
2012年
由于能够很好地近似描述任何分布,混合高斯模型(GMM)在模式在识别领域得到了广泛的应用。GMM模型参数通常使用迭代的期望最大化(EM)算法训练获得,当训练数据量非常庞大及模型混合数很大时,需要花费很长的训练时间。NVIDIA公司推出的统一计算设备架构(Computed unified device architecture,CUDA)技术通过在图形处理单元(GPU)并发执行多个线程能够实现大规模并行快速计算。本文提出一种基于CUDA,适用于特大数据量的GMM模型快速训练方法,包括用于模型初始化的K-means算法的快速实现方法,以及用于模型参数估计的EM算法的快速实现方法。文中还将这种训练方法应用到语种GMM模型训练中。实验结果表明,与Intel DualCore PentiumⅣ3.0GHz CPU的一个单核相比,在NVIDIA GTS250GPU上语种GMM模型训练速度提高了26倍左右。
吴奎宋彦戴礼荣
关键词:混合高斯模型语种识别图形处理单元统一计算设备架构
基于因子分析建模的电话语音说话人聚类被引量:1
2013年
现有基于混合高斯模型的说话人聚类方法主要依据最大后验准则,从通用背景模型中自适应得到类别的混合高斯模型,然而自适应数据较少,模型的准确性不够.对此,文中尝试基于本征语音(EV)空间和全变化(TV)空间分析的两种因子分析建模方法,通过对差异空间的建模,减少估计类别混合高斯模型时需要估计的参数个数.结果表明,在美国国家标准技术研究所2008年说话人识别评测的电话语音数据集上,相对于基于最大后验概率准则的基线系统而言,文中所使用的基于EV和TV空间分析的建模方法都可使聚类错误率有较大幅度的下降,并且TV空间分析建模相对于EV空间分析建模能获得更低的聚类错误率.
吴奎宋彦戴礼荣
关键词:说话人聚类
共1页<1>
聚类工具0