您的位置: 专家智库 > >

张涛涛

作品数:2 被引量:9H指数:1
供职机构:中国科学技术大学更多>>
发文基金:国家自然科学基金国家科技支撑计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 1篇电子电信
  • 1篇自动化与计算...

主题

  • 2篇神经网
  • 2篇神经网络
  • 2篇说话人确认
  • 1篇音素
  • 1篇DN

机构

  • 2篇中国科学技术...

作者

  • 2篇戴礼荣
  • 2篇张涛涛
  • 2篇陈丽萍

传媒

  • 1篇小型微型计算...
  • 1篇信号处理

年份

  • 1篇2017
  • 1篇2016
2 条 记 录,以下是 1-2
排序方式:
说话人确认中以音素为中心的特征端因子分析被引量:1
2016年
在说话人确认中,特征端因子分析(Acoustic Factor Analysis,AFA)利用MPPCA(Mixtures of Probabilistic Principal Component Analyzers,MPPCA)算法在通用背景模型(Universal Background Model,UBM)的每个高斯上分别对特征降维以去除语音特征中文本、信道和噪声等信息的干扰,获得增强的说话人信息并用于提升说话人确认的性能。但是通用背景模型属于无监督的聚类方法,其每个高斯成分物理意义不够明确,不能区分不同说话人发不同音素时的情况。为解决这一问题,本文利用语音识别中的声学模型深度神经网络(Deep Neural Network,DNN)取代传统的通用背景模型并结合特征端因子分析分别对不同音素上的语音特征进行降维提取出说话人信息,进而提取DNN i-vector用于说话人确认。在RSR2015数据库Part III上的实验结果表明该方法相对于基于UBM的特征端因子分析方法在男女测试集上等错误率(Equal Error Rate,EER)分别下降13.49%和22.43%。
张涛涛陈丽萍戴礼荣
关键词:说话人确认
采用深度神经网络的说话人特征提取方法被引量:8
2017年
在说话人确认中,通常采用的声学特征(如MFCC,PLP特征等)包含的主要是文本信息和信道信息,说话人信息属于其中的弱信息,极易受到语音信号中的文本信息及信道、噪声等干扰的影响.针对这个问题,提出一种基于深度神经网络提取语音信号中说话人特征的方法,该方法用语音识别深度神经网络各个隐层非线性输出值来提取说话人特征.在RSR2015数据库上开展了GMM-UBM文本无关和文本相关说话人确认实验,实验结果表明本文方法提取的特征相对于传统的MFCC特征,系统等错误率(Equal Error Rate,EER)有了明显的下降.
张涛涛陈丽萍蒋兵戴礼荣
关键词:说话人确认
共1页<1>
聚类工具0