您的位置: 专家智库 > >

陈丽萍

作品数:3 被引量:13H指数:2
供职机构:中国科学技术大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家科技支撑计划更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 2篇电子电信
  • 1篇自动化与计算...

主题

  • 3篇说话人确认
  • 2篇神经网
  • 2篇神经网络
  • 1篇信息提取
  • 1篇信息提取方法
  • 1篇音素
  • 1篇说话人
  • 1篇DN

机构

  • 3篇中国科学技术...

作者

  • 3篇戴礼荣
  • 3篇陈丽萍
  • 2篇张涛涛
  • 1篇宋彦

传媒

  • 1篇模式识别与人...
  • 1篇小型微型计算...
  • 1篇信号处理

年份

  • 1篇2017
  • 1篇2016
  • 1篇2013
3 条 记 录,以下是 1-3
排序方式:
采用深度神经网络的说话人特征提取方法被引量:8
2017年
在说话人确认中,通常采用的声学特征(如MFCC,PLP特征等)包含的主要是文本信息和信道信息,说话人信息属于其中的弱信息,极易受到语音信号中的文本信息及信道、噪声等干扰的影响.针对这个问题,提出一种基于深度神经网络提取语音信号中说话人特征的方法,该方法用语音识别深度神经网络各个隐层非线性输出值来提取说话人特征.在RSR2015数据库上开展了GMM-UBM文本无关和文本相关说话人确认实验,实验结果表明本文方法提取的特征相对于传统的MFCC特征,系统等错误率(Equal Error Rate,EER)有了明显的下降.
张涛涛陈丽萍蒋兵戴礼荣
关键词:说话人确认
说话人确认中以音素为中心的特征端因子分析被引量:1
2016年
在说话人确认中,特征端因子分析(Acoustic Factor Analysis,AFA)利用MPPCA(Mixtures of Probabilistic Principal Component Analyzers,MPPCA)算法在通用背景模型(Universal Background Model,UBM)的每个高斯上分别对特征降维以去除语音特征中文本、信道和噪声等信息的干扰,获得增强的说话人信息并用于提升说话人确认的性能。但是通用背景模型属于无监督的聚类方法,其每个高斯成分物理意义不够明确,不能区分不同说话人发不同音素时的情况。为解决这一问题,本文利用语音识别中的声学模型深度神经网络(Deep Neural Network,DNN)取代传统的通用背景模型并结合特征端因子分析分别对不同音素上的语音特征进行降维提取出说话人信息,进而提取DNN i-vector用于说话人确认。在RSR2015数据库Part III上的实验结果表明该方法相对于基于UBM的特征端因子分析方法在男女测试集上等错误率(Equal Error Rate,EER)分别下降13.49%和22.43%。
张涛涛陈丽萍戴礼荣
关键词:说话人确认
基于深层置信网络的说话人信息提取方法被引量:5
2013年
在基于全差异空间因子(i-Vector)的说话人确认系统中,需进一步从语音段的i-Vector表示中提取说话人相关的区分性信息,以提高系统性能.文中通过结合锚模型的思想,提出一种基于深层置信网络的建模方法.该方法通过对i-Vector中包含的复杂差异信息逐层进行分析、建模,以非线性变换的形式挖掘出其中的说话人相关信息.在NIST SRE 2008核心测试电话训练-电话测试数据库上,男声和女声的等错误率分别为4.96%和6.18%.进一步与基于线性判别分析的系统进行融合,能将等错误率降至4.74%和5.35%.
陈丽萍王尔玉戴礼荣宋彦
关键词:说话人确认
共1页<1>
聚类工具0