江苏省自然科学基金(BK2009059)
- 作品数:19 被引量:66H指数:4
- 相关作者:王金明张雄伟黄建军徐玉龙徐志军更多>>
- 相关机构:解放军理工大学中国人民解放军海军指挥学院中国人民解放军92601部队更多>>
- 发文基金:江苏省自然科学基金中国博士后科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 多分形谱簇研究及其在说话人识别中的应用被引量:2
- 2011年
- 语音是一种复杂的非线性信号,这使得基于线性系统理论发展起来的传统说话人识别技术性能难以进一步提高。本文提出了多分形谱簇分析方法,用于分析语音信号的非线性特征,并应用于短语音(2秒)说话人识别。通过对Cantor集的仿真实验,发现不同标度区能反映出系统不同阶段的生长规律,因此可用一组连续变化的多分形谱分层次地表征系统的分形特性,即多分形谱簇分析方法。然后结合语信号的分形特点,提出一种语音的多分形谱簇特征(Multifractal SpectrumCluster Feature,MSCF)的提取方法。最后将几种非线性特征与短时谱特征结合用于说话人识别,基于TIMIT数据库50人的实验表明,非线性特征与短时谱特征互补性较强,特别是MSCF与MFCC、LPC特征结合,使得系统的误识率下降到0.8%。
- 周宇欢张雄伟付强徐鑫王金明
- 关键词:说话人识别高斯混合模型
- 一种基于贪婪策略的说话人语音特征优选方法被引量:1
- 2013年
- 为了提高说话人识别的性能,提出一种语音特征优选方法,从目前使用效果较好的特征参数中,采用贪婪算法优选出若干维特征用于识别。在TIMIT语音数据库上实验显示,识别率相比传统方法提高了1.6%;对于加入了噪声的语音,识别率提高了6%,识别速度提高了5倍左右。实验结果表明,优选后的特征参数能够去除不良特征对识别系统的干扰,有效提高说话人识别系统的识别率和识别速度。
- 陈觉之张贵荣周宇欢
- 关键词:说话人识别贪婪算法美尔倒谱系数
- 一种基于循环谱切片的通信辐射源识别方法被引量:10
- 2013年
- 提出一种基于循环谱切片的通信辐射源个体识别方法。通过计算信号的循环谱密度矩阵,将循环谱密度切片作为初始高维特征,再采用主成分分析方法对其进行降维处理得到指纹特征矢量,最后采取概率神经网络分类器实现辐射源的个体识别。通过对20部手持机的实验表明,使用该方法提取的特征矢量能够较好地反映信号的循环平稳特性,并且特征参数对噪声干扰不敏感,在较低信噪比条件下,系统仍具有较高的正确识别率,说明该方法确实能够较好地解决同型号、同批次、同工作参数通信辐射源的个体识别问题。
- 陈志伟徐志军王金明徐玉龙孔磊
- 关键词:辐射源识别循环谱主成分分析指纹特征
- 基于CCA和PCA的说话人特征降维研究被引量:1
- 2013年
- 为提高说话人识别的性能,提出将CCA与PCA联合用于说话人特征降维的方法:先用CCA融合基于声道模型的LPC特征和基于听觉模型的MFCC特征,提升这两类不同特征的相关性;然后用PCA进一步去除冗余特征,降低有效特征的维数。实验显示,这两种降维方法联合的降维效果与单一的CCA降维、PCA降维或手动降维的效果比有明显提高。
- 陈觉之张贵荣周宇欢
- 关键词:说话人识别特征降维线性预测系数美尔频率倒谱系数
- 基于多元Laplace语音模型的语音增强算法被引量:4
- 2012年
- 传统的短时谱估计语音增强算法通常假设语音谱分量相互独立,没有考虑语音谱分量间的相关性。针对这一问题,该文提出一种新的基于多元Laplace分布模型的短时谱估计算法。首先,假设语音的离散余弦变换(DCT)系数服从多元Laplace分布,以此利用谱分量间的相关性;在此基础上,利用多元随机矢量的高斯尺度混合模型表示,推导得到语音DCT系数矢量的最小均方误差(MMSE)估计的解析表达式;并进一步推导了基于该分布模型的语音存在概率,对最小均方误差估计子进行修正。实验结果表明,该算法在抑制背景噪声和减少语音失真等方面优于传统的语音增强方法。
- 周彬邹霞张雄伟
- 关键词:语音增强最小均方误差
- 一种基于SVDD模型的说话人确认方法研究
- 2013年
- 为改善说话人确认的性能,提出一种基于支持向量数据描述(SVDD)模型的说话人确认方法,通过改变SVDD硬判决方式,采用以样本接受率为依据的软判决方式,把似然得分规整到[0,1]之间,简化门限阈值的设定。仿真实验结果表明,与通常基于高斯混合模型(GMM)的说话人确认算法相比,该方法的说话人确认性能有较大提高。
- 陈觉之张贵荣周宇欢
- 关键词:说话人识别说话人确认高斯混合模型
- 基于指纹特征融合的通信辐射源个体识别研究被引量:8
- 2014年
- 在对辐射源信号进行时频分析的基础上,提出一种基于特征融合的通信辐射源个体识别方法。提取辐射源信号载频特征和瞬态幅值特征,对重采样的瞬态幅值做三次样条插值,采用最小二乘法分段对插值后的瞬态幅值进行曲线拟合,获取拟合系数作为瞬态指纹特征;最后与载频特征融合,采用遗传算法优化融合系数,融合后的特征作为辐射源指纹特征。识别分类器采用概率神经网络,对16部手持机进行识别实验。实验结果表明,该方法提取的特征能够反映通信辐射源个体的时频特性,可实现对辐射源个体的有效识别,在信噪比为20 dB时,系统识别率优于90%。
- 王金明徐玉龙徐志军马振
- 关键词:辐射源识别概率神经网络
- 基于EEMD域统计模型的话音激活检测算法被引量:2
- 2012年
- 提出了一种基于EEMD域统计模型的话音激活检测算法。算法首先利用总体平均经验模态分解(Ensemble empirical mode decomposition,EEMD)对带噪语音进行分解,得到信号的本征模式函数(Intrinsicmode function,IMF)分量,选择与原信号的相关性最高的两个分量相加组成主分量;然后对主分量进行频域分解,引入统计模型,求出EEMD域特征参数;最后利用噪声与语音的EEMD域特征参数的不同来进行语音激活检测。实验结果表明,在不同信噪比情况下,本文算法性能优于目前常用的VAD算法,特别在噪声强度大时体现出明显的优势。
- 吴其前张雄伟
- 关键词:话音激活检测经验模式分解
- 基于码本学习的改进谱减语音增强算法被引量:3
- 2013年
- 提出一种可适应非平稳噪声环境的基于码本学习的改进谱减语音增强算法。该算法分为训练阶段和增强阶段。训练阶段,使用自回归模型对语音和噪声的频谱形状进行建模并构造语音和噪声码本;增强阶段,采用对数谱最小化算法估计出语音和噪声的频谱,通过谱相减消除噪声。算法在每个时间帧估计语音和噪声频谱,即使在语音存在时仍能够有效跟踪快速变化的非平稳噪声;采用自回归模型能得到噪声频谱的平滑估计,减少了音乐噪声。实验仿真表明,相比于传统谱减法和多带谱减法,改进的谱减法具有更好的噪声抑制性能并且语音失真更小。
- 隋璐瑛张雄伟黄建军赵改华
- 关键词:语音增强谱减法噪声估计自回归模型
- 时频字典学习的单通道语音增强算法被引量:14
- 2012年
- 针对以往语音增强算法在非平稳噪声环境下性能急剧下降的问题,基于时频字典学习方法提出了一种新的单通道语音增强算法。首先,提出采用时频字典学习方法对噪声的频谱结构的先验信息进行建模,并将其融入到卷积非负矩阵分解的框架下;然后,在固定噪声时频字典情况下,推导了时变增益和语音时频字典的乘性迭代求解公式;最后,利用该迭代公式更新语音和噪声的时变增益系数以及语音的时频字典,通过语音时频字典和时变增益的卷积运算重构出语音的幅度谱并用二值时频掩蔽方法消除噪声干扰。实验结果表明,在多项语音质量评价指标上,本文算法都取得了更好的结果。在非平稳噪声和低信噪比环境下,相比于多带谱减法和非负稀疏编码去噪算法,本文算法更有效地消除了噪声,增强后的语音具有更好的质量。
- 黄建军张雄伟张亚非邹霞
- 关键词:语音增强算法单通道时频噪声环境非平稳噪声