公共文化服务平台

并行子带HMM最大后验概率自适应非线性类估计算法被引量：1: 2005年; 目前,自动语音识别(ASR)系统在实验室环境下获得了较高的识别率,但是在实际环境中,由于受到背景噪声和传输信道的影响,系统的识别性能急剧恶化。本文以听觉试验为基础,提出一种新的独立子带并行最大后验概率的非线性类估计算法,用以提高识别系统的鲁棒性。本算法利用多种噪声和识别内容功率谱差异,以及噪声在不同频带上对HMM影响的不同,采用多层感知机(MLP)对噪声环境下最大后验概率进行非线性映射,以减少识别系统由于环境不匹配而导致的识别性能下降。实验表明:该算法性能明显优于最大后验线性回归算法和Sangita提出的子带语音识别算法。; 孙暐吴镇扬刘海滨周琳; 关键词：最大后验估计隐马尔可夫模型语音识别听觉场景分析

鲁棒语音识别中的多流同步分析研究: 由于训练环境和应用环境失配,导致系统识别性能急剧恶化。本文根据人耳听觉的频率跟踪特性,对于语音信号进行频带分割,同时根据全带分析的特点,对不同的频带的信号进行同步分析来提高噪声环境下的语音识别性能。实验表明:这种方法可以...; 孙暐吴镇扬吴红卫胡红梅; 关键词：语音识别隐马尔可夫模型

基于VQ的说话人自动识别系统的实现被引量：2: 2003年; 文中以语音信号的LPC倒谱系数、Δ倒谱系数、基音周期和Δ基音周期的混合特征参数作为识别说话人的特征,运用VQ技术实现了说话人自动识别。在10个说话人,1800个汉语数字和单词语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。; 桂苹吴镇扬赵力王维新; 关键词：声音识别矢量量化特征提取

基于累积量增强全矢量正交子空间方法的MA建模: 2003年; 提出了一种新的线性代数方法———累积量增强全矢量正交子空间方法 (CEAVOS)用于非最小相位非高斯滑动平均 (MA)建模 ,该方法利用组合特性映射的累积量增强 ,并用全矢量正交子空间法估计MA参数 .数值仿真结果表明 ,CEAVOS的性能优于组合累积量切片法WS和全矢量正交子空间法 (AVOS)这 2种现有的性能最好的MA参数估计方法 ,尤其是在估计的偏差上 ;在低信噪比与短数据的情况下。; 张子瑜

多带抗噪声语音识别算法研究被引量：2: 2006年; 根据Flether等人的研究,基于感知独立性假设的子带识别方法被用于抗噪声鲁棒语音识别。本文拓展子带方法,采用基于噪声污染假定的多带框架来减少噪声影响。论文不仅从理论上分析了噪声污染假定多带框架在识别性能上的潜在优势,而且提出了多带环境下的鲁棒语音识别算法。研究表明：多带框架不仅回避了独立感知假设要求,而且与子带方法相比,多带方法能更好的减少噪声影响,提高系统识别性能。; 孙暐吴镇扬; 关键词：语音识别隐马尔可夫模型听觉场景分析

Speech enhancement based on multitaper spectrum and psychoacoustical weighting rule被引量：1: 2007年; Multitaper spectrum has lower variance than the traditional periodogram. The noise spectrum and the noise to noisy signal spectrum ratio （NNSR） were estimated from the multitaper spectrum of the noisy signal; the pre-enhanced speech for calculating the noise masking threshold was obtained by the spectral amplitude subtraction method, whose gain is a function of NNSR; the final enhanced speech was obtained by suppressing the Fourier spectrum of the noisy speech with the psychoacoustical weighting rule incorporating the noise masking threshold. Because of the low variance feature of the multitaper spectrum, a modified offset formula was proposed to calculate the noise masking threshold, thus the reconstructed speech with this modification has an improvement in MBSD （Modified Bark Spectral Distortion）. When a maximum limitation less than one to the psychoacoustical weighting rule is further proposed, the higher the input SNR （〉 0 dB） is, the more improvement the segmental SNR and the overall SNR have. The informal listening tests show that there is little speech distortion for the enhanced speech processed by the proposed method, the background noise is reduced much and free of musical noise.; WU HongweiWU ZhenyangZHAO Li

噪声环境下基于最大后验非线性变换的隐马尔可夫模型自适应算法被引量：7: 2004年; 由于训练环境和识别环境的失配,识别系统的性能会严重下降。为此,提出了基于最大后验概率非线性变换的环境自适应算法,可以减小由于环境的失配所引起的系统性能的下降。在本算法中,利用分段线性回归近似非线性变换将训练环境下隐马尔可夫模型(HMM)的均值向量变换到识别环境,减小环境的失配,变换参数的估计采用了最大后验概率估计(MAP)。数字语音识别实验证明:该环境自适应算法的识别性能优于MLST,MAPLR和MLLR等算法。; 刘海滨吴镇扬赵力曾毓敏; 关键词：噪声环境隐马尔可夫模型自适应算法

基于独立感知理论的鲁棒语音识别算法被引量：3: 2005年; 为了提高在噪声环境下语音识别系统的性能,对基于子带独立感知理论的语音识别方法进行了研究.这些方法利用人耳对不同频率信号感知的差异,以及噪声和识别对象的频域特征差异,分别采用线性分析、判决分析、多层感知机以及子带最大似然估计对噪声影响进行补偿.实验表明,子带分析采用非线性策略优于线性策略.基于独立感知假定的子带模型,虽然由于独立性假定丢失了带间相关性,但对于噪声环境下语音识别而言可以捕获噪声和识别对象的频谱差异,从而获得比全带分析更高的鲁棒性.; 孙暐吴镇扬; 关键词：语音识别隐马尔可夫模型最大似然

非线性统计匹配用于子带鲁棒语音识别被引量：4: 2006年; 由于语音信号的多变性,识别系统的性能极易受噪声环境的影响而导致性能下降。该文以听觉试验为基础,提出一种新的非线性独立子带隐马尔可夫模型(HMM)最大后验统计匹配算法。该算法依据人耳感知的频选性, 根据各子带噪声特点采用统计匹配、MAP估计和HMM／MLP非线性映射来补偿噪声环境的影响。实验表明该算法明显改善了识别系统在噪声环境下的性能。; 孙暐吴镇扬刘海滨; 关键词：语音识别隐马尔可夫模型最大后验估计听觉场景分析

基于MAP算法的无教师讲者自适应的研究被引量：2: 2003年; 提出了一种基于MAP算法的连续语音识别无教师讲者自适应方法,给出了简单有效的渐进自适应公式.通过识别实验结果表明,提出的方法能利用少量的自适应数据达到满意的学习效果,是一种实用和有效的讲者自适应方法.; 赵力邹采荣吴镇扬; 关键词：MAP算法汉语连续语音识别语音识别系统再学习

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家自然科学基金(60272044)