鲍长春
- 作品数:202 被引量:399H指数:11
- 供职机构:北京工业大学更多>>
- 发文基金:国家自然科学基金北京市自然科学基金北京市教委科技发展计划更多>>
- 相关领域:电子电信自动化与计算机技术理学文化科学更多>>
- 基于噪声估计的二值掩蔽语音增强算法被引量:4
- 2015年
- 针对现有的助听器语音增强算法在非平稳噪声环境下,残留大量背景噪声的同时还引入了"音乐噪声",致使增强语音可懂度和信噪比不理想等问题。提出了一种基于噪声估计的二值掩蔽语音增强算法,该算法利用人耳听觉感知理论,结合人耳的听觉特性和耳蜗的工作机理。采用最小值控制递归平均(Minima-Controlled Recursive Averaging,MCRA)算法获得估计噪声和初步增强语音;将估计噪声和初步增强语音分别通过可以模拟人工耳蜗模型的gammatone滤波器组进行滤波处理,得到各自的时频表示形式;利用人耳的听觉掩蔽特性,计算含噪语音在时频域的二值掩蔽;利用二值掩蔽得到增强语音。实验结果表明:该算法很大程度上去除了谱减法引入的"音乐噪声",与基于MCRA谱减法相比,增强语音的语言可懂度指数(Speech Intelligibility Index,SII)、主观语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)和信噪比(Signal to Noise Ratio,SNR)都得到了提高。
- 曹龙涛李如玮鲍长春吴水才
- 关键词:语音增强助听器噪声估计
- 基于分带谱熵和小波域Teager能量的语音清浊分类算法被引量:1
- 2009年
- 基于分带谱熵和小波域Teager能量提出了一种改进的语音清浊分类算法.该算法首先计算频域内的分带谱熵,然后在小波域计算不同频带的Teager能量,计算出低频能量所占的比例,通过这2个参数进行清浊判断.实验结果证明,由于分带谱熵能加深清浊音之间的差异,Teager能量能快速跟踪声门周期内信号能量的变化,因此该算法更容易提取浊音,在纯净语音和含噪语音上的性能都优于幅度能量算法.
- 李如玮鲍长春窦慧晶
- 关键词:语音分类小波变换
- 一种基于阶乘脉冲编码的嵌入式语音频编码器
- 本文基于嵌入式语音频编码原理,采用阶乘脉冲编码(factorialpulsecoding,FPC)量化方法代替格形矢量量化(latticevectorquantization,LVQ)进行变换码激励(transform ...
- 刘鑫鲍长春贾懋珅
- 关键词:性能比较
- 文献传递
- 高质量散布脉冲CELP算法的定点DSP实时实现被引量:1
- 2006年
- 为了将低比特率语音编码算法应用于实际的语音处理系统,开发了一种基于TMS320VC5410定点DSP 的实时低速率语音压缩系统.语音编码方法采用一种高质量的4 kb/s散布脉冲CELP算法.用汇编语言编写的定点DSP程序能在目标平台上实时完成语音数据的采集、处理和回放功能.整个系统大约占用31 K存储空间, 算法复杂度达到指令数为5.42×107条/s.客观质量测试结果显示,DSP定点程序处理后的语音质量非常接近于浮点C语言处理后的结果,表明该语音处理系统能满足实时语音压缩的需求.
- 鲍长春白燕宁窦庚欣
- 关键词:语音编码码激励数字信号
- 一种建立增益码书的方法
- 本发明公开了一种建立增益码书的方法,通过预编码训练集中的数字语音信号,生成包含有对数能量矢量的训练矢量序列并以数据文件的形式保存,所述每一个激励子帧对应有一所述的训练矢量序列;从所述数据文件中取出所述每一个子帧的训练矢量...
- 鲍长春窦庚欣范睿朱恒李立雄
- 文献传递
- 采用经验模态分解的语音与音频通用编码方法
- 2013年
- 为有效解决现有单一模型编码器无法在中低速率对语音和音频信号进行高质量通用编码的问题,本文借助语音与音频信号的谐波特性,建立了一种对语音和音频信号统一编码的方法。首先,本文利用经验模态分解(Empirical Mode Decomposition,EMD)提取输入信号的谐波成分;其次,利用感知匹配追踪算法,并结合正弦参数建模对谐波成分进行参数提取与量化;第三,对于量化谐波后的残差进行抖动格型矢量量化,以提升重建音频的主观听觉质量,并最终实现一套包含24kbps和32kbps码率的宽带语音与音频通用编码器;最后,对所提算法进行了客观PESQ/PEAQ和主观A/B测试,并与ITU-T G.722.1和G.722.2编码器进行了比较,实验结果表明,所提编码器对语音和音频信号的编码质量均优于参考编码器。
- 李晓明鲍长春
- 关键词:语音编码音频编码经验模态分解
- 一种基于暂时分解的高效线谱频率参数量化方法
- 本文基于二阶暂时分解模型,利用LSF参数的有序性,给出了一种用于LSF参数压缩的TD算法,在参数未量化的情况下可获得约为1.28dB的平均谱失真,对表征随时间变化的LSF参数序列的事件函数和事件函数矢量分别进行矢量量化,...
- 李靓鲍长春
- 关键词:语音编码线谱频率
- 文献传递
- 基于空间声学特征的说话人分类算法
- 2013年
- 针对先验信息缺失情况下的说话人分类问题,可以采用提取基于多距离麦克风的空间声学特征的方法进行说话人分类.为了解决由于空间声学特征维数随麦克风个数的增加而迅速增长带来的计算代价问题,需要对其进行降维处理.用一种基于空间声学特征的优化鉴别式保局投影说话人分类方法,实现了在保留空间声学特征流型结构的同时降低计算代价的效果.实验在多距离麦克风语音会议数据集上进行验证,得到在大部分数据集上本方法的分类误差率(diarization error rate,DER)得分低于传统方法的结果.结果表明:本方法的说话人分类性能比传统方法有所提高.
- 杨毅陈国顺鲍长春
- 一种基于哈德码变换的线谱频率参数码书快速搜索算法
- 为了减小语音编码中线谱频率参数量化的运算复杂度,本文提出了一种基于哈德码变换的线谱频率参数码书快速搜索算法.在该算法中,对前4维的LSF预测误差矢量采用加权的哈德码变换域等均值等方差最近邻搜索算法进行码字搜索,对后6维的...
- 李海婷鲍长春
- 关键词:语音编码矢量量化
- 文献传递
- 双麦克风噪声消除的高斯混合模型法被引量:1
- 2014年
- 为了解决基于相位差滤波器(PBF)双麦克风方法残留噪声较多的问题,本文在PBF方法基础上提出一种基于高斯混合模型的双麦克风噪声消除方法。该方法首先采用高斯混合模型(GMM)对目标语音存在(l1)与目标语音不存(l0)在这两种情况进行建模。其次,在实时增强阶段,根据贝叶斯分类器计算每帧的目标语音存在概率(TSPP),随后根据噪声抑制最大化准则修正PBF的增益函数并得到改进的相位差滤波器(IPBF),最后将TSPP与IPBF的增益函数相结合,进而得到一种用于双麦克风噪声消除的掩蔽滤波器。实验结果表明:本文提出算法可有效抑制残留噪声,尤其是在目标语音不存在的时间段。
- 陈浩鲍长春夏丙寅
- 关键词:噪声消除相位差高斯混合模型