- 一种基于动态规划的基音周期提取方法
- 本发明属于语音编码技术领域,其特征在于,采用逆滤波进行谱平坦操作,并把逆滤波零点位置限制在单位圆内的一个单位圆的同心圆中,避免了零点处谐波被过度衰减;同时该动态规划方法考虑了基音周期的正常变化与自身提取错误的情况,使用分...
- 崔慧娟唐昆魏旋党晓妍
- 文献传递
- 一种基于动态规划的基音周期提取方法
- 本发明属于语音编码技术领域,其特征在于,采用逆滤波进行谱平坦操作,并把逆滤波零点位置限制在单位圆内的一个单位圆的同心圆中,避免了零点处谐波被过度衰减;同时该动态规划方法考虑了基音周期的正常变化与自身提取错误的情况,使用分...
- 崔慧娟唐昆魏旋党晓妍
- 文献传递
- 基于动态规划的低延时基音提取算法被引量:7
- 2008年
- 基音周期是语音信号的一个重要参数。为了在低延时条件下准确地提取语音基音周期参数,提出了一种基于动态规划的单路径搜索算法。该算法引入了清浊音信息和帧间相对能量对相邻帧代价函数进行加权;使用了一种更加有伸缩性的方式对基音变化幅度进行控制,以代替基音变化的硬性限制;专门针对基音突变和自身错误的情况,对过去帧影响进行限制,在保持基音跟踪性能和允许基音突变之间寻找一个平衡点。最后,使用Keele数据库进行的测试表明,该算法在只有一帧延时的情况下,严重错误率比传统算法下降2.32%。
- 魏旋党晓妍崔慧娟唐昆
- 关键词:语音编码低延时动态规划
- 基于DCT变换的LSF参数降维算法被引量:4
- 2008年
- 为降低声码器线谱对频率(LSF)参数量化码本的存储量和码本搜索运算量,文章提出了一种基于二维DCT变换的LSF参数降维算法。相比时域重要帧抽取算法,DCT降维算法能够在不降低语音听觉性能的基础上,将LSF参数的码本量和搜索运算量都降到50%。在同等情况下,DCT降维算法能比时域重要帧抽取算法提高0.1dB到0.2dB的性能。实验结果表明,提出的算法可以更有效地解决低速率声码器中参数码本存储量和搜索运算量的问题。
- 向波唐昆崔慧娟魏旋党晓妍
- 关键词:语音编码DCT变换降维算法
- 声码器清浊音判决算法优化被引量:7
- 2008年
- 为了解决低速声码器合成语音的偶发性嘶哑或变调问题,对参数提取进行改善,采用有监督学习的Fisher判决法,利用多个特征值组成的特征向量为判据;基音周期平滑的准确度在利用了更准确的清浊音信息后大有提高。测试结果表明:该算法能够大大降低清浊音误判率,减少严重基音周期错误数;应用该算法的SELP(sinuous excitationlinear prediction)2.4 kb/s的PESQ-MOS分优于2.4 kb/s的MELPe(mixed excitation linear prediction)和AMBE+(advanced multi-band excitation)算法,DRT(diagnosticrhythm test)分数达95%,具有良好的可懂度和自然度。
- 党晓妍魏旋崔慧娟唐昆
- 关键词:语音编码清浊音判决
- 基于Gauss混合模型的清浊音解码端恢复算法被引量:4
- 2010年
- 清浊音(V/U)判决是低速率语音编码算法中的一个重要参数。该文利用Gauss混合模型(GMM)在语音解码端根据量化后的语音能量和线性预测编码(LPC)系数计算V/U后验概率,从而进行V/U判决恢复。带通浊音度系数(BPVC)也使用类似方法恢复。实验证明,即使在能量参数和LPC参数粗糙量化的情况下,该算法对全带V/U的恢复性能亦优于混合激励线性预测(MELP)算法中全带V/U分类器利用原始语音信号的分类性能,从而证明该恢复算法性能满足实用要求。该算法可以单独在解码端实现,从而节省了所有原来用于V/U信息量化传输的比特,可以进一步降低编码码率。
- 魏旋党晓妍崔慧娟唐昆
- 关键词:语音编码
- 多级矢量量化中的码本共享被引量:2
- 2006年
- 为了解决语音参数编码算法中多级矢量量化中码本尺寸过大,存储量过大,导致搜索复杂度大的问题,提出了多级矢量量化中的码本共享的迭代算法。该算法基于多级矢量量化中各级待量化码矢之间的相似性,采用模拟退火算法,通过迭代得出共享变换系数。在1.2 kb/s的正弦激励线性预测声码器中,采用该算法对线谱对参数进行多级矢量量化。测试结果表明:在共享级别选择恰当时,可降低存储量20%,同时重建语音谱失真损失约为0.02 dB,可见该算法可以有效降低码本容量,同时对语音质量影响极小。
- 党晓妍唐昆崔慧娟李军林
- 关键词:多级矢量量化
- 低速率声码器激励参数的DCT-M模型被引量:1
- 2007年
- 在低速率声码器中,对激励信号的描述直接影响重建语音的质量。为了改善音质,引入了DCT-M模型对激励谱幅度参数进行描述,通过二维离散余弦变换将变长的谱幅度矢量转为固定长度,再对其进行多级矢量量化。测试表明,该方法能够保留全带激励谱幅度矢量的形状,降低模型误差,从而提高了全带激励谱幅度的描述精度。将其应用在正弦激励线性预测(SELP)声码器中进行测试,结果表明,它能够改善重建语音的自然度,主观测试结果达65%。
- 党晓妍唐昆
- 关键词:声码器