夏秀渝
- 作品数:62 被引量:117H指数:6
- 供职机构:四川大学电子信息学院更多>>
- 发文基金:国家自然科学基金四川省科技支撑计划更多>>
- 相关领域:电子电信自动化与计算机技术文化科学自然科学总论更多>>
- 相干函数在房间声回授通道特性测量中的应用被引量:4
- 2004年
- 介绍基于经典谱估计方法进行房间声回授通道特性的测量,并用相干函数衡量其准确性,就测量结果做了分析,为实际的自适应回声对消系统提供参考和指导.
- 夏秀渝王永德何培宇
- 关键词:相干函数DSP
- 基于BLSTM-CTC的语音特征的音素识别研究被引量:1
- 2022年
- 音音素是自然语言中的最小建模单元,音素识别模型的优劣直接影响关键词检索、连续语音识别的性能。本文首先针对幅度特征MSRCC和相位特征PSRCC进行了一系列对比实验研究,发现融合幅度特征和相位特征可以取得更好的识别效果;接着比较分析了几种深度神经网络的优缺点,并将它们用于音素识别,仿真实验表明基于BLSTM-CTC的声学模型相比于其他模型具有更好的识别性能。
- 吴丹丹夏秀渝
- 关键词:音素识别语音特征
- 制服智能选号型装置的研究与设计被引量:1
- 2014年
- 针对目前国内制服号型匹配作业效率与精准度低的现状,设计出一种基于配衣参数因子的智能选制服号型装置,能实现快速、智能、精准的对个人制服号型的选择;该装置以超声波身高测量仪、电子体重计、头围测量仪、脚长测量仪、测量控制电路、数据传输转换单元等组成人体测量硬件系统,其作用主要是用于快速采集人体相关测量指标数据;在软件设计方面采用智能选号型算法,其目的是对所采集数据进行智能定量分析,最后准确的匹配出个人制服号型;试验结果表明,该装置设计理论充分且性能良好,具有广泛的应用推广前景。
- 叶于林夏秀渝刘厚雯
- 基于变步长LMS算法的声音处理方法及系统
- 本发明公开了基于变步长LMS算法的声音处理方法及系统,其中,声音处理方法包括步骤:S1、计算当前时刻的增益值g(n),所述增益值g(n)的计算式为:g(n)=g(n‑1)+u(n‑1)*e(n‑1)*P<Sub>x</S...
- 潘帆许芳芳何培宇夏秀渝
- 文献传递
- 一种改进的广义旁瓣对消阵列语音增强算法
- 2024年
- 传统广义旁瓣对消(generalized sidelobe cancellation,GSC)算法在复杂声学环境下性能较差,语音增强效果不理想,需要加强其去噪能力以提高输出语音质量。对此,提出一种改进型广义旁瓣对消算法。构建基于频域GSC和时域GSC两级滤波的系统结构,利用一个选择滤波器输出两级滤波中质量较好的语音;并将GSC上支路权值修改为可自适应调节的形式,提高算法的适应性;GSC权值迭代时采用一种变步长自适应算法,步长因子根据信号信干噪比实时调整,防止滤波器权值发散。实验结果表明,相比于传统GSC算法,新算法在SINR、PESQ、STOI和SDR等指标上都有提升。
- 童环夏秀渝
- 关键词:麦克风阵列语音增强GSC
- 听觉模型鲁棒性特征研究及应用
- 2024年
- 人类的听觉系统具有非常精细而巧妙的结构,即使在嘈杂的环境中,也能准确地理解语音。采用精细的耳蜗模型作为前端处理可以实现更好的语音处理。利用快速压缩的非对称谐振器级联(CARFAC)作为人耳外周模型,结合听觉稳定图像得到精确的皮层前听觉模型。在听觉模型的基础上提取较准确的基音轮廓,利用基音信息进行声场景分析,合成鲁棒性语音特征,并将其送入神经网络进行监督训练,以实现语音增强。实验结果表明,噪声条件下,由听觉模型提取的特征在各语音评价指标下都有较好的体现,可以更好表征语音信号,具有一定的鲁棒性。
- 王文华夏秀渝
- 关键词:语音增强系统基音提取
- 一种适用于双讲情况的回声消除结构
- 2022年
- 双端通话情况下自适应回声消除的性能发生恶化,甚至可能导致自适应滤波器发散,严重地影响免提通话的质量。因此必须在回声消除系统中使用双话检测(Double Talk Detection,DTD)来控制自适应滤波器系数的更新。针对这一问题,本文采用了一种改进的回声消除结构,在该结构中采用的双端检测算法和非线性处理模块有效提高了双话情况下回声消除系统的性能。
- 任思明夏秀渝
- 关键词:回声消除自适应滤波器互相关
- 基于LSTM的关键词识别系统设计被引量:3
- 2022年
- 为快速、准确地判断语音流中是否含有关键词,提出一种基于LSTM两步检索的关键词识别系统。将连续语音流分割成独立音节,然后采用过零率直方图进行初步检索,基于过零率直方图的相似度比较的计算量小,可快速排除非关键词。对初检时判断为关键词的音频片段进行精检,使用基于LSTM的分级系统进行音素识别,通过贪心搜索算法解码以确认是否为目标关键词。仿真结果表明,基于LSTM的网络能更有效提取音素特征,基于两步检索LSTM的关键词识别系统计算量小、速度快、识别率较高,且易于动态扩展目标关键词,具有较好的实时性。
- 何蕊伽夏秀渝
- 关键词:关键词识别语音分割音素识别循环神经网络
- 基于神经网络和卡尔曼滤波算法的说话人识别被引量:1
- 2008年
- 首先从语音信号中提取出特征参数:线性预测倒谱系数(LPCC)和用小波包提取的小波特征参数(WPC);语音特征分类模型则选择多层前馈式神经网络(MBP网络),并将奇异值分解运用到扩展卡尔曼滤波(EKF)算法中作为神经网络的学习算法。仿真结果表明,小波特征参数具有良好的识别效果;同时采用改进后的扩展卡尔曼滤波(EKF)算法使人工神经网络具有更稳定、更准确的分类性能。
- 张余生夏秀渝杨莎
- 基于深度神经网络的关键词识别系统被引量:7
- 2018年
- 针对当前关键词识别少资源或零资源场景下的要求,提出一种基于音频自动分割技术和深度神经网络的关键词识别算法.首先采用一种基于度量距离的改进型语音分割算法,将连续语音流分割成孤立音节,再将音节细分成和音素状态联系的短时音频片段,分割后的音频片段具有段间特征差异大,段内特征方差小的特点.接着利用一种改进的矢量量化方法对音频片段的状态特征进行编码,实现了关键词集内词的高精度量化编码和集外词的低精度量化编码.最后以音节为识别单位,采用压缩的状态转移矩阵作为音节的整体特征,送入深度神经网络进行语音识别.仿真结果表明,该算法能从自然语音流中较为准确地识别出多个特定关键词,算法易于理解、训练简便,且具有较好的鲁棒性.
- 孙彦楠夏秀渝
- 关键词:关键词识别语音分割矢量量化