李为 作品数:5 被引量:3 H指数:1 供职机构: 上海交通大学 更多>> 发文基金: 国家自然科学基金 国家重点实验室开放基金 更多>> 相关领域: 自动化与计算机技术 电子电信 天文地球 更多>>
实际情况下的短时场景说话人识别关键技术与系统实现的研究 伴随着科技的进步,移动设备在人们的日常生活中扮演着越来越重要的角色。据统计在2012年,智能手机的市场占有率首次超过了个人电脑,标志着移动互联网时代的全面到来。包括智能手机、智能车载、智能家居等一系列的智能终端产品为人们... 李为关键词:说话人识别 文献传递 长江河口北槽弯道环流的涡度研究:资料分析与数学模拟 为了进一步理解长江河口北槽弯道附近环流的物理学,基于涡度方法,本文采用了现场观测资料分析和数学模拟进行研究。首先,采用频率为300 kHz的ADCP,走航观测得到长江河口北槽弯道附近3个横向断面(AD3、AD5和AD6)... 李为关键词:横向环流 文献传递 稀疏线性预测字典在语音压缩感知中的应用 被引量:1 2016年 压缩感知理论框架可以同时实现信号的采样和压缩,将压缩感知应用于语音信号处理是近年来的研究热点之一.本文根据语音信号的特点,采用K-SVD算法获得稀疏线性预测字典,作为语音信号的稀疏变换矩阵.高斯随机矩阵用于原语音信号的采样从而实现信号的压缩,最后通过正交匹配追踪算法(OMP)和采样压缩匹配追踪算法(Co Sa MP)将已采样压缩的语音信号进行信号重构.实验考察了待处理语音信号帧的长度、压缩比,稀疏变换字典以及压缩感知重构算法等因素对语音压缩感知重构性能的影响,结果表明,基于数据集训练的稀疏线性预测字典相比传统解析构造的离散余弦变换字典,对语音的重构性能具有0.6 d B左右的提升. 游寒旭 李为 李昕 朱杰关键词:压缩感知 语音信号处理 含语音增强模块的i-向量说话人识别性能分析 2016年 为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势. 李昕 李为 游寒旭 朱杰关键词:说话人识别 语音增强 维纳滤波 谱减法 一种应用于文本相关说话人确认的L-向量表示和改进的余弦距离核函数(英文) 被引量:2 2016年 提出了一种用于文本相关说说话人确认技术的i-向量提取方法和L-向量表示.一段用于注册或识别的语音可以用i-向量和L-向量联合表示.同时提出了一种改进的用于支持向量机(SVM)后端分类的核函数,改进的核函数可以同时区分说话人身份的差异和文本内容的差异.在RSR 2015语料集合1和集合2上验证系统的性能,实验结果显示改进的算法相对于传统的i-向量系统的基线能提高至多30%的识别率. 李为 游寒旭 朱杰 陈宁