张学良
- 作品数:5 被引量:80H指数:3
- 供职机构:内蒙古大学计算机学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于蓝牙Piconet的LEGO多机器人P2P通信
- 2012年
- P2P通信是构建复杂多机器人系统的基础,由于LEGO NXT资源有限,不适于采用常用的Scatternet机制实现P2P通信。以支持蓝牙设备的PC作为中控机和网络主设备,基于Piconet,在中控机上提供可以接收/缓存/转发来自各NXT的通信数据,通过封装,在逻辑上形成P2P通信网络。协同舞蹈4机器人系统原型的研制工作验证了该组网通信机制可行。
- 石博天张学良
- 关键词:多机器人LEGONXTP2P
- 基于深度学习语音分离技术的研究现状与进展被引量:70
- 2016年
- 现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入了巨大的努力,提出了很多实用的方法.特别是近年来,由于深度学习研究的兴起,基于深度学习的语音分离技术日益得到了广泛关注和重视,显露出了相当光明的应用前景,逐渐成为语音分离中一个新的研究趋势.目前已有很多基于深度学习的语音分离方法被提出,但是,对于深度学习语音分离技术一直以来都缺乏一个系统的分析和总结,不同方法之间的联系和区分也很少被研究.针对这个问题,本文试图对语音分离的主要流程和整体框架进行细致的分析和总结,从特征、模型以及目标三个方面对现有的前沿研究进展进行全面而深入的综述,最后对语音分离技术进行展望.
- 刘文举聂帅梁山张学良
- 关键词:神经网络语音分离计算听觉场景分析
- 基于卷积神经网络的鲁棒性基音检测方法被引量:4
- 2016年
- 在语音信号中,基音是一个重要参数,且有重要用途.然而,检测噪声环境中语音的基音却是一项难度较大的工作.由于卷积神经网络(Convolutional neural network,CNN)具有平移不变性,能够很好地刻画语谱图中的谐波结构,因此我们提出使用CNN来完成这项工作.具体地,我们使用CNN来选取候选基音,再用动态规划方法 (Dynamic programming,DP)进行基音追踪,生成连续的基音轮廓.实验表明,与其他方法相比,本文的方法具有明显的性能优势,并且对新的说话人和噪声有很好的泛化性能,具有更好的鲁棒性.
- 张晖苏红张学良高光来
- 关键词:信号处理基音检测卷积神经网络动态规划
- 基于双路径循环神经网络的单通道语音增强被引量:8
- 2021年
- 近年来,随着神经网络的应用,语音增强效果显著提升。但对关联性较强的长序列语音数据,单一的网络结构受到自身性能的限制可能无法继续提升增强效果。为了进一步提升神经网络对语音增强的效果,本文将一种被称为双路径循环神经网络(dual-path recurrent neural network,DPRNN)的复合网络结构应用在语音增强任务中。该复合网络结构由卷积神经网络(convolution neural network,CNN)和长短时记忆神经网络(Long short-term memory,LSTM)组成,网络的核心是两个LSTM组成的双路径循环神经网络块(DPRNN Block)。DPRNN将长序列语音数据分割为重叠帧数据块,利用DPRNN Block对这些数据块执行块内计算和块间计算,以此实现数据的局部和全局建模。实验结果表明,相比于单一网络结构,DPRNN在已知噪声和未知噪声条件下均取得最好结果。
- 王志杰张学良
- 关键词:语音增强卷积神经网络
- 一种基于HMM的蒙古语语音合成前端处理的方法
- 一种基于HMM的蒙古语语音合成前端处理的方法,首先要对音库中的语音数据进行分析;总结对上下文属性集和用于决策树聚类的问题集;进行HMM的训练,得到HMM的训练结果;得到对应的聚类状态模型,形成聚类状态模型序列;利用参数的...
- 飞龙高光来赵建东张学良
- 文献传递