国家重点基础研究发展计划(2004CB318106)
- 作品数:21 被引量:90H指数:5
- 相关作者:颜永红赵庆卫董滨付强潘接林更多>>
- 相关机构:中国科学院西安电子科技大学北京电子技术应用研究所更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:电子电信理学自动化与计算机技术一般工业技术更多>>
- 基于听觉感知子带的自适应谷点形成算法
- 自适应谷点形成算法具有结构小巧,算法简单而易于实现,性能显著等特点。在噪声消除、语音识别前端和助听器的设计领域有较强的实用价值。本文介绍了一种基于听觉感知的自适应谷点形成算法,在利用分带减弱由窄带效应引起的系统性能下降的...
- 张恒付强颜永红
- 关键词:听觉感知子带
- 文献传递
- 基于频率调制信息的人工耳蜗语音处理算法研究被引量:4
- 2009年
- 在传统人工耳蜗连续交叠采样(Continuous Interleaved Sampler,CIS)算法的基础上,提出一种基于精细结构(频率调制信息)的人工耳蜗语音处理算法,在不引入过高频率成分、保证工艺可实现性的前提下,使语音识别率大幅提高。听觉仿真实验的结果表明,与传统的基于时域包络的CIS算法相比,基于精细结构的CIS算法对于元音可懂度的改进可以达到28%;声调的识别率在各种噪声条件下提高20%以上;在一般噪声环境下,辅音和句子的可懂度也分别获得了22.9%和28.3%的改进。
- 杨琳张建平王迪颜永红
- 关键词:人工耳蜗语音处理噪声环境
- 用于电话语音识别系统的置信度估计方法的研究
- 2006年
- 提出了一种用于电话语音识别系统的置信度快速估计算法,此算法是在语音识别器帧同步束搜索的过程中基于状态图的同步估计算法,使用同识别器解码相同的声学模型进行置信度估计,此算法取得了比传统的两遍解码估计置信度算法更好的性能,而且计算复杂度较低,运行速度快,解决了计算置信度时使用模型的区分度与计算速度之间的矛盾。
- 董滨赵庆卫颜永红
- 关键词:置信度电话语音识别状态图
- 演唱水平评价因素的客观性分析
- <正>1引言卡拉OK是一种喜闻乐见的娱乐方式,但目前绝大部分卡拉OK系统的演唱评价系统往往和歌手真正的演唱水平相关性甚远。如果能够研究影响演唱评价的主要因素,对于演唱水平的提高会有很大的帮助。
- 李明曹川刘建颜永红
- 文献传递
- 基于能量和浊音特性的语音端点检测被引量:8
- 2006年
- 论文提出一种适用于实际噪声环境的语音端点检测算法,并将其用于语音识别系统中。首先通过跟踪平稳噪声能量,检测能量变化非平稳的信号;然后在这段信号中根据浊音特性搜索并跟踪谐波,确定浊音的位置;最后结合能量和浊音信息检测语音的精确起止点。实验证明,该算法能在多种环境噪声中保持稳定可靠的性能。
- 国雁萌盛任农牟英良
- 关键词:端点检测语音识别浊音基音谐波
- 基于共振峰模式的汉语普通话中韵母发音水平客观测试方法的研究被引量:16
- 2007年
- 提出了一种以元音的共振峰模式为特征基于支持向量机算法的分类评估方法,用以对汉语普通话中的韵母发音水平进行客观测试。此算法为每个韵母分别训练全分类模型、子分类模型和评估模型,在两级分类的基础上对发音水平进行测试打分。实验结果表明,全分类模型可以达到90%以上的分类正确率,客观测试与专家主观评估的相似度达到82%,在性能上超过了传统的以倒谱系数为特征的隐含马尔科夫模型方法。
- 董滨赵庆卫颜永红
- 关键词:汉语普通话发音韵母支持向量机算法
- 基于听觉感知子带的自适应谷点形成算法
- 2007年
- 自适应谷点形成算法具有结构小巧、算法简单、易于实现、性能显著等特点,在噪声消除、语音识别前端和助听器的设计领域中有较强的实用价值。介绍了1种基于听觉感知的自适应谷点形成算法,在利用分带减弱由窄带效应引起的系统性能下降的同时,较大程度地保护了语音成分不受伤害。
- 张恒付强颜永红
- 关键词:听觉感知子带
- 混合双语语音识别的研究被引量:2
- 2010年
- 随着现代社会信息的全球化,双语以及多语混合的语言现象日趋普遍,随之而产生的双语或多语语音识别也成为语音识别研究领域的热门课题。在双语混合语音识别中,主要面临的问题有两个:一是在保证双语识别率的前提下控制系统的复杂度;二是有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法,并将该方法与传统的基于声学似然度准则的聚类方法进行比较;针对双语语音中非母语语音识别性能较低的问题,提出一种新型的双语模型修正算法用于提高非母语语音的识别性能。实验结果表明,通过上述方法建立起来的中英双语语音识别系统在有效控制模型规模的同时,实现了同时对两种语言的识别,且在单语言语音和混合语言语音上的识别性能也能得到有效保证。
- 张晴晴潘接林颜永红
- 关键词:语音识别系统混合语言双语聚类方法聚类算法控制系统
- 基于音色单元分布的音乐结构分析被引量:3
- 2010年
- 音乐的结构是音乐作品表达作者思想的一种重要形式,也是听众理解音乐作品内涵的有效途径。本文研究了基于音乐特征的音色单元建模方法,研究了在Fisher准则下,根据局部范围音色单元的分布,采用非监督聚类方法分析音乐的结构。实验结果证明了基于离散余弦变换的音色特征,用音色单元分布聚类算法进行音乐结构分析的有效性。
- 李相莲李明刘若伦颜永红
- 关键词:音乐作品音色FISHER准则离散余弦变换聚类方法
- 一个快速自动音乐记谱方法被引量:4
- 2010年
- 自动音乐记谱是音乐信号处理中的关键技术。本文描述了一个快速的自动复音音乐记谱方法。该方法采用回声器时频分析(RTFI)作为时频分析工具,主要由两个阶段组成,能量基的音符切分和多基频估计。本文所采用的多基频估计方法首先将RTFI能量谱按照谐音组合原理转换为基频能量谱,并基于基频能量谱采用简单的峰拾起方法对基频做初步估计;然后根据频谱不规律性和乐音谐音结构的基本假定,消除初步估计中的错误预测。
- 周若华颜永红