张晓洲
- 作品数:4 被引量:3H指数:1
- 供职机构:清华大学计算机科学与技术系更多>>
- 发文基金:国家自然科学基金教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于声纹识别技术的麦克风阵列说话人实时定位
- 本文提出了一个基于声纹识别技术的麦克风阵列说话人实时定位系统,称为SR-SLOMA.该系统将实时声纹识别技术和麦克风阵列的说话人定向技术相结合,当麦克风阵列给出的说话人所在区域内存在多人时,综合声纹识别的结果,按照判定策...
- 张南张晓洲史元春
- 关键词:声纹识别麦克风阵列波束成形技术
- 文献传递
- 考虑帧间动态特征的音色变换算法被引量:2
- 2006年
- 基于G auss ian混合模型的音色变换算法在预测目标说话人频谱时会出现过平滑问题,导致声音转换结果的音质下降。该文分析了造成过平滑问题的原因,并提出一种考虑帧间动态特征的音色变换改进算法,在估计参数的目标函数中加入了连续性和方差的影响,从而改善了映射结果的帧间连续性,并使方差最大化,克服了过平滑现象。实验表明该算法在保证变换结果的目标倾向性的同时,能够使变换语音的音质主观意见得分由3.11提高到3.89,证明动态特征对提高音色变换的音质有重要意义。
- 张晓洲黄德智蔡莲红
- 关键词:动态特征
- 一种数字语音处理研究平台的设计被引量:1
- 2006年
- 设计了一种支持多视图和多种数据接口的研究平台。该平台采用了模块组合式的体系结构,使得新的语音处理算法能够便捷地加入到平台中。所有模块被分为内部模块和外部模块。内部模块集成语音的数据接口和可视化功能,外部模块则实现语音的分析功能。该平台采用了纵版的显示方式,不同算法得到的结果被垂直排列显示在一个窗口内,有利于对比分析,还内建了支持基于XML的语音标注格式,能够被直接应用到语料库建设和语音分析等领域。
- 黄德智张晓洲蔡莲红
- 关键词:数字语音处理可视化语料库
- 基于声纹识别技术的麦克风阵列说话人实时定位
- 本文提出了一个基于声纹识别技术的麦克风阵列说话人实时定位系统,称为SR-SLOMA。该系统将实时声纹识别技术和麦克风阵列的说话人定向技术相结合,当麦克风阵列给出的说话人所在区域内存在多人时,综合声纹识别的结果,按照判定策...
- 张南张晓洲史元春
- 关键词:声纹识别麦克风阵列波束成形技术
- 文献传递