许友亮
- 作品数:5 被引量:11H指数:2
- 供职机构:解放军信息工程大学信息工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 一种融合IB准则特征的说话人分段聚类方法
- 2013年
- 针对说话人分段与聚类算法中先验知识不足的问题,利用基于信息瓶颈(IB)准则和基于隐马尔科夫模型(HMM)/高斯混合模型(GMM)方法间的互补性,提出了一种基于特征层融合的说话人分段与聚类算法。该算法将基于IB准则算法的输出结果进行对数变换和降维处理;然后利用变换后的特征与传统梅尔频率倒谱系数(MFCC)特征分别训练说话人GMM模型,并在得分域对说话人类别的得分进行加权融合;根据融合的得分,进行基于HMM/GMM模型的说话人分段与聚类。实验表明,融合后的特征可以为系统提供更多的先验信息,比传统方法的误配率降低了1.2%。
- 张力张连海许友亮
- 关键词:HMM
- 基于音位属性和边界信息的音素识别被引量:6
- 2013年
- 在检测出音位属性的基础上,提出了一种基于音位属性后验概率的音素边界检测算法,并将音位属性与边界信息应用于基于条件随机场的音素识别。该方法首先计算得出相邻帧音位属性后验概率向量间的夹角,然后将夹角的极大值点所在的帧选为侯选边界,最后通过约束条件去除极值点中的错误边界。本文将音素边界与音位属性信息进行组合,作为基于条件随机场模型的识别系统的观测特征,实验结果表明,增加边界信息后,音素正确识别率有了显著提升。
- 许友亮张连海牛铜
- 关键词:自动语音识别条件随机场
- 基于事件检测的音素识别技术研究
- 语音“事件”是指时间上各种属性、特征变化的突变点序列,通过检测出这些事件并融合相关的语音知识,能够正确地识别出语音内容。在各种语音事件中,音位属性是一种反映发声过程的特征参数,基于音位属性检测的自动语音识别技术成为研究的...
- 许友亮
- 关键词:音素识别隐马尔科夫模型条件随机场
- 文献传递
- 基于长时性特征的音位属性检测方法
- 2012年
- 提出一种基于长时性信息的音位属性检测方法,该方法通过高、低两层时间延迟神经网络(TDNN)进行实现,低层TDNN在短时特征上进行音位属性的检测,高层TDNN在低层检测结果的基础上,对更长时段上的信息进行融合。实验结果表明,引入长时性特征使得音位属性检测率提升约3%,将音位属性后验概率作为音素识别系统的观测特征,使用长时性特征的识别结果提升约1.7%。
- 许友亮张连海屈丹牛铜
- 关键词:层级结构人工神经网络隐马尔可夫模型音素识别
- 基于语速调整和音位属性后验概率的音素识别被引量:5
- 2012年
- 基于语音事件检测的自动语音识别是当前研究的热点问题。针对说话人语速变化导致模型适应性差的问题,提出了一种语速自适应调整算法。该算法以语句为单位,采用连续变化的帧长与帧移间隔对语句进行归一化调整,使调整后速率与语料库平均速率一致,减小速率因素对模型训练的影响;另外,通过计算音位属性的后验概率向量间夹角,得到测试集的语速,相比采用训练模型的语速检测方法减轻了系统负担。本文将语速调整算法应用于音位属性的提取,并对音位属性特征进行非线性变换,最后采用隐马尔科夫模型进行建模,实验表明:经过语速调整后,音素的平均持续帧数较为恒定,动态变化范围减小,使得音素识别率提升了1.3%。
- 许友亮张连海张文林李永彬
- 关键词:隐马尔可夫模型自动语音识别