您的位置: 专家智库 > >

许友亮

作品数:5 被引量:11H指数:2
供职机构:解放军信息工程大学信息工程学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 4篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...
  • 2篇电子电信

主题

  • 4篇音素识别
  • 3篇音位
  • 3篇语音
  • 2篇隐马尔可夫模...
  • 2篇语音识别
  • 2篇随机场
  • 2篇条件随机场
  • 2篇自动语音识别
  • 2篇马尔可夫
  • 2篇马尔可夫模型
  • 1篇信息瓶颈
  • 1篇音素
  • 1篇隐马尔科夫模...
  • 1篇神经网
  • 1篇神经网络
  • 1篇人工神经
  • 1篇人工神经网络
  • 1篇网络
  • 1篇马尔科夫
  • 1篇马尔科夫模型

机构

  • 4篇解放军信息工...
  • 1篇中国人民解放...

作者

  • 5篇许友亮
  • 4篇张连海
  • 2篇牛铜
  • 1篇屈丹
  • 1篇张文林
  • 1篇张力
  • 1篇李永彬

传媒

  • 1篇数据采集与处...
  • 1篇计算机工程
  • 1篇信号处理
  • 1篇太赫兹科学与...

年份

  • 2篇2013
  • 3篇2012
5 条 记 录,以下是 1-5
排序方式:
一种融合IB准则特征的说话人分段聚类方法
2013年
针对说话人分段与聚类算法中先验知识不足的问题,利用基于信息瓶颈(IB)准则和基于隐马尔科夫模型(HMM)/高斯混合模型(GMM)方法间的互补性,提出了一种基于特征层融合的说话人分段与聚类算法。该算法将基于IB准则算法的输出结果进行对数变换和降维处理;然后利用变换后的特征与传统梅尔频率倒谱系数(MFCC)特征分别训练说话人GMM模型,并在得分域对说话人类别的得分进行加权融合;根据融合的得分,进行基于HMM/GMM模型的说话人分段与聚类。实验表明,融合后的特征可以为系统提供更多的先验信息,比传统方法的误配率降低了1.2%。
张力张连海许友亮
关键词:HMM
基于音位属性和边界信息的音素识别被引量:6
2013年
在检测出音位属性的基础上,提出了一种基于音位属性后验概率的音素边界检测算法,并将音位属性与边界信息应用于基于条件随机场的音素识别。该方法首先计算得出相邻帧音位属性后验概率向量间的夹角,然后将夹角的极大值点所在的帧选为侯选边界,最后通过约束条件去除极值点中的错误边界。本文将音素边界与音位属性信息进行组合,作为基于条件随机场模型的识别系统的观测特征,实验结果表明,增加边界信息后,音素正确识别率有了显著提升。
许友亮张连海牛铜
关键词:自动语音识别条件随机场
基于事件检测的音素识别技术研究
语音“事件”是指时间上各种属性、特征变化的突变点序列,通过检测出这些事件并融合相关的语音知识,能够正确地识别出语音内容。在各种语音事件中,音位属性是一种反映发声过程的特征参数,基于音位属性检测的自动语音识别技术成为研究的...
许友亮
关键词:音素识别隐马尔科夫模型条件随机场
文献传递
基于长时性特征的音位属性检测方法
2012年
提出一种基于长时性信息的音位属性检测方法,该方法通过高、低两层时间延迟神经网络(TDNN)进行实现,低层TDNN在短时特征上进行音位属性的检测,高层TDNN在低层检测结果的基础上,对更长时段上的信息进行融合。实验结果表明,引入长时性特征使得音位属性检测率提升约3%,将音位属性后验概率作为音素识别系统的观测特征,使用长时性特征的识别结果提升约1.7%。
许友亮张连海屈丹牛铜
关键词:层级结构人工神经网络隐马尔可夫模型音素识别
基于语速调整和音位属性后验概率的音素识别被引量:5
2012年
基于语音事件检测的自动语音识别是当前研究的热点问题。针对说话人语速变化导致模型适应性差的问题,提出了一种语速自适应调整算法。该算法以语句为单位,采用连续变化的帧长与帧移间隔对语句进行归一化调整,使调整后速率与语料库平均速率一致,减小速率因素对模型训练的影响;另外,通过计算音位属性的后验概率向量间夹角,得到测试集的语速,相比采用训练模型的语速检测方法减轻了系统负担。本文将语速调整算法应用于音位属性的提取,并对音位属性特征进行非线性变换,最后采用隐马尔科夫模型进行建模,实验表明:经过语速调整后,音素的平均持续帧数较为恒定,动态变化范围减小,使得音素识别率提升了1.3%。
许友亮张连海张文林李永彬
关键词:隐马尔可夫模型自动语音识别
共1页<1>
聚类工具0