您的位置: 专家智库 > >

张扬

作品数:6 被引量:16H指数:3
供职机构:同济大学电子与信息工程学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 5篇期刊文章
  • 1篇会议论文

领域

  • 3篇自动化与计算...
  • 2篇电子电信

主题

  • 4篇语音
  • 3篇马尔科夫
  • 3篇高斯
  • 2篇音节
  • 2篇音素
  • 2篇隐马尔科夫模...
  • 2篇判决
  • 2篇切分
  • 2篇切分方法
  • 2篇马尔科夫模型
  • 2篇汉语
  • 2篇汉语音节
  • 1篇动态时间规整
  • 1篇循环神经网络
  • 1篇语音识别
  • 1篇神经网
  • 1篇神经网络
  • 1篇声学
  • 1篇时频
  • 1篇网络

机构

  • 6篇同济大学

作者

  • 6篇张扬
  • 4篇赵晓群
  • 1篇徐静云

传媒

  • 2篇燕山大学学报
  • 2篇计算机应用
  • 1篇华中科技大学...

年份

  • 2篇2017
  • 2篇2016
  • 2篇2015
6 条 记 录,以下是 1-6
排序方式:
语音关键词识别系统声学模型构建综述被引量:8
2017年
语音关键词识别技术作为语音识别的重要分支在20世纪90年代逐渐被重视起来,时至今日,语音关键词识别技术已经被应用到车内语音命令识别、机器人交互及特殊语音筛选等众多领域。本文给出了语音关键词识别技术的整体模型及性能评价指标,综述了语音关键词识别系统声学模型构建技术的现状,详细总结了语音关键词识别系统声学模型构建技术,并重点总结了深度学习在声学模型构建上的应用。最后对语音关键词识别技术的发展前景进行了讨论,认为深度学习隐马尔科夫混合模型作为连续语音识别中最成熟的模型构建技术将在关键词识别中有更多应用,循环神经网络有可能凭借其序列训练能力成为更有效的模型构建技术,而大计算量、云平台及便携可穿戴将会成为语音关键词识别技术发展的主流方向。
赵晓群张扬
关键词:动态时间规整循环神经网络
基于音节时间长度高斯拟合的汉语音节切分方法被引量:5
2016年
研究汉语自然语音音节切分方法具有明显现实意义,比较准确的自然语音切分方法可以代替人工对一些拥有参照文本的语音进行标注。然而至今为止并没有完全准确的汉语语音音节切分方法。依据相同发音环境下汉语语音音节时间长度服从某种高斯分布和相邻语音音节之间存在短时能量波谷两个假设,提出了基于音节时间长度高斯拟合的汉语音节切分方法。对算法进行分析,根据初步切分短时能量波谷分散到各分语音段的特性,提出了简化算法,有效降低了该音节切分方法的时间复杂度。实验结果表明,音节切分准确度(与人工标注切分时间距离平方的均值)达到小数点后3位,在台式机Matlab环境下运算时间均不超过1 s,可以达到应用要求。
张扬赵晓群王缔罡
关键词:汉语高斯分布
基于动态数量高斯分量的关键词识别系统
提出了一种利用动态数量高斯分量拟合不同音素,利用拟合的音素组合作为补白参与语音关键词识别系统二次判决的方法.首先分析了为音素分配动态的高斯分量数量来训练音素模型的可行性;进而寻找能够准确描述音素且保证描述在不同音素之间有...
张扬
关键词:语音识别关键词
基于时频二维能量特征的汉语音节切分方法被引量:5
2016年
较准确的语音切分方法可以极大提高语料标注等工作的效率,有助于语音识别等应用中语音与模型的对齐。利用汉语语音在时频二维的能量特征设计了一种新的汉语语音音节切分方法。用传统方法判断静音帧,用相同时间不同频率的二维能量判断清音帧,用不同时间特定频段的0-1二维能量判断浊音帧及有话帧,综合4种判断结果给出音节切分位置。实验结果表明,该方法切分准确度优于基于归并的音节切分自动机(MBSDA)和高斯拟合法,其音节切分误差为0.029 7 s,音节切分偏差率为7.93%。
张扬赵晓群王缔罡
无损压缩文件的参数特性分析
2017年
对文本文件的无损压缩文件中参数进行统计和分析,统计了无损压缩文件中匹配长度、匹配距离和压缩比等参数的概率密度函数,并分析了这些参数对二次熵编码和无损压缩文件容错译码的作用。分类并定义了受损压缩文件中的错误类型,分析了不同错误对译文的破坏程度。分析了不同类型的错误传播的统计特性以及它们对译文的影响。最后比较受损压缩文件与未受损压缩文件的特性差异,为无损压缩文件容错译码的提供指导意义。
王缔罡赵晓群张扬徐静云
关键词:LZSS
基于动态数量高斯分量的关键词识别系统
2015年
提出了一种利用动态数量高斯分量拟合不同音素,利用拟合的音素组合作为补白参与语音关键词识别系统二次判决的方法.首先分析了为音素分配动态的高斯分量数量来训练音素模型的可行性;进而寻找能够准确描述音素且保证描述在不同音素之间有足够区分度的高斯分量个数;利用得到的音素与高斯分量数量的关系训练动态高斯添加的音素隐马尔科夫模型,利用模型的排列组合作为补白为语音关键词识别系统添加第二次判决来减小系统错误识别率.实验表明,利用这种方法进行语音关键词系统二次判断,能将原系统错误率降低至14.79%.
张扬
共1页<1>
聚类工具0