公共文化服务平台

共 4 条记录，以下是 1-5

全选清除导出

排序方式：

基于深度神经网络和Bottleneck特征的说话人识别系统被引量：13: 2016年; 近来,一种结合语音识别中深度神经网络（deep neural network,DNN）模型和说话人识别中身份认证矢量（identity vector,i-vector）模型的方法被证明对说话人识别十分有效。为了进一步提升系统性能,该文提出使用基于说话人标签的DNN模型提取Bottleneck特征代替该模型中的短时频谱特征来计算充分统计量,从而使统计量中包含更多有利于说话人识别的信息。在美国国家标准与技术研究院说话人识别库2008年度女性电话对电话英语测试任务上进行的实验证明了该方法的有效性。相比原来的短时频谱特征,基于Bottleneck特征的说话人识别系统在等错误率和最小检测代价上相对减小了7.65%和5.71%。; 田垚蔡猛何亮刘加; 关键词：说话人识别

基于无监督迁移分量分析的语种识别: 训练数据和测试数据之间由于信道等差异而引起的不匹配会严重影响语种识别的性能。而在实际应用中,通常我们只能获得少量的和测试数据匹配的标注数据(目标域数据),以及大量的和测试数据不匹配的标注数据(源域数据)。本文利用迁移学习...; 徐嘉明张卫强刘加夏善红; 关键词：语种识别; 文献传递

Exploiting articulatory features for pitch accent detection: 2013年; Articulatory features describe how articulators are involved in making sounds.Speakers often use a more exaggerated way to pronounce accented phonemes,so articulatory features can be helpful in pitch accent detection.Instead of using the actual articulatory features obtained by direct measurement of articulators,we use the posterior probabilities produced by multi-layer perceptrons(MLPs) as articulatory features.The inputs of MLPs are frame-level acoustic features pre-processed using the split temporal context-2(STC-2) approach.The outputs are the posterior probabilities of a set of articulatory attributes.These posterior probabilities are averaged piecewise within the range of syllables and eventually act as syllable-level articulatory features.This work is the first to introduce articulatory features into pitch accent detection.Using the articulatory features extracted in this way,together with other traditional acoustic features,can improve the accuracy of pitch accent detection by about 2%.; Junhong ZHAOJi XUWei-qiang ZHANGHua YUANJia LIUShanhong XIA; 关键词：PROSODY

低数据资源条件下基于优化的数据选择策略的无监督语音识别声学建模被引量：2: 2013年; 为了克服低数据资源条件下的资源匮乏问题,该文利用无监督的声学模型训练方法来增加训练数据,改善系统性能。在标准的无监督训练框架下,在传统词图后验概率的词置信度基础上,提出了基于句子后验概率的置信度数据筛选准则,所选数据在保证整句话可靠性的同时很好保留了上下文信息,有利于跨词的三音子声学模型建模;还提出了基于音素覆盖率准则的数据筛选方法,在考虑假设标注句子置信可靠度的同时,尽可能选取训练样本中最为稀疏的音素单元,从源头再次克服低数据资源的困难,数据选择效率更高,性能进一步提升。实验表明:基于本文改进的无监督训练方法的词错误率比基线有监督训练方法的降低约相对8%,比传统无监督方法的也有绝对2%的减少,极大程度改善了低数据资源条件下的系统性能。; 钱彦旻刘加; 关键词：语音识别数据选择

基于JSM和MLP改进发音错误检测的方法被引量：1: 2014年; 针对发音错误检测的发音字典生成提出基于联合序列多阶模型(Joint-sequence multi-gram,JSM)和多层神经感知(Multi-layer perception,MLP)的方法.首先使用JSM模型对发音错误进行建模,将标准发音和错误发音组合为发音对,表示它们之间的对应关系,再使用N元文法来统计各发音对之间的关系,描述错误发音对上下文关系的依赖.最后使用MLP对发音对之间的关系进行重新建模,以学习到在相似的上下文条件下发生的相似的错误.实验证明使用MLP对高阶模型进行概率重估能有效的平滑概率空间,提高了发音错误检测的性能.; 袁桦史永哲赵军红刘加; 关键词：发音错误检测计算机辅助语言学习

全选清除导出

共1页<1>

国家自然科学基金(61273268)