您的位置: 专家智库 > >

国家自然科学基金(10925419)

作品数:19 被引量:53H指数:5
相关作者:颜永红索宏彬许春冬李军锋杨琳更多>>
相关机构:中国科学院北京理工大学江西理工大学更多>>
发文基金:国家自然科学基金中国科学院战略性先导科技专项国家高技术研究发展计划更多>>
相关领域:电子电信自动化与计算机技术理学交通运输工程更多>>

文献类型

  • 17篇期刊文章
  • 6篇会议论文

领域

  • 20篇电子电信
  • 2篇自动化与计算...
  • 1篇交通运输工程
  • 1篇医药卫生
  • 1篇理学

主题

  • 11篇语音
  • 6篇说话人识别
  • 4篇语音识别
  • 4篇混合模型
  • 4篇高斯
  • 4篇高斯混合
  • 4篇高斯混合模型
  • 3篇信道
  • 3篇语音增强
  • 3篇说话人确认
  • 2篇倒谱
  • 2篇倒谱系数
  • 2篇序贯
  • 2篇支持向量
  • 2篇支持向量机
  • 2篇谱系数
  • 2篇向量
  • 2篇向量机
  • 2篇功率谱
  • 2篇感知

机构

  • 19篇中国科学院
  • 4篇北京理工大学
  • 3篇江西理工大学
  • 2篇国家互联网应...
  • 1篇河北师范大学
  • 1篇内蒙古师范大...
  • 1篇上海海洋大学

作者

  • 15篇颜永红
  • 4篇付强
  • 3篇杨琳
  • 3篇索宏彬
  • 3篇李军锋
  • 3篇许春冬
  • 2篇张晴晴
  • 2篇陈梦喆
  • 2篇夏日升
  • 2篇张建平
  • 2篇梁春燕
  • 2篇国雁萌
  • 2篇张翔
  • 2篇应冬文
  • 1篇姜开宇
  • 1篇王宪亮
  • 1篇吴超
  • 1篇葛凤培
  • 1篇李艳玲
  • 1篇汪俊杰

传媒

  • 5篇声学学报
  • 3篇Chines...
  • 2篇声学技术
  • 2篇网络新媒体技...
  • 1篇电子与信息学...
  • 1篇应用声学
  • 1篇计算机应用
  • 1篇计算机应用研...
  • 1篇Journa...

年份

  • 1篇2017
  • 4篇2014
  • 12篇2013
  • 5篇2012
  • 1篇2010
19 条 记 录,以下是 1-10
排序方式:
基于PLDA的“一对多”下的说话人确认方法研究
近年来,概率线性鉴别分析(Probabilistic Linear Discriminant Analysis,PLDA)因其优异的性能而得到学者们的广泛关注。然而,各主流单位的PLDA研究都是基于NISTSRE 201...
许云飞黄厚军金怡珠李桂莲周若华
关键词:说话人识别
多特征融合的英语口语考试自动评分系统的研究被引量:10
2012年
该文主要针对大规模英语口语考试自动评分系统的问答题型,采用多特征融合的方法进行评分。以语音识别文本作为研究对象,提取了3类特征进行评分。这3类特征分别是:相似度特征、句法特征和语音特征。总共9个特征从不同方面描述了考生回答与专家评分之间的关系。在相似度特征中,改进了Manhattan距离作为相似度。同时提出了基于编辑距离的关键词覆盖率的特征,充分考虑了识别文本中存在的单词变异现象,为给考生一个客观公平的分数提供依据。所有提取的特征利用多元线性回归模型进行融合,得到机器评分。实验结果表明,提取的特征对机器评分是十分有效的,并且在以考生为单位的系统评分性能达到了专家评分性能的98.4%。
李艳玲颜永红
关键词:自动语音识别自动评分句法树
说话人识别中的总变化因子分析技术
2013年
研究并实现了总变化因子分析(Total Variability Factor Analysis)技术,该技术在对说话人进行建模的时候,不区分语音中的说话人信息和信道信息,而是将整个语音空间(总变化空间)进行建模,然后在这个空间上对训练和测试语音计算其相应的总变化因子向量(Ivector),来作为支持向量机(Support Vector Machine,SVM)建模和分类的特征。为了降低信道对识别的影响,我们使用线性鉴别分析(Linear Discriminant Analysis,LDA)降维技术以及类内协方差规整(Within-Class Covariance Normalization,WCCN)技术对Ivector进行信道补偿。实验结果表明同时使用WCCN和LDA对Ivector进行信道补偿要好于单独使用WCCN或LDA;并且与传统的联合因子分析系统(Joint Factor Analysis,JFA)相比,以作为评价指标,在男、女测试集上,等错率(Equal Error Ratio,EER)分别相对降低1.20%和9.27%。
杨琳黄远杨晶超汪俊杰索宏彬
关键词:说话人识别信道补偿
联合因子分析和稀疏表示在稳健性说话人确认中的应用被引量:7
2012年
在说话人确认的任务中,为了解决信道失配问题,提高系统性能,引入了联合因子分析和稀疏表示算法。首先利用联合因子分析算法去除信道干扰,得到与信道无关的说话人因子,然后在稀疏表示算法中利用说话人因子构建过完备字典,求解稀疏最优化问题计算说话人得分。由于此方法有机结合了联合因子分析算法的信道鲁棒性和稀疏表示的鉴别性,使用此算法构建的系统在NIST SRE 2008电话训练、电话测试数据集上性能表现良好,相对于联合因子分析-支持向量机系统在性能上有竞争性,在原理上有互异性,系统融合更带来了最小检测代价指标上4.91%的性能提升。实验表明使用联合因子分析与稀疏表示进行说话人确认是可行的。
杨海张翔梁春燕索宏彬颜永红
关键词:稳健性说话人确认信道干扰支持向量机
Acoustic characteristics of stop consonants in fluent reading Chinese Putonghua speech of adult stutterers被引量:1
2013年
This study investigated whether adults who stutter and normal adult speakers differ in the production of stop consonants in fluent reading Chinese Putonghua speech.Voice onset time(VOT) was measured and the spectral moments at the stop burst were calculated for the stutterers(both before and after the speech therapy) and also for the nonstutterers. The statistical results showed that there were no significant differences in VOT between the nonstutterers and stutterers either prior to or after therapy,although the mean VOT of the stutterers was slightly greater than that of the nonstutterers.The results also indicated that both the obstruction place and the subsequent syllabic final exhibited an influence to a greater extent on VOT for the stutterers.In the spectral domain,the spectral mean of the stuttering participants before therapy was significantly different from that of the normal participants, whereas the group difference became insignificant after the therapy session.The smaller spectral mean for the stutterers might be interpreted as a more posterior occlusion in the oral cavity when producing alveolars and velars.In addition,productions of the stutterers scattered with a wider range in the space of spectral moments.Furthermore,the smaller main effect of syllabic finals on the mean spectral frequency of the burst suggested that the stutterers exhibited weaker anticipatory coarticulation than the nonstutterers.
FENG YongqiangYAN QianGAO XinglongPAN FupingXING LiliLIN ChunlanPAN Jielin
关键词:声学特性成年正常成人
A forced alignment approach to detect Chinese repetitive stuttering
2013年
A forced alignment based algorithms to detect Chinese repetitive stuttering is studied. According to the features of repetitions in Chinese stuttered speech,improvement solutions are provided based on the previous research findings.First,a multi-span looping forced alignment decoding networks is designed to detect multi-syllable repetitions in Chinese stuttered speech.Second,branch penalty factor is added in the networks to adjust decoding trend using recursive search in order to reduce the error from the complexity of the decoding networks. Finally,we re-judge the detected stutters by calculating confidence to improve the reliability of the detection result.The experimental results show that compared to previous algorithm,the proposed algorithm can improve system performance significantly,about 18%average detection error rate relatively.
ZHANG JunboYAN QianGAO XinglongPAN FupingFENG YongqiangXING LiliLIN ChunlanPAN Jielin
关键词:惩罚因子
行驶汽车环境中的话音活动检测研究被引量:2
2012年
话音活动检测是语音交互和通信系统的重要部分,其作用是区分输入信号中的语音段和背景噪声段,检测的依据主要是语音和噪声的各种时频特性,其中,浊语音的周期性和谐波特性是一种广泛应用的特征。但是在行驶的汽车环境中,由于噪声非平稳且信噪比较低,这类特征较难得到可靠的检测。为此,本文根据浊音谐波结构的基本规律,利用时变噪声环境中各频带信噪比不同的特点,提出一种较为鲁棒的谐波快速检测算法。算法以较小的时频块为分析单元,利用一组基频在对数尺度上变化的谐波模板,自适应地搜索谐波结构清晰的部分,并以此检测浊语音信号。实验证明,该算法能够在行驶的汽车环境中达到较可靠的话音/非话音区别效果。
安茂波国雁萌付强颜永红
长时语音特征在说话人识别技术上的应用被引量:8
2010年
本文除介绍常用的说话人识别技术外,主要论述了一种基于长时时频特征的说话人识别方法,对输入的语音首先进行VAD处理,得到干净的语音后,对其提取基本时频特征。在每一语音单元内把基频、共振峰、谐波等时频特征的轨迹用Legendre多项式拟合的方法提取出主要的拟合参数,再利用HLDA的技术进行特征降维,用高斯混合模型的均值超向量表示每句话音时频特征的统计信息。在NIST06说话人1side-1side说话人测试集中,取得了18.7%的等错率,与传统的基于MFCC特征的说话人系统进行融合,等错率从4.9%下降到了4.6%,获得了6%的相对等错率下降。
张建平李明索宏彬杨琳付强颜永红
关键词:语音特征识别技术说话人LEGENDRE高斯混合模型多项式拟合
两扬声器配置下的串声消除系统参数优化设置被引量:1
2014年
针对三维声音两扬声器重放中基本上独立研究逆滤波器的设计或扬声器的配置等因素对串声消除系统(CCS)性能的影响,提出了采用频域最小均方(LS)估计逼近方法,系统考察这些因素之间的关联以及对串声消除性能优化的作用,并通过折中考虑CCS的运算效率及系统性能获得了一组最优参数。实验采用通道分离度(CS)和性能误差(PE)两个指标对串声消除效果进行综合评价,仿真结果表明,该组最优参数能获得很好的串声消除效果。
许春冬李军锋裘嫄夏日升颜永红
关键词:三维声音逆滤波
Perceptual MVDR-based cepstral coefficients(PMCCs)for speaker recognition被引量:2
2012年
A feature extraction technique named perceptual MVDR-based cepstral coefficients (PMCCs) was introduced into speaker recognition.PMCCs are extracted and modeled using Gaussian Mixture Models(GMMs) for speaker recognition.In order to compensate for speaker and channel variability effects,joint factor analysis(JFA) is used.The experiments are carried out on the core conditions of NIST 2008 speaker recognition evaluation data.The experimental results show that the systems based on PMCCs can achieve comparable performance to those based on the conventional MFCCs.Besides,the fusion of the two kinds of systems can make significant performance improvement compared to the MFCCs system alone,reducing equal error rate(EER) by the factor between 7.6%and 30.5%as well as minimum detect cost function (minDCF) by the factor between 3.2%and 21.2%on different test sets.The results indicate that PMCCs can be effectively applied in speaker recognition and they are complementary with MFCCs to some extent.
LIANGChunyan ZHANG Xiang YANG Lin ZHANG Jianping YAN Yonghong
关键词:说话人识别MVDR倒谱系数感知高斯混合模型
共3页<123>
聚类工具0