您的位置: 专家智库 > >

周若华

作品数:40 被引量:39H指数:4
供职机构:中国科学院声学研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项更多>>
相关领域:电子电信自动化与计算机技术文化科学更多>>

文献类型

  • 25篇专利
  • 11篇期刊文章
  • 4篇会议论文

领域

  • 14篇电子电信
  • 4篇自动化与计算...
  • 2篇文化科学

主题

  • 19篇语种
  • 16篇语音
  • 16篇语种识别
  • 11篇识别方法
  • 9篇说话人识别
  • 9篇向量
  • 7篇说话人识别方...
  • 6篇音乐
  • 6篇向量机
  • 6篇后验概率
  • 5篇音素
  • 5篇混合模型
  • 5篇高斯
  • 4篇得分
  • 4篇音符
  • 4篇语音数据
  • 4篇钢琴
  • 4篇高斯混合
  • 3篇低能
  • 3篇语音分段

机构

  • 40篇中国科学院
  • 21篇北京中科信利...
  • 4篇国家计算机网...
  • 2篇国家互联网应...
  • 1篇山东理工大学
  • 1篇中国科学院新...
  • 1篇中国科学院大...

作者

  • 40篇周若华
  • 15篇颜永红
  • 8篇万玉龙
  • 6篇王宪亮
  • 5篇袁庆升
  • 3篇杨琳
  • 3篇张健
  • 2篇包秀国
  • 2篇许云飞
  • 1篇梁春燕
  • 1篇索宏彬
  • 1篇杨海
  • 1篇杨金超
  • 1篇徐杰

传媒

  • 4篇清华大学学报...
  • 4篇网络新媒体技...
  • 2篇声学学报
  • 2篇中国科学院声...
  • 1篇自动化学报

年份

  • 3篇2022
  • 4篇2020
  • 4篇2019
  • 2篇2018
  • 3篇2017
  • 3篇2016
  • 6篇2015
  • 6篇2014
  • 8篇2013
  • 1篇2010
40 条 记 录,以下是 1-10
排序方式:
一种应用于语种识别的鉴别性特征提取方法
本发明涉及一种应用于语种识别的鉴别性特征提取方法,包括:在训练阶段为训练集中的语音数据的帧级的音素后验概率特征向量计算F比指标,所述F比指标反映了音素后验概率特征向量中每一维对语种鉴别性的贡献大小;在测试阶段为待测试的语...
袁庆升周若华云晓春张健陈训逊颜永红徐杰李锐光
文献传递
一种基于共有鉴别性子空间映射的语种识别方法及装置
本发明涉及一种基于共有鉴别性子空间映射的语种识别方法及装置,该方法包括:提取一个语种的多个语音数据的语音特征;根据所述语音特征得到所述多个语音数据的高斯超向量,其中,每个语音数据对应一组高斯超向量;将所述高斯超向量映射到...
周若华颜永红王宪亮刘建
文献传递
一种说话人识别方法
本发明涉及一种说话人识别方法,该方法首先生成说话人识别模型,把背景语音和目标说话人语音作为训练数据,训练出第一高斯混合-通用背景模型,总变化空间,第二高斯混合-通用背景模型,局部线性鉴别分析模型;利用第一高斯混合-通用背...
周若华许云飞颜永红杨琳
基于非负矩阵分解的钢琴多音符估计被引量:1
2014年
提出了一种基于能量谱包络非负矩阵分解的钢琴多音符估计算法。首先对钢琴88个单音片段进行RTFI时频分析,求得对应平均能量谱,经过时序平均、归一化求得平均能量谱包络,拼接成钢琴的单音能量谱包络基矩阵。之后对测试的多音片段,采用同样处理方法求得多音平均能量谱包络,通过非负矩阵分解求得各音符的权重系数,最后通过阈值限定求得多音符估计结果。性能评估实验基于MAPS数据集的UCHO集和RAND集展开,与MIREX中最好的钢琴音乐自动记谱系统相比,本文提出的钢琴多音符估计算法性能有很大幅度的提升。
万玉龙王宪亮周若华颜永红
关键词:钢琴音乐非负矩阵分解
一种基于降噪自动编码器的语种识别分类方法及装置
本发明提供一种基于降噪自动编码器的语种识别分类方法,其包括:步骤1)从待识别的语音片段中提取待识别的语音信号,获得底层声学特征;步骤2)从步骤1)获得的底层声学特征提取原始i‑vector;步骤3)计算并获得音素向量p<...
周若华苗晓晓颜永红
文献传递
高斯PLDA在说话人确认中的应用及其联合估计被引量:3
2014年
近年来,基于总变化因子的说话人识别方法成为说话人识别领域的主流方法.其中,概率线性鉴别分析(Probabilistic linear discriminant analysis,PLDA)因其优异的性能而得到学者们的广泛关注.然而,在估计PLDA模型时,传统的因子分析方法只更新模型空间,因此,模型均值不能很好地与更新后的模型空间耦合.提出联合估计法对模型均值和模型空间同时估计,得到更为严格的期望最大化更新公式,在美国国家标准与技术局说话人识别评测2010扩展测试数据库以及2012核心测试数据库上,等错率得到一定提升.
许云飞杨海周若华颜永红
关键词:期望最大化
一种基于条件生成式对抗网络的语种识别分类方法
本发明提供了一种基于条件生成式对抗网络的语种识别分类方法,该方法具体包括:步骤1)利用现有的DBF‑DNN语种识别系统,获得训练集的i‑vector和测试集的i‑vector;步骤2)建立并训练生成模型G和判别模型D,构...
周若华苗晓晓颜永红
文献传递
一种应用于语种识别的鉴别性特征提取方法
本发明涉及一种应用于语种识别的鉴别性特征提取方法,包括:在训练阶段为训练集中的语音数据的帧级的音素后验概率特征向量计算F比指标,所述F比指标反映了音素后验概率特征向量中每一维对语种鉴别性的贡献大小;在测试阶段为待测试的语...
袁庆升周若华云晓春张健陈训逊颜永红徐杰李锐光
文献传递
一种基于音视频信息的自动音乐记谱方法及系统
本发明涉及一种基于音视频信息的自动音乐记谱方法及系统,所述方法包含:采集钢琴演奏的视频和音频数据;依据采集的视频信息用视频跟踪算法获取手部在钢琴上的所有位置信息,根据所述手部位置信息确定演奏者所演奏的弹奏音符和各弹奏音符...
周若华颜永红万玉龙
文献传递
一种基于共有鉴别性子空间映射的语种识别方法及装置
本发明涉及一种基于共有鉴别性子空间映射的语种识别方法及装置,该方法包括:提取一个语种的多个语音数据的语音特征;根据所述语音特征得到所述多个语音数据的高斯超向量,其中,每个语音数据对应一组高斯超向量;将所述高斯超向量映射到...
周若华颜永红王宪亮刘建
文献传递
共4页<1234>
聚类工具0