您的位置: 专家智库 > >

高晓芳

作品数:7 被引量:3H指数:1
供职机构:北京理工大学更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 4篇专利
  • 2篇期刊文章
  • 1篇学位论文

领域

  • 2篇电子电信
  • 2篇自动化与计算...

主题

  • 6篇音频
  • 2篇多媒体音频
  • 2篇遗传算法
  • 2篇音乐检索
  • 2篇音频处理
  • 2篇音频检索
  • 2篇音色
  • 2篇相似度
  • 1篇样例
  • 1篇蚁群
  • 1篇蚁群算法
  • 1篇音频处理技术
  • 1篇音频流
  • 1篇音频特征
  • 1篇声学特征
  • 1篇声音
  • 1篇声音特点
  • 1篇识别方法
  • 1篇适应度
  • 1篇适应度函数

机构

  • 7篇北京理工大学

作者

  • 7篇高晓芳
  • 6篇罗森林
  • 6篇潘丽敏
  • 5篇吕英
  • 4篇谢尔曼
  • 2篇孔令志
  • 1篇马舒洁
  • 1篇罗志军

传媒

  • 2篇声学学报

年份

  • 1篇2017
  • 1篇2016
  • 3篇2015
  • 2篇2013
7 条 记 录,以下是 1-7
排序方式:
一种基于音色相似度的歌曲检索方法
本发明涉及一种基于音色相似度的歌曲检索方法,针对基于内容的音乐检索技术,综合利用歌曲背景音乐音色、歌唱者声音特点等特征,提出了一种基于MFCC和GMM的歌曲个性建模、计算和检索匹配的方法并加以实现,实验结果表明,该系统的...
罗森林谢尔曼潘丽敏孔令志吕英高晓芳
文献传递
一种高满意度视频摘要生成方法
本发明涉及一种高满意度视频摘要生成方法。本发明基于视频数据结构的特点,设计、实现了一种基于镜头聚类的视频摘要系统,该系统主要功能包括:多类型视频文件的编解码和播放,镜头边界检测,关键帧提取,镜头聚类,静态视频摘要,用户输...
罗森林谢尔曼潘丽敏马舒洁高晓芳吕英
文献传递
双哈希索引的高精度大规模音频样例检索被引量:1
2015年
实时音频流中对大规模音频样例进行检索时,在保证准确率的条件下,检索速度直接影响音频流实时处理能力。提出一种基于双哈希索引的大规模音频样例检索方法。该方法通过对大规模音频样例的音频特征进行自相似量化后,分别根据自相似序列的分段向量均值和模值建立线性双哈希索引,然后在音频流中进行搜索,最后对搜索结果利用音频的时序和空间信息进行判断得到检索结果。实验结果表明,本方法实现了大规模音频样例的一次检索,且当采用12维MFCC音频特征,音频样例时长为16 s、音频样例规模小于3100时,音频样例的检索准确率在90%以上,检索速度大于12000倍速,最高达到16000倍速。该方法在有效提高检索精度的基础上,保证较高的检索速度。
高晓芳罗森林吕英罗志军潘丽敏
关键词:音频流索引哈希音频特征
音频事件识别参数优化方法研究
随着音频事件识别研究的不断深入,算法架构日趋复杂,各个模块的关键参数逐渐增多,显著增加了系统整体参数寻优的难度和耗时。针对这一问题,分别提出单层次(模型训练层)的参数优化方法和三个层次(特征提取层、特征向量生成层、模型训...
高晓芳
关键词:参数优化遗传算法蚁群算法
文献传递
基于自适应遗传算法的多参数优化方法
本发明涉及一种基于自适应遗传算法的多参数优化方法。从应用场景的角度讲,属于音频事件识别技术领域;从技术实现的角度来讲,亦属于计算机科学与音频处理技术领域。首先,对数据进行预处理,提取音频训练样本的底层特征,生成特征向量,...
罗森林胡雅娴潘丽敏高晓芳
文献传递
一种基于音色相似度的歌曲检索方法
本发明涉及一种基于音色相似度的歌曲检索方法,针对基于内容的音乐检索技术,综合利用歌曲背景音乐音色、歌唱者声音特点等特征,提出了一种基于MFCC和GMM的歌曲个性建模、计算和检索匹配的方法并加以实现,实验结果表明,该系统的...
罗森林谢尔曼潘丽敏孔令志吕英高晓芳
采用2D-Haar声学特征超向量的快速特定音频识别方法被引量:2
2015年
针对特定音频事件识别技术在大数据音频处理任务中的准确性和快速性问题,提出一种基于2D-Haar声学特征超向量和AdaBoost算法的快速特定音频事件泛化识别方法。首先将多个连续音频帧的常用声学特征构成“声学特征图”,进而提取维数高达数十万的Haar-like声学特征,然后使用AdaBoost.MH或速度较快的Random AdaBoost特征筛选算法,筛选出较高代表性的Haar-like声学特征模式组合,从而构成2D-Haar声学特征超向量;最后分析特定音频事件子类间的共性和差异性,提取子类别的共性,弱化子类间的差异,训练后得到一个泛化的音频事件模板,可支持多子类的泛化识别,能够准确检测并定位音频流中的特定音频事件。实验结果表明,使用2D-Haar声学特征超向量可以获得比MFCC,PLP,LPCC等常用声学特征约5%的识别精度提升、7-20倍的训练速度提升和5-10倍的识别速度提升,在网格法寻得最优参数配置下,可获得93.38%的准确率,95.03%的查全率,这为大数据量的特定音频事件识别提供了一种准确快速的处理方法。
吕英罗森林高晓芳谢尔曼潘丽敏
关键词:声学特征音频处理识别方法ADABOOST算法RANDOM
共1页<1>
聚类工具0