吕英
- 作品数:8 被引量:3H指数:1
- 供职机构:北京理工大学更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 一种基于音色相似度的歌曲检索方法
- 本发明涉及一种基于音色相似度的歌曲检索方法,针对基于内容的音乐检索技术,综合利用歌曲背景音乐音色、歌唱者声音特点等特征,提出了一种基于MFCC和GMM的歌曲个性建模、计算和检索匹配的方法并加以实现,实验结果表明,该系统的...
- 罗森林谢尔曼潘丽敏孔令志吕英高晓芳
- 文献传递
- 一种高满意度视频摘要生成方法
- 本发明涉及一种高满意度视频摘要生成方法。本发明基于视频数据结构的特点,设计、实现了一种基于镜头聚类的视频摘要系统,该系统主要功能包括:多类型视频文件的编解码和播放,镜头边界检测,关键帧提取,镜头聚类,静态视频摘要,用户输...
- 罗森林谢尔曼潘丽敏马舒洁高晓芳吕英
- 文献传递
- 一种自匹配Top‑N音频事件识别信道自适应方法
- 本发明涉及一种自匹配Top‑N音频事件识别信道自适应方法,从应用场景的角度讲,属于音频事件识别技术领域;从技术实现的角度来讲,亦属于计算机科学与音频处理技术领域。本发明首先进行数据预处理,预处理过程包括量化、采样、预加重...
- 罗森林佟彤潘丽敏吕英
- 采用2D-Haar声学特征超向量的快速特定音频识别方法被引量:2
- 2015年
- 针对特定音频事件识别技术在大数据音频处理任务中的准确性和快速性问题,提出一种基于2D-Haar声学特征超向量和AdaBoost算法的快速特定音频事件泛化识别方法。首先将多个连续音频帧的常用声学特征构成“声学特征图”,进而提取维数高达数十万的Haar-like声学特征,然后使用AdaBoost.MH或速度较快的Random AdaBoost特征筛选算法,筛选出较高代表性的Haar-like声学特征模式组合,从而构成2D-Haar声学特征超向量;最后分析特定音频事件子类间的共性和差异性,提取子类别的共性,弱化子类间的差异,训练后得到一个泛化的音频事件模板,可支持多子类的泛化识别,能够准确检测并定位音频流中的特定音频事件。实验结果表明,使用2D-Haar声学特征超向量可以获得比MFCC,PLP,LPCC等常用声学特征约5%的识别精度提升、7-20倍的训练速度提升和5-10倍的识别速度提升,在网格法寻得最优参数配置下,可获得93.38%的准确率,95.03%的查全率,这为大数据量的特定音频事件识别提供了一种准确快速的处理方法。
- 吕英罗森林高晓芳谢尔曼潘丽敏
- 关键词:声学特征音频处理识别方法ADABOOST算法RANDOM
- 双哈希索引的高精度大规模音频样例检索被引量:1
- 2015年
- 实时音频流中对大规模音频样例进行检索时,在保证准确率的条件下,检索速度直接影响音频流实时处理能力。提出一种基于双哈希索引的大规模音频样例检索方法。该方法通过对大规模音频样例的音频特征进行自相似量化后,分别根据自相似序列的分段向量均值和模值建立线性双哈希索引,然后在音频流中进行搜索,最后对搜索结果利用音频的时序和空间信息进行判断得到检索结果。实验结果表明,本方法实现了大规模音频样例的一次检索,且当采用12维MFCC音频特征,音频样例时长为16 s、音频样例规模小于3100时,音频样例的检索准确率在90%以上,检索速度大于12000倍速,最高达到16000倍速。该方法在有效提高检索精度的基础上,保证较高的检索速度。
- 高晓芳罗森林吕英罗志军潘丽敏
- 关键词:音频流索引哈希音频特征
- 一种音频事件模型合成信道自适应方法
- 本发明涉及一种音频事件模型合成信道自适应方法,属于计算机与信息科学技术领域。本发明首先对待识别音频进行预处理和特征提取,包括对音频的量化采样、预加重和加窗,并对音频的底层特征参数进行提取和特征帧序列切分,得到音频特征段向...
- 罗森林刘晓双潘丽敏吕英
- 文献传递
- 音频事件识别信道自适应方法研究
- 对于互联网传输环境下的音频事件识别而言,采集设备、录制环境、编码方式的差异都会产生信道失配,本文集中研究如何消解编码差异引入的信道失配,提出特征域和模型域的音频事件识别信道自适应方法。针对音频编码差异引入的非线性失配问题...
- 吕英
- 关键词:信道自适应特征映射
- 文献传递
- 一种基于音色相似度的歌曲检索方法
- 本发明涉及一种基于音色相似度的歌曲检索方法,针对基于内容的音乐检索技术,综合利用歌曲背景音乐音色、歌唱者声音特点等特征,提出了一种基于MFCC和GMM的歌曲个性建模、计算和检索匹配的方法并加以实现,实验结果表明,该系统的...
- 罗森林谢尔曼潘丽敏孔令志吕英高晓芳