汪凌峰 作品数:12 被引量:83 H指数:4 供职机构: 中国科学院自动化研究所 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 江苏省自然科学基金 更多>> 相关领域: 自动化与计算机技术 天文地球 更多>>
多尺度输入3D卷积融合双流模型的行为识别方法 被引量:10 2018年 基于视频的行为识别技术在计算机视觉领域有广泛的应用.针对当前存在的网络模型不能有效结合视频数据中的时空信息,并且缺乏对不同尺度数据之间的融合信息进行考虑等问题,提出一种结合双流网络以及3D卷积神经网络的多尺度输入3D卷积融合双流模型.首先利用2D残差网以及多尺度输入3D卷积融合网络获取视频中的时空维度信息;然后将2层网络得到的实验结果进行决策相加,有效地提升网络对视频中时空特征提取的能力;最后通过在多尺度输入3D卷积融合网络对不同尺度的数据进行不同策略的融合,提高了网络对不同尺度数据的泛化能力.实验结果表明,文中模型在数据集UCF-101以及HMDB-51的识别准确率分别为90.5%与66.3%;相比于其他方法,该模型能取得更高的识别精度,体现出文中方法的优越性与鲁棒性. 宋立飞 翁理国 汪凌峰 夏旻关键词:信息融合 基于结构激光线的文档图像畸变矫正方法 本发明公开了一种基于结构激光线的文档图像畸变矫正方法,该方法至少包括:对相机内、外参数进行标定,并计算结构激光线所在的平面方程;获取文档图像;提取激光线;根据标定的相机内、外参数、所述结构激光线所在的平面方程以及所述提取... 孟高峰 潘春洪 向世明 王颖 汪凌峰文献传递 分类错误指导的分层B-CNN模型用于细粒度分类 2017年 目的细粒度分类近年来受到了越来越多研究者的广泛关注,其难点是分类目标间的差异非常小。为此提出一种分类错误指导的分层双线性卷积神经网络模型。方法该模型的核心思想是将双线性卷积神经网络算法(B-CNN)容易分错、混淆的类再分别进行重新训练和分类。首先,为得到易错类,提出分类错误指导的聚类算法。该算法基于受限拉普拉斯秩(CLR)聚类模型,其核心"关联矩阵"由"分类错误矩阵"构造。其次,以聚类结果为基础,构建了新的分层B-CNN模型。结果用分类错误指导的分层B-CNN模型在CUB-200-2011、FGVC-Aircraft-2013b和Stanford-cars 3个标准数据集上进行了实验,相比于单层的B-CNN模型,分类准确率分别由84.35%,83.56%,89.45%提高到了84.67%,84.11%,89.78%,验证了本文算法的有效性。结论本文提出了用分类错误矩阵指导聚类从而进行重分类的方法,相对于基于特征相似度而构造的关联矩阵,分类错误矩阵直接针对分类问题,可以有效提高易混淆类的分类准确率。本文方法针对比较相近的目标,尤其是有非常相近的目标的情况,通过将容易分错、混淆的目标分组并进行再训练和重分类,使得分类效果更好,适用于细粒度分类问题。 沈海鸿 杨兴 汪凌峰 潘春洪基于多核融合的视频中目标跟踪方法 本发明提供一种基于多核融合的视频中目标跟踪方法,在视频初始帧,通过手工标注目标的初始状态,生成粒子的初始状态以及权重,通过正负样本训练基于多核融合后的核的SVM,在随后帧,利用粒子滤波跟踪目标;其中,每个粒子的观测由分类... 汪凌峰 潘春洪文献传递 高速公路动态环境下的摄像机自标定 被引量:7 2013年 提出一种动态环境下高速公路监控系统摄像机的自标定方法.首先利用混合高斯背景建模方法从动态视频图像中获取背景图像和目标频繁出现的目标区域;然后利用不同的直线检测算法检测和估计出目标区域内高速公路上大量存在的各种标志线和虚标志线以及水平线,基于这些线状特征计算出摄像机的灭点;最后根据灭点和线特征之间的几何关系计算出摄像机的内外参数,从而实现摄像机自标定.真实场景的实验结果表明,该算法非常合适于各种高速公路监控系统中摄像机的实时自标定,且精度高、稳定性好. 严红平 汪凌峰 潘春洪关键词:摄像机标定 高速公路监控 灭点 基于结构激光线的文档图像畸变矫正方法 本发明公开了一种基于结构激光线的文档图像畸变矫正方法,该方法至少包括:对相机内、外参数进行标定,并计算结构激光线所在的平面方程;获取文档图像;提取激光线;根据标定的相机内、外参数、所述结构激光线所在的平面方程以及所述提取... 孟高峰 潘春洪 向世明 王颖 汪凌峰基于自编码网络特征优化的城市高分遥感影像分类 被引量:1 2019年 高分遥感影像不仅地物比较清晰,而且可分辨能力强,能提供丰富的地物细节信息.为了更好地将各地物从遥感影像中提取出来,需要一些比较好的特征提取与特征优化方法.以北京市大兴区的WorldView-2高分遥感影像作为研究对象,基于eCognition软件和Matlab的DeepLearn Toolbox,利用自编码网络方法,进行遥感影像的特征提取与特征优化.实验中首先利用eCognition进行多尺度分割并提取42个特征,再利用自编码网络算法进行特征优化得到12个特征,最后将原42个特征影像分类结果与优化后特征子集影像分类结果进行对比.实验结果表明,经过自编码网络的特征空间优化后,减少了特征冗余,降低了干扰信息对分类精度的影响,分类精度、分类效果及分类效率都有所提高,优化后的特征空间是适用于高分遥感的地物分类的. 张丹璐 吕京国 成喆 曹逸飞 汪凌峰关键词:高分辨率遥感 影像分类 特征提取 一种分步的融合时空信息的背景建模 被引量:4 2014年 自然场景中的光照突变和树枝、水面等不规则运动是背景建模的主要困难.针对该问题,提出一种分步的融合时域信息和空域信息的背景建模方法.在时域,采用具有光照不变性的颜色空间表征时域信息,并提出对噪声和光照突变具有较好适应性的码字聚类准则和自适应背景更新策略,构造了对噪声和光照突变具有较好适应性的时域信息背景模型.在空域,通过采样将测试序列图像分成两幅子图,而后利用时域模型检测其中一幅子图,并将检测结果作为另一幅子图的先验信息,同时采用马尔科夫随机场(Markov random field,MRF)对其加以约束,最终检测其状态.在多个测试视频序列上的实验结果表明,本文背景模型对于自然场景中的光照突变和不规则运动具有较好的适应性. 储珺 杨樊 张桂梅 汪凌峰关键词:马尔科夫随机场 码本 基于多核融合的视频中目标跟踪方法 本发明提供一种基于多核融合的视频中目标跟踪方法,在视频初始帧,通过手工标注目标的初始状态,生成粒子的初始状态以及权重,通过正负样本训练基于多核融合后的核的SVM,在随后帧,利用粒子滤波跟踪目标;其中,每个粒子的观测由分类... 汪凌峰 潘春洪文献传递 基于鉴别性与稳定性的自适应融合目标跟踪 被引量:2 2013年 提出了一种基于鉴别性与稳定性的自适应融合目标跟踪算法。在跟踪中,鉴别性度量目标与背景的区分程度,稳定性衡量跟踪框中心与目标实际中心之间的偏移程度。首先,对鉴别性与稳定性分开考虑,分别建模;而后将其引入自适应融合框架中,由此得到目标函数;最后优化目标函数得到自适应融合的权重。不同视频上的对比实验验证了该算法具有更高的跟踪准确性及稳定性。 严红平 吕珂 汪凌峰 潘春洪关键词:自适应融合 目标跟踪 稳定性