国家自然科学基金(61133003)
- 作品数:15 被引量:88H指数:4
- 相关作者:姚鸿勋蒋宗礼赵思成孙晓帅许鹏飞更多>>
- 相关机构:哈尔滨工业大学北京工业大学哈尔滨商业大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于特征编码与池化的动作识别方法研究
- 随着移动通讯技术的发展,视频数据在互联网上正占有越来越大的比重,我们的生活娱乐也逐渐离不开各种视频应用。智能视频分析技术在智能监控、自动驾驶、鉴黄鉴恐等多个领域有重要的应用价值。动作识别任务作为视频分析领域的核心任务,对...
- 卢修生
- 关键词:计算机视觉
- 融合检索技术的译文推荐系统被引量:4
- 2017年
- 本文将基于单语语料的检索技术运用到机器翻译中,构建了一个汉英译文推荐系统,解决传统方法双语料库构建代价高昂的问题,同时提高最终译文的流畅性。译文推荐系统包括查询翻译和信息检索两部分:查询翻译根据给定的一组中文,生成N-best英文结果;信息检索评价目标语言与候选译文的相似程度。系统综合两部分得分返回推荐译文。考虑到N-best结果与候选译文的词序一致性,采用Levenshtein距离使得排序结果更加合理。在英汉数据集上的实验表明:在不同n阶语言模型下,译文推荐系统都有很好的表现,加入Levenshtein距离取得了最高70.83%的f测度值。
- 蒋宗礼王威
- 关键词:信息检索机器翻译推荐系统跨语言
- 后处理在数字抠像中的应用与解析被引量:4
- 2017年
- 数字抠像是将一幅图像中的前景物体与背景进行分离的问题,它的关键在于Alpha通道的计算.以往通过采样方法求得的Alpha中,由于采用逐点计算的离散化方式,求解出的Alpha通常不连续,并且包含很多噪声,因而需要对Alpha进行后处理,这不仅会增强Alpha在视觉上的平滑性,而且能够进一步提高Alpha的精确度.在目前国际上,有关数字抠像后处理领域已经进行了许多研究,但缺少相关的综述性文献,并且对后处理后的Alpha如何进行定量的评价也仍未系统解决.本文首先将数字抠像中的后处理方法分为2类:与仿射类方法相结合的方式及自平滑方式,其次,对两类方法进行了全面的总结和梳理,并对方法的优缺点进行了分析,对将来研究方向提出了建议,最后,针对后处理后的Alpha结果进行了全面的量化比较,弥补了传统方法基本上仅在视觉层面上进行比较的缺陷.
- 姚桂林刘绍辉李敏姚鸿勋胡文
- 关键词:图像分割后处理
- 基于四元数矩阵表示的彩色人脸图像LDA方法
- 2013年
- 为了缓解线性判别分析(linear discriminant analysis,LDA)方法在小样本情况下出现的矩阵奇异性问题,针对彩色人脸图像,利用其四元数矩阵表示模式,在人脸识别中引入基于四元数表示的二维LDA、双向LDA方法.这些方法充分利用了彩色图像的空间分布信息,通过在行、列方向降维提取图像的2DLDA、BDLDA特征,缓解了类内散度矩阵的奇异性问题.在FERET彩色人脸数据库及AR彩色人脸数据库上的大量实验证明,本文方法与基于四元数矩阵表示的2DPCA、BDPCA算法相比,识别性能均有提高.
- 胡永利家华杰孙艳丰
- 关键词:彩色人脸识别四元数矩阵线性判别分析奇异性
- 深度学习中的自编码器的表达能力研究被引量:35
- 2015年
- 近年来,深度学习框架和非监督学习方法越来越流行,吸引了很多机器学习和人工智能领域研究者的兴趣。从深度学习中的"构造模块"入手,主要研究自编码器的表达能力,尤其是自编码器在数据降维方面的能力及其表达能力的稳定性。从深度学习的基础方法入手,旨在更好地理解深度学习。第一,自编码器和限制玻尔兹曼机是深度学习方法中的两种"构造模块",它们都可用作表达转换的途径,也可看作相对较新的非线性降维方法。第二,重点探究了对于视觉特征的理解,自编码器是否是一个好的表达转换途径。主要评估了单层自编码器的表达能力,并与传统方法PCA进行比较。基于原始像素和局部描述子的实验验证了自编码器的降维作用、自编码器表达能力的稳定性以及提出的基于自编码器的转换策略的有效性。最后,讨论了下一步的研究方向。
- 王雅思姚鸿勋孙晓帅许鹏飞赵思成
- 关键词:数据降维
- 图像情感计算综述被引量:11
- 2017年
- 相对于底层视觉特征层,人们只能够感知和理解图像、视频的高层语义层,包括认知层和情感层。以往对图像内容分析的工作主要集中在理解图像的认知层,即描述图像的真实内容,如物体检测与识别。然而,公众对数字摄影技术的广泛使用及对图像情感表达的强烈需求,使得对图像最高语义层—情感层的分析变得越来越迫切。对图像情感层的分析,简称图像情感计算,主要目的是理解观察者看完图像后所引起的情感反应。本文首先介绍了情感的定义与描述,然后给出了图像情感计算的问题描述,最后总结了图像情感计算的研究现状。
- 赵思成姚鸿勋
- 关键词:图像情感情感计算
- 基于主题保持的视频紧凑表达研究
- 随着互联网的普及,人们之间的交流可以通过语音视频等更为直观和更具表现力的方式实现。未来随着5G技术的推进,网络、车载视频、安防和体育录像都将出现井喷式增长,这使得视频内容理解和处理工作面临着巨大挑战。 本文便是在这一研...
- 谢文龙
- 关键词:语义单位
- 基于仿射方法的图像抠图算法综述被引量:4
- 2016年
- 数字图像抠图是数字图像处理与编辑领域中的一类经典方法,而仿射方法则是图像抠图中与采样法相并列的一个重要分支,较采样类方法的主要特点和优势是计算速度快、对结果的平滑性能好.本文以闭合形式方法中的早期方法为起点,着重阐述了由它们扩展得到的2种重要闭合类方法各自的优点和缺点,包括经典的Matting Laplacian类方法,以及目前非常流行的Nonlocal类方法.实验结果表明,Nonlocal类在前景与背景重合度不高、边界并不复杂的时候效果较Matting Laplacian类方法要好.最后,本文对闭合形式所衍生出的路径类方法及附加类方法也给出了一些未来的发展建议和规划.
- 姚桂林姚鸿勋
- 关键词:计算机视觉图像处理图像分割图像抠图
- 面向图像超分辨率的上下文字典学习被引量:3
- 2014年
- 基于稀疏表示理论,提出了一种面向单张图片超分辨率的字典学习方法。通过对训练数据进行分类,期望在每一类训练数据训练字典的过程中,增强类内的上下文信息。与之前的面向图像分类的字典学习方法所不同的是,训练数据集由高分辨率图像块和对应的低分辨率图像块共同组成,这使训练得到的字典更适用于图像重构。利用有限的训练数据集,基于上下文的字典学习方法能够提高字典表示的拓展能力,消除由多重训练数据子集带来的冗余。
- 于伟姚鸿勋孙晓帅刘先明许鹏飞
- Potts网络的模块化Latching动力模型被引量:2
- 2013年
- Latching(锁连)是意大利国际高等研究生院的Alessandro Treves教授根据人类语言所独有的无穷递归能力假设构造出的自适应Potts动力学模型。Latching能够解释思维中的策略转移现象,对于探索人类智能的出现具有重要的意义。但是Latching动力学模型是建立在单个模块基础上的,无法与实验证据进行直接对话。利用具有时延的异联想突触连接将Latching动力扩展到模块化Latching链,并对其主要参数重绕概率、阈值系数、噪声模式对和反馈连接系数做了深入的仿真分析。研究的主要结果有:(1)一个适当的重绕概率能增强模块内模式之间的锁连活动。(2)在模块化网络中,LCL和ISR对反馈连接和噪声模式的大小都不敏感。(3)只有在阈值较高,网络中才会出现比较清晰的Latching转移。
- 宋三明姚鸿勋