吴恙
- 作品数:4 被引量:4H指数:1
- 供职机构:中山大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 视觉生成模型的理论优化及细粒度可控技术的探究
- 本文旨在从理论以及应用两个层面研究视觉生成模型,并展示与归纳研究所得成果。研究的目标主要系针对多种不同类型的生成模型,达成高效有效,可控可动的视觉类数据生成。文章的结构按循序渐进的叙述模式主要分为四个板块:首先以各类常用...
- 吴恙
- 关键词:图像生成
- 一种用于具现化场景问答任务的动作决策模型及方法
- 本发明公开了一种用于具现化场景问答任务的动作决策模型及方法,所述模型包括:预训练特征提取模组单元,用于对当前时间节点下的多模态输入特征分别进行提取;特征融合单元,用于将由多模态中提取出来的各个特征进行融合形成融合特征;融...
- 冯诗睿吴恙李冠彬林倞
- 一种用于具现化场景问答任务的动作决策模型及方法
- 本发明公开了一种用于具现化场景问答任务的动作决策模型及方法,所述模型包括:预训练特征提取模组单元,用于对当前时间节点下的多模态输入特征分别进行提取;特征融合单元,用于将由多模态中提取出来的各个特征进行融合形成融合特征;融...
- 冯诗睿吴恙李冠彬林倞肖侬
- 文献传递
- 融合语义知识的深度表达学习及在视觉理解中的应用被引量:4
- 2017年
- 近几年来,随着深度学习技术的日趋完善,传统的计算机视觉任务得到了前所未有的发展.如何将传统视觉研究中的领域知识融入到深度模型中提升深度模型的视觉表达能力,从而应对更为复杂的视觉任务,成为了学术界广泛关注的问题.鉴于此,以融合了语义知识的深度表达学习为主线展开了一系列研究.取得的主要创新成果包括3个方面:1)研究了将单类型的语义信息(类别相似性)融入到深度特征的学习中,提出了嵌入正则化语义关联的深度Hash学习方法,并将其应用于图像的相似性比对与检索问题中,取得了较大的性能提升;2)研究了将多类型信息(多重上下文信息)融入到深度特征的学习中,提出了基于长短期记忆神经网络的场景上下文学习方法,并将其应用于复杂场景的几何属性分析问题中;3)研究了将视觉数据的结构化语义配置融入到深度表达的学习中,提出了融合语法知识的表达学习方法,并将其应用到复杂场景下的通用内容解析问题中.相关的实验结果表明:该方法能有效地对场景的结构化配置进行预测.
- 张瑞茂彭杰锋吴恙林倞
- 关键词:神经网络