任德华
- 作品数:26 被引量:48H指数:3
- 供职机构:天津科技大学更多>>
- 发文基金:国家自然科学基金天津市自然科学基金河北省社会科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理金属学及工艺更多>>
- 一种严重退化车牌图像信息恢复方法
- 本发明涉及一种严重退化车牌图像信息恢复方法,该方法使用卷积神经网络学习严重退化车牌信息提取所需的先验知识,采用仿真车牌图像与真实车牌图像进行卷积神经网络的训练与微调,并且采用SoftMax输出形式获得每个车牌字符位置处的...
- 任德华赵婷婷柳映辉陈亚瑞吴超赵凤
- 车联网环境下基于长短期记忆神经网络的边缘计算卸载决策
- 现有的边缘计算卸载研究重点在于如何缩短执行延迟和能耗,而在车联网环境中的高速动态的特殊性,则需要单独考虑。在高速流动的车流情况下,会随着时间产生大量数据,其较早的信息会影响对现在的决策产生影响导致现在的决策不符合当前情况...
- 赵婷婷陈晗頔王嫄杨巨成陈亚瑞任德华
- 基于韦伯多方向描述子的人脸表情识别特征提取算法
- 本发明涉及一种基于韦伯多方向描述子的人脸表情识别特征提取算法,其主要技术特点是:将人脸表情图像进行Gabor小波变换,并将同一尺度各方向的Gabor特征进行融合;将Gabor特征图像分为不重叠的子块,并分别在水平、垂直、...
- 杨巨成李梦于洋代翔子毛磊任德华吴超刘建征张传雷陈亚瑞赵婷婷
- 基于生成模型的隐空间模型化策略搜索学习方法
- 本发明涉及一种基于生成模型的隐空间模型化策略搜索学习方法,收集环境的真实状态转移样本数据;构造变分自编码器网络模型;训练变分自编码器网络模型直至收敛;在隐空间构建条件生成对抗网络模型;训练条件生成对抗网络模型直至收敛,得...
- 赵婷婷孔乐杨巨成陈亚瑞任德华王嫄彭喆
- 文献传递
- 一种面向大规模环境中复杂任务的深度策略学习方法
- 本发明涉及一种面向大规模环境中复杂任务的深度策略学习方法,通过深度神经网络描述智能体感知的状态变量,构建具有深度递归型结构的策略模型,利用策略搜索学习算法寻找最优参数,对神经网络进行训练,直到收敛为止。本发明在大规模环境...
- 赵婷婷杨巨成赵希任德华陈亚瑞房珊珊
- 模型化强化学习研究综述被引量:14
- 2020年
- 深度强化学习(DRL)作为机器学习的重要分支,在AlphaGo击败人类后受到了广泛关注。DRL以一种试错机制与环境进行交互,并通过最大化累积奖赏最终得到最优策略。强化学习可分为无模型强化学习和模型化强化学习。无模型强化学习方法的训练过程需要大量样本,当采样预算不足,无法收集大量样本时,很难达到预期效果。然而,模型化强化学习可以充分利用环境模型,降低真实样本需求量,在一定程度上提高样本效率。将以模型化强化学习为核心,介绍该领域的研究现状,分析其经典算法,并探讨未来的发展趋势和应用前景。
- 赵婷婷孔乐韩雅杰任德华陈亚瑞
- 一种基于生成对抗网络的红外人脸图像超分辨率重建方法
- 本发明涉及一种基于生成对抗网络的红外人脸图像超分辨率重建方法,包括以下步骤:构建红外人脸数据库;对人脸数据库中的图像按眼睛相对位置进行对齐;将对齐后的每幅图按不同的比例S进行缩放,生成其一一对应的不同缩放比例的低分辨率的...
- 任德华吴超柳映辉
- 文献传递
- 一种强化学习中受意愿控制的策略学习方法
- 本发明涉及一种强化学习中受意愿控制的策略学习方法,其主要技术特点是:在原始的累计期望回报基础上,加入意愿变量与动作的互信息正则约束,使得累积期望回报最大的同时,隐变量与产生动作之间的互信息最大化,在求解最优解的过程中,使...
- 赵婷婷孔乐任德华吴超胡志强
- 文献传递
- 一种场桥轨道异物监控系统
- 本发明公开了一种场桥轨道异物监控系统,包括:工业计算机、高清网络摄像头、视频监控及管理软件、异物及危险事件自动检测软件,以及辅助报警和控制装置。该系统通过场桥四角的高清数字摄像头进行数据采集,为驾驶员提供实时显示输出,同...
- 任德华柳映辉赵婷婷陈亚瑞吴超燕聪
- 一种基于元强化学习的文本生成方法
- 本发明涉及一种基于元强化学习的文本生成方法,其技术特点是:收集不同类型的文本数据作为不同任务的划分;收集文本数据中随机采取某一任务的数据;采用处理序列数据的递归型神经网络构造文本生成模型;生成K条文本轨迹;利用文本生成轨...
- 赵婷婷宋亚静王嫄任德华杨巨成