您的位置: 专家智库 > >

武器装备预研基金(413040502)

作品数:1 被引量:8H指数:1
相关作者:吴慧中朱耀琴陈圣磊肖亮更多>>
相关机构:南京理工大学更多>>
发文基金:武器装备预研基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇多步
  • 1篇性能仿真
  • 1篇学习算法
  • 1篇模拟退火
  • 1篇Q学习
  • 1篇Q学习算法
  • 1篇METROP...

机构

  • 1篇南京理工大学

作者

  • 1篇肖亮
  • 1篇陈圣磊
  • 1篇朱耀琴
  • 1篇吴慧中

传媒

  • 1篇系统仿真学报

年份

  • 1篇2007
1 条 记 录,以下是 1-1
排序方式:
基于Metropolis准则的多步Q学习算法与性能仿真被引量:8
2007年
强化学习是目前智能体和机器学习研究的热点。针对强化学习中标准Q学习算法更新速度慢的缺点,通过引入多步信息更新策略和模拟退火中的Metropolis准则,提出了一种新颖的多步Q学习算法,称为SAMQ算法。仿真实验表明,与现有的算法相比,该算法能够有效提高收敛速度,较好地解决智能体选择动作时面临的新知识探索还是当前策略遵循的关键问题。
陈圣磊吴慧中肖亮朱耀琴
关键词:Q学习模拟退火METROPOLIS准则
共1页<1>
聚类工具0