您的位置: 专家智库 > >

刘洁

作品数:1 被引量:0H指数:0
供职机构:东北电力学院自动化工程学院更多>>
发文基金:国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇学习算法
  • 1篇模拟退火
  • 1篇Q-学习
  • 1篇Q-学习算法
  • 1篇METROP...

机构

  • 1篇东北电力学院
  • 1篇中国民用航空...

作者

  • 1篇贺振东
  • 1篇胡丹丹
  • 1篇高庆吉
  • 1篇刘洁

传媒

  • 1篇中国民航学院...

年份

  • 1篇2006
1 条 记 录,以下是 1-1
排序方式:
基于探索区域扩张策略的Q-学习算法
2006年
针对Q-学习算法中探索与利用之间的平衡问题,在基于Metropolis准则的Q-学习的基础上,提出了基于探索区域扩张策略的Q-学习改进算法,消除了初始时刻在整个环境中加入探索的盲目性,提高了学习效率。通过加入算法的自主学习结束条件,避免了找到最优路径后的重复学习,节省了学习时间。仿真实验证明了该算法的有效性。
胡丹丹贺振东刘洁高庆吉
关键词:Q-学习METROPOLIS准则模拟退火
共1页<1>
聚类工具0