您的位置: 专家智库 > >

吴晓曙

作品数:1 被引量:17H指数:1
供职机构:中国科学技术大学信息科学技术学院自动化系更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇强化学习方法
  • 1篇聚类
  • 1篇聚类算法
  • 1篇均值聚类
  • 1篇均值聚类算法
  • 1篇K-均值
  • 1篇K-均值聚类
  • 1篇K-均值聚类...

机构

  • 1篇中国科学技术...

作者

  • 1篇文锋
  • 1篇陈宗海
  • 1篇聂建斌
  • 1篇吴晓曙

传媒

  • 1篇计算机研究与...

年份

  • 1篇2006
1 条 记 录,以下是 1-1
排序方式:
基于节点生长k-均值聚类算法的强化学习方法被引量:17
2006年
处理连续状态强化学习问题,主要方法有两类:参数化的函数逼近和自适应离散划分.在分析了现有对连续状态空间进行自适应划分方法的优缺点的基础上,提出了一种基于节点生长k均值聚类算法的划分方法,分别给出了在离散动作和连续动作两种情况下该强化学习方法的算法步骤.在离散动作的MountainCar问题和连续动作的双积分问题上进行仿真实验.实验结果表明,该方法能够根据状态在连续空间的分布,自动调整划分的精度,实现对于连续状态空间的自适应划分,并学习到最佳策略.
陈宗海文锋聂建斌吴晓曙
关键词:K-均值聚类算法
共1页<1>
聚类工具0