您的位置: 专家智库 > >

广东省科技计划工业攻关项目(2009A040300008)

作品数:2 被引量:9H指数:2
相关作者:闵华清朱金辉张梅梁颖驹梁明杰更多>>
相关机构:华南理工大学更多>>
发文基金:广东省科技计划工业攻关项目国家自然科学基金中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇值函数
  • 1篇树算法
  • 1篇随机采样
  • 1篇自适
  • 1篇自适应
  • 1篇自适应加权
  • 1篇自适应权重
  • 1篇加权
  • 1篇函数
  • 1篇采样

机构

  • 2篇华南理工大学

作者

  • 2篇朱金辉
  • 2篇闵华清
  • 1篇梁明杰
  • 1篇梁颖驹
  • 1篇曾嘉安
  • 1篇张梅
  • 1篇罗荣华

传媒

  • 1篇计算机工程
  • 1篇控制理论与应...

年份

  • 1篇2011
  • 1篇2010
2 条 记 录,以下是 1-2
排序方式:
一种状态自动划分的模糊小脑模型关节控制器值函数拟合方法被引量:3
2011年
在庞大离散状态空间或连续状态空间中,强化学习(RL)需要进行值函数拟合以寻找最优策略.但函数拟合器的结构往往由设计者预先设定,在学习过程中不能动态调整缺乏自适应性.为了自动构建函数拟合器的结构,提出一种可以进行状态自动划分的模糊小脑模型关节控制(FCMAC)值函数拟合方法.该方法利用Bellman误差的变化趋势实现状态自动划分,并且探讨了两种选择划分区域的机制.汽车爬坡问题和机器人足球仿真平台中的实验结果表明新算法能有效拟合值函数,而且利用所提出的函数拟合器智能体可以进行有效的强化学习.
闵华清曾嘉安罗荣华朱金辉
关键词:值函数
一种自适应加权快速探索随机树算法被引量:6
2010年
针对快速探索随机树算法在局部极小区域做大量失败探索的问题,提出一种自适应加权快速探索随机树算法。分析影响快速探索随机树生长的关键因素,提出在树探索的动态过程中应充分利用探索过程的反馈信息,为树节点赋予自适应权重。根据树节点的自适应权重大小,选择树的生长点。仿真结果表明,该方法能有效地提高树探索效率,缩短规划路径长度。
朱金辉梁明杰梁颖驹闵华清张梅
关键词:随机采样自适应权重
共1页<1>
聚类工具0