中国矿业大学青年科技基金(0C060093)
- 作品数:2 被引量:8H指数:2
- 相关作者:孙伟程玉虎王雪松易建强更多>>
- 相关机构:中国矿业大学中国科学院自动化研究所更多>>
- 发文基金:中国矿业大学青年科技基金中国博士后科学基金江苏省博士后科研资助计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于自组织模糊RBF网络的连续空间Q学习被引量:4
- 2008年
- 针对连续空间下的强化学习控制问题,提出了一种基于自组织模糊RBF网络的Q学习方法.网络的输入为状态,输出为连续动作及其Q值,从而实现了"连续状态—连续动作"的映射关系.首先将连续动作空间离散化为确定数目的离散动作,采用完全贪婪策略选取具有最大Q值的离散动作作为每条模糊规则的局部获胜动作.然后采用命令融合机制对获胜的离散动作按其效用值进行加权,得到实际作用于系统的连续动作.另外,为简化网络结构和提高学习速度,采用改进的RAN算法和梯度下降法分别对网络的结构和参数进行在线自适应调整.倒立摆平衡控制的仿真结果验证了所提Q学习方法的有效性.
- 程玉虎王雪松易建强孙伟
- 关键词:自组织Q学习Q值
- 自适应T-S型模糊径向基函数网络被引量:4
- 2007年
- 针对T-S型模糊推理系统的模型参数辨识问题,充分利用模糊推理系统的可理解性与神经网络的学习能力,提出一种自适应T-S型模糊径向基函数网络。为设计满足精度要求的最小结构神经网络,在对网络学习动态进行分析的基础上,给出了网络拓扑结构的动态构造学习算法。在不需要任何先验知识的情况下,能够根据任务复杂度和学习进度进行网络隐层节点的自适应增加、合并和删除操作。将该网络应用于非线性函数逼近问题,取得较好的效果。
- 程玉虎王雪松孙伟
- 关键词:径向基函数网络