您的位置: 专家智库 > >

沈栋

作品数:1 被引量:20H指数:1
供职机构:中国科学院自动化研究所更多>>
发文基金:教育部“新世纪优秀人才支持计划”霍英东青年教师基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇动态系统
  • 1篇自适应控制
  • 1篇近似动态规划
  • 1篇MARKOV...

机构

  • 1篇国防科学技术...
  • 1篇中国科学院自...
  • 1篇亚利桑那大学

作者

  • 1篇徐昕
  • 1篇沈栋
  • 1篇王凯

传媒

  • 1篇自动化学报

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
基于马氏决策过程模型的动态系统学习控制:研究前沿与展望被引量:20
2012年
基于马氏决策过程(Markov decision process,MDP)的动态系统学习控制是近年来一个涉及机器学习、控制理论和运筹学等多个学科的交叉研究方向,其主要目标是实现系统在模型复杂或者不确定等条件下基于数据驱动的多阶段优化控制.本文对基于MDP的动态系统学习控制理论、算法与应用的发展前沿进行综述,重点讨论增强学习(Reinforcement learning,RL)与近似动态规划(Approximate dynamic programming,ADP)理论与方法的研究进展,其中包括时域差值学习理论、求解连续状态与行为空间MDP的值函数逼近方法、直接策略搜索与近似策略迭代、自适应评价设计算法等,最后对相关研究领域的应用及发展趋势进行分析和探讨。
徐昕沈栋高岩青王凯
关键词:MARKOV决策过程近似动态规划自适应控制
共1页<1>
聚类工具0