2025年1月29日
星期三
|
欢迎来到贵州省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
贺振东
作品数:
2
被引量:0
H指数:0
供职机构:
东北电力大学
更多>>
发文基金:
国家高技术研究发展计划
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
刘洁
东北电力学院自动化工程学院
高庆吉
中国民用航空学院
胡丹丹
中国民用航空学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
学位论文
领域
2篇
自动化与计算...
主题
2篇
模拟退火
2篇
Q-学习
1篇
学习算法
1篇
移动机器人
1篇
神经网
1篇
神经网络
1篇
机器人
1篇
Q-学习算法
1篇
Q学习
1篇
METROP...
机构
1篇
东北电力大学
1篇
东北电力学院
1篇
中国民用航空...
作者
2篇
贺振东
1篇
胡丹丹
1篇
高庆吉
1篇
刘洁
传媒
1篇
中国民航学院...
年份
2篇
2006
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于改进Q-学习的导航知识获取算法研究
本文在分析了移动机器人导航控制的基础上,根据反应式导航与强化学习模型的相似性,将强化学习应用到智能导航上,重点研究了基于Q-学习的导航知识获取算法。 研究了强化学习的时间差分算法、自适应启发评价算法、Q-学习算法等主...
贺振东
关键词:
Q学习
模拟退火
神经网络
移动机器人
文献传递
基于探索区域扩张策略的Q-学习算法
2006年
针对Q-学习算法中探索与利用之间的平衡问题,在基于Metropolis准则的Q-学习的基础上,提出了基于探索区域扩张策略的Q-学习改进算法,消除了初始时刻在整个环境中加入探索的盲目性,提高了学习效率。通过加入算法的自主学习结束条件,避免了找到最优路径后的重复学习,节省了学习时间。仿真实验证明了该算法的有效性。
胡丹丹
贺振东
刘洁
高庆吉
关键词:
Q-学习
METROPOLIS准则
模拟退火
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张