2024年11月6日
星期三
|
欢迎来到贵州省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
吴晓曙
作品数:
1
被引量:17
H指数:1
供职机构:
中国科学技术大学信息科学技术学院自动化系
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
聂建斌
中国科学技术大学信息科学技术学...
陈宗海
中国科学技术大学信息科学技术学...
文锋
中国科学技术大学信息科学技术学...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
强化学习方法
1篇
聚类
1篇
聚类算法
1篇
均值聚类
1篇
均值聚类算法
1篇
K-均值
1篇
K-均值聚类
1篇
K-均值聚类...
机构
1篇
中国科学技术...
作者
1篇
文锋
1篇
陈宗海
1篇
聂建斌
1篇
吴晓曙
传媒
1篇
计算机研究与...
年份
1篇
2006
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于节点生长k-均值聚类算法的强化学习方法
被引量:17
2006年
处理连续状态强化学习问题,主要方法有两类:参数化的函数逼近和自适应离散划分.在分析了现有对连续状态空间进行自适应划分方法的优缺点的基础上,提出了一种基于节点生长k均值聚类算法的划分方法,分别给出了在离散动作和连续动作两种情况下该强化学习方法的算法步骤.在离散动作的MountainCar问题和连续动作的双积分问题上进行仿真实验.实验结果表明,该方法能够根据状态在连续空间的分布,自动调整划分的精度,实现对于连续状态空间的自适应划分,并学习到最佳策略.
陈宗海
文锋
聂建斌
吴晓曙
关键词:
K-均值聚类算法
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张