2025年2月13日
星期四
|
欢迎来到贵州省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
董飞
作品数:
2
被引量:0
H指数:0
供职机构:
南开大学
更多>>
相关领域:
文化科学
更多>>
合作作者
南稼人
西南交通大学
陈丹青
武汉大学新闻与传播学院
张晓宇
南开大学
马洪峰
武汉大学城市设计学院建筑学系
谢瑞峰
武汉大学信息管理学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文专利
主题
1篇
学习算法
1篇
制导
1篇
制导方法
1篇
强化学习算法
1篇
最大熵
1篇
向量
1篇
向量组
1篇
决策过程
机构
1篇
南开大学
作者
1篇
董飞
1篇
张晓宇
年份
1篇
2024
共
2
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于最大熵强化学习算法的模型训练方法及规划制导方法
本发明提供一种基于最大熵强化学习算法的模型训练方法及规划制导方法,包括:构建动作评论模型,动作评论模型包括行动网络模块和评论网络模块;动作评论模型根据状态向量得到决策过程向量组,状态向量为从预设环境中得到的;根据决策过程...
张晓宇
王晨飞
刘烨坤
董飞
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张