公共文化服务平台

2025年2月13日星期四

|

欢迎来到贵州省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

董飞: 作品数：2 被引量：0H指数：0; 供职机构：南开大学更多>>; 相关领域：文化科学更多>>

合作作者

南稼人西南交通大学
陈丹青武汉大学新闻与传播学院
张晓宇南开大学
马洪峰武汉大学城市设计学院建筑学系
谢瑞峰武汉大学信息管理学院

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

1篇中文专利

主题

1篇学习算法
1篇制导
1篇制导方法
1篇强化学习算法
1篇最大熵
1篇向量
1篇向量组
1篇决策过程

机构

1篇南开大学

作者

1篇董飞
1篇张晓宇

年份

1篇2024

共 2 条记录，以下是 1-1

全选清除导出

排序方式：

基于最大熵强化学习算法的模型训练方法及规划制导方法: 本发明提供一种基于最大熵强化学习算法的模型训练方法及规划制导方法，包括：构建动作评论模型，动作评论模型包括行动网络模块和评论网络模块；动作评论模型根据状态向量得到决策过程向量组，状态向量为从预设环境中得到的；根据决策过程...; 张晓宇王晨飞刘烨坤董飞

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有©2014－2015 Chongqing VIP Information., Ltd., 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张