您的位置: 专家智库 > >

李坤

作品数:2 被引量:0H指数:0
供职机构:天津科技大学更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇专利

领域

  • 1篇自动化与计算...

主题

  • 1篇胆碱
  • 1篇乙酰
  • 1篇乙酰胆碱
  • 1篇支气管
  • 1篇支气管收缩
  • 1篇支气管哮喘
  • 1篇治疗支气管哮...
  • 1篇梯度估计
  • 1篇梯度算法
  • 1篇提取物
  • 1篇平喘
  • 1篇祛痰
  • 1篇向量
  • 1篇哮喘
  • 1篇金丝桃
  • 1篇金丝桃提取物
  • 1篇基线

机构

  • 2篇天津科技大学

作者

  • 2篇李坤
  • 1篇马宁
  • 1篇张同存
  • 1篇李秀梅
  • 1篇陈亚瑞
  • 1篇罗学刚
  • 1篇杨巨成
  • 1篇赵婷婷
  • 1篇王楠
  • 1篇廖兴华

传媒

  • 1篇天津科技大学...

年份

  • 1篇2023
  • 1篇2013
2 条 记 录,以下是 1-2
排序方式:
基于最优向量基线的参数探索策略梯度算法
2023年
策略梯度算法是深度强化学习领域中广泛使用的一类无模型强化学习方法,在实际应用中取得了突破性进展。策略梯度算法一直受到梯度估计方差大的困扰,基于参数探索的策略梯度算法(policy gradients with parameterbased exploration,PGPE)从根本上缓解了该问题。通过最优基线技术的引入,策略梯度估计的方差进一步减小。然而,现有最优基线技术只使用标量值作为基线,忽略了策略梯度各维度之间的差异。针对此问题,本文提出一种向量基线概念并推导PGPE算法的最优向量基线表示,在理论上证明了引入最优向量基线的PGPE算法可以得到更小的梯度估计方差,并且实验验证了此算法的有效性。
赵婷婷李坤刘展硕陈亚瑞王嫄杨巨成
关键词:梯度估计
乌腺金丝桃提取物在治疗支气管哮喘的药物中的应用
本发明涉及了一种乌腺金丝桃提取物在治疗支气管哮喘的药物中的应用,本发明通过动物实验说明:乌腺金丝桃提取物对磷酸组织胺和乙酰胆碱混和液喷雾致喘的小鼠具有明显的平喘作用,并且,对乙酰胆碱所引起的支气管收缩具有对抗作用;乌腺金...
张同存李秀梅罗学刚王楠李坤马宁廖兴华
文献传递
共1页<1>
聚类工具0