公共文化服务平台

共 9 条记录，以下是 1-9

全选清除导出

排序方式：

一种列车的隧道附加空气阻力迭代学习辨识方法: 本发明公开一种列车的隧道附加空气阻力迭代学习辨识方法，包括如下步骤：S1、对系统进行初始化：确定列车第1次运行的隧道附加空气阻力辨识值<Image file="DDA0000825862840000011.GIF" he...; 侯忠生李振轩任天琦殷辰堃; 文献传递

基于改进小波阈值去噪的MFAC扰动抑制方法被引量：1: 2016年; 提出一种带有改进小波阈值去噪模块的MFAC控制方法,实现对系统输出数据的自适应实时去噪并应用于控制系统设计中,在有效地抑制测量扰动的基础上达到更好的控制效果。; 郑璟瑜殷辰堃; 关键词：无模型自适应控制小波阈值去噪鲁棒性

一种列车的隧道附加空气阻力迭代学习辨识方法: 本发明公开一种列车的隧道附加空气阻力迭代学习辨识方法，包括如下步骤：S1、对系统进行初始化：确定列车第1次运行的隧道附加空气阻力辨识值<Image file="DDA0000825862840000011.GIF" he...; 侯忠生李振轩任天琦殷辰堃; 文献传递

对一类非严格重复系统的两种基于二阶内模的迭代学习控制器设计被引量：2: 2010年; 通过对系统中的不确定参数建立迭代域上的二阶内模来研究一类非线性连续时间系统的非严格重复性,并依照内模原理提出了两种基于二阶内模的参数迭代学习控制器:二阶迭代学习控制器和平行迭代学习控制器.本文分别使用不同的Lyapunov函数,证明了两种控制器在各自的可行范围内都可以保证系统的跟踪误差收敛.通过对这两种学习机制的比较分析,说明了平行迭代学习控制设计的合理性.两个数值仿真不仅证实了两种算法的有效性,也展示了平行迭代学习控制器更好的收敛特性.; 殷辰堃许建新侯忠生; 关键词：迭代学习控制内模

复杂可交互场景下基于异策略分层强化学习的搜救机器人自主决策: 2023年; 机器人在搜救任务中的自主决策能力对降低救援人员的风险具有重大意义.为了使机器人在面对复杂多解的搜救任务时能自主形成决策和合理的路径规划,设计了一种异策略分层强化学习算法.该算法由两层Soft Actor-Critic(SAC)智能体组成,高层智能体可以自动生成低层智能体所需的目标并提供内在奖励指导其直接与环境进行交互.在分层强化学习的框架下,首先将复杂可交互场景下的机器人搜救任务描述为高层半马尔可夫决策过程与低层马尔可夫决策过程的双层结构,并针对不同层级设计不同的状态空间、动作空间与奖励函数等.其次,针对传统强化学习算法中目标与奖励函数需要人工设计且缺乏通用性的问题,应用基于SAC的异策略分层强化学习算法训练双足移动机器人与复杂场景交互,通过数据的高效利用和目标空间的调整实现救援机器人的自主决策.仿真结果验证了所设计的算法在解决复杂多路径搜救任务中的有效性和通用性.; 殷辰堃纪宏萱张严心; 关键词：分层强化学习

一类基于概率优先经验回放机制的分布式多智能体软行动-评论者算法被引量：2: 2023年; 针对实际多智能体系统对交互经验的庞大需求,在单智能体领域分布式架构的基础上,提出概率经验优先回放机制与分布式架构并行的多智能体软行动-评论者算法(multi-agent soft Actor-Critic with probabilistic prioritized experience replay based on a distributed paradigm, DPER-MASAC).该算法中的行动者以并行与环境交互的方式收集经验数据,为突破单纯最近经验在多智能体高吞吐量情况下被高概率抽取的局限性,提出更为普适的改进的基于优先级的概率方式对经验数据进行抽样利用的模式,并对智能体的网络参数进行更新.为验证算法的效率,设计了难度递增的2类合作和竞争关系共存的捕食者-猎物任务场景,将DPER-MASAC与多智能体软行动-评论者算法(multi-agent soft Actor-Critic, MASAC)和带有优先经验回放机制的多智能体软行动-评论者算法(multi-agent soft Actor-Critic with prioritized experience replay, PER-MASAC)2种基线算法进行对比实验.结果表明,采用DPER-MASAC训练的捕食者团队其决策水平在最终性能和任务成功率2个维度上均有明显提升.; 张严心孔涵殷辰堃王子豪黄志清; 关键词：分布式结构

基于交通流时间序列相似性的NCut城市路网分区算法被引量：4: 2021年; 针对大规模城市道路交通路网分区的实际需求,基于可反映时间序列变化趋势的皮尔逊相关系数和度量空间关系的欧式距离,构建了一种衡量交通流时间序列相似性的综合指标;结合交通流时间序列的时空相似性特点,引入子区内的空间连通约束,利用归一化割(NCut)算法设计了一种改进的路网静态分区算法;为体现交通路网分区的时变特征,选取了合适的评价指标来确定每一时间段内合理的分区数量,提出了一种基于时间序列的NCut路网动态分区算法;利用北京市东北二环区域内采集的路段交通流速度数据,应用所设计的算法对7.23 km^(2)的路网进行分区,对比了晚高峰时期的分区效果。研究结果表明:所提出的分区算法能实现对路网内不同区域交通状况的有效识别,以30 min为间隔的动态分区算法能划分出数量和范围随时间变化的多个可变子区域;与子区数固定为2、3、4、5的静态分区算法相比,动态分区算法的评价指标分别提升了63.77%、50.06%、6.43%和7.13%,提高了路网分区效果。可见,本文提出的动态分区算法在保证子区内部连通性的基础上可将异质路网划分成多个内部同质子区域,并充分体现交通流动态演化的时空特性,有利于制定动态的多区域边界控制方案。; 殷辰堃方茹李拓; 关键词：交通工程时间序列相似性

基于高阶内模的迭代学习控制及应用: 论文以非线性系统为研究对象,着重研究了针对一些非严格重复问题的迭代学习控制设计方法,特别考虑了由一类高阶内模生成的不确定参数的非严格重复性,同时也考虑了参考轨迹、未知时变输入增益、输入输出扰动和迭代初态的非严格重复性。论...; 殷辰堃; 关键词：迭代学习控制内模控制参数不确定性列车自动控制

城市交通区域的迭代学习边界控制被引量：6: 2018年; 已有的边界控制方法主要是基于模型的反馈控制算法,其实际应用效果受制于模型参数的标定和环境的影响.迭代学习控制以完全跟踪为目标,仅利用较少的模型信息就可以沿迭代轴实现对系统期望输出的完全跟踪.基于城市交通流的重复特性,提出一种城市交通区域的迭代学习边界控制方法,给出跟踪误差收敛性分析.以日本横滨区域为对象分别进行3种场景的仿真:早高峰、晚高峰和中心区域拥堵.仿真结果表明,迭代学习控制方法对于各种场景下的区域路网交通均能达到较为理想的控制效果.; 金尚泰丁莹殷辰堃侯忠生; 关键词：迭代学习控制

全选清除导出

共1页<1>

殷辰堃

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

殷辰堃

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈