张文旭
- 作品数:6 被引量:31H指数:3
- 供职机构:西南交通大学电气工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信文化科学更多>>
- 基于事件驱动的多智能体强化学习研究被引量:8
- 2017年
- 本文针对多智能体强化学习中存在的通信和计算资源消耗大等问题,提出了一种基于事件驱动的多智能体强化学习算法,侧重于事件驱动在多智能体学习策略层方面的研究。在智能体与环境的交互过程中,算法基于事件驱动的思想,根据智能体观测信息的变化率设计触发函数,使学习过程中的通信和学习时机无需实时或按周期地进行,故在相同时间内可以降低数据传输和计算次数。另外,分析了该算法的计算资源消耗,以及对算法收敛性进行了论证。最后,仿真实验说明了该算法可以在学习过程中减少一定的通信次数和策略遍历次数,进而缓解了通信和计算资源消耗。
- 张文旭马磊王晓东
- 关键词:多智能体收敛性
- 强化学习的地–空异构多智能体协作覆盖研究被引量:7
- 2018年
- 以无人机(unmanned aerial vehicle,UAV)和无人车(unmanned ground vehicle,UGV)的异构协作任务为背景,通过UAV和UGV的异构特性互补,为了扩展和改进异构多智能体的动态覆盖问题,提出了一种地–空异构多智能体协作覆盖模型。在覆盖过程中,UAV可以利用速度与观测范围的优势对UGV的行动进行指导;同时考虑智能体的局部观测性与不确定性,以分布式局部可观测马尔可夫(decentralized partially observable Markov decision processes,DEC-POMDPs)为模型搭建覆盖场景,并利用多智能体强化学习算法完成对环境的覆盖。仿真实验表明,UAV与UGV间的协作加快了团队对环境的覆盖速度,同时强化学习算法也提高了覆盖模型的有效性。
- 张文旭马磊贺荟霖王晓东
- 凝炼科研成果,提升学生创新实践能力
- 为提高大学生对基础知识的深入理解和实践创新能力,推行自主学习、在研究中学习的人才培养理念,创建了西南交通大学机器人技术创新与竞赛中心,教学内容覆盖了电气信息类专业较宽知识和技能领域;建立了本科-硕士-博士培养相互衔接的培...
- 孙永奎张文旭马磊赵舵
- 关键词:高等教育
- 文献传递
- 基于动态加权的量化分布式卡尔曼滤波被引量:1
- 2015年
- 针对一个无融合中心传感器网络中的状态估计问题,提出一种基于量化信息的分布式卡尔曼滤波(QDKF)算法。首先,在分布式卡尔曼滤波(DKF)中,以节点状态估计精度为加权准则,动态选取加权矩阵,使得全局估计误差的协方差最小;然后,进一步考虑了网络带宽受限制的情况,在DKF算法中加入均匀量化器,节点之间通信使用量化后的信息,以减少网络通信的带宽需求。QDKF算法仿真采用了8 bit的均匀量化器,与Metropolis加权法和最大度加权法相比,动态加权法的状态估计均方根误差分别降低了25%和27.33%。实验结果表明,采用动态加权法的QDKF算法能提高系统的状态估计精度,减少带宽需求,适用于网络通信受限制的应用场合。
- 陈小龙马磊张文旭
- 关键词:无线传感器网络分布式算法动态加权
- 基于一致性与事件驱动的强化学习研究
- 强化学习是一种重要的机器学习方法,通过试错的方式来求解问题,具有学习结构简单,自适应性强等特点,在机器博弈、机器人自主导航和市场决策等领域显示出很大的发展潜力,为解决智能系统知识获取的瓶颈问题提供了一个可行之法。论文围绕...
- 张文旭
- 关键词:多智能体系统
- 文献传递
- 多机器人系统强化学习研究综述被引量:14
- 2014年
- 强化学习是实现多机器人对复杂和不确定环境良好适应性的有效手段,是设计智能系统的核心技术之一.从强化学习的基本思想与理论框架出发,针对局部可观测性、计算复杂度和收敛性等方面的固有难题,围绕学习中的通信、策略协商、信度分配和可解释性等要点,总结了多机器人强化学习的研究进展和存在的问题;介绍了强化学习在机器人路径规划与避障、无人机、机器人足球和多机器人追逃问题中的应用;最后指出了定性强化学习、分形强化学习、信息融合的强化学习等若干多机器人强化学习的前沿方向和发展趋势.
- 马磊张文旭戴朝华
- 关键词:多机器人系统计算复杂度不确定性