万开方
- 作品数:59 被引量:85H指数:6
- 供职机构:西北工业大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术航空宇航科学技术自然科学总论电子电信更多>>
- 一种基于深度强化学习的无人机机动决策方法
- 本发明公开了一种基于深度强化学习的无人机机动决策方法,首先构建无人机机动模型,然后描述无人机和敌机作战相对态势,再依据马尔科夫过程构建状态空间、动作空间和奖惩函数,接下来构建SAC算法模型结构,再定义SAC算法模型参数并...
- 李波甘志刚梁诗阳高晓光万开方越凯强杨志鹏
- 文献传递
- HLA机群协同空战下指挥与控制系统建模与仿真被引量:2
- 2011年
- 指挥与控制系统被誉为现代战争的"兵力倍增器"。依据现代空战的特点,对机群协同空战这一背景下的空战指挥与控制系统进行了研究。重点建立了由预警机上层指控系统和编队长机下层指控系统组成的空战两级指控系统模型。最后以HLA/RT I分布仿真技术标准为依托,构建了通用性好,灵活性高,互操作性强的航空兵空战仿真模拟系统,并以此系统为仿真平台,在多种初始态势下对所建立的机群协同空战下的两级空战指控系统进行仿真分析,实验结果表明所建立的指挥与控制系统模型是合理可行的。
- 万开方高晓光魏小丰刘宇
- 关键词:协同空战指控系统编队HLARTI
- 一种基于人工势场法和MADDPG的多无人机运动规划方法
- 本发明公开了一种基于人工势场法和MADDPG的多无人机运动规划方法,该方法在原有多无人机探索环境经验的基础上,增加了通过人工势场法将多无人机成功规划至目标的高质量经验,在通过MADDPG算法训练时,以一定的概率分别从探索...
- 万开方武鼎威高晓光胡子剑
- 基于云协同的网络集群反隐身火控系统设计被引量:9
- 2013年
- 针对反隐身作战需求,讨论了云计算及其军事应用,提出了"战术云"概念;基于"战术云"提出了一种云协同网络集群反隐身火控攻击引导技术,分析了其火控工作原理,设计了其系统结构和功能组成,给出了其体系架构,描述了其工作过程,并归纳总结出该新型火控系统的4项关键技术,即云协同探测、云战术决策、云无源火控、云网络制导,为新一代火控攻击引导系统研制提供了参考,具有很强的工程应用前景。
- 高晓光万开方李波刘学全
- 关键词:云计算反隐身战术决策
- 一种基于MADDPG的多无人机任务决策方法
- 本发明公开了一种基于MADDPG的多无人机任务决策方法,将MADDPG算法引入到多无人机任务分配当中,首先根据多无人机实际作战环境,建立深度强化学习所需的二维作战环境模型,其次,建立多无人机作战环境中的防空导弹等多种威胁...
- 李波甘志刚越凯强高晓光万开方高佩忻
- 一种基于三支决策的目标特征选择方法
- 本发明公开了一种基于三支决策的目标特征选择方法,基于三支决策理论的特征选择算法来解决高维度小样本下的识别问题;针对典型的过滤式算法ReliefF中仅有一个阈值作为特征取舍条件的局限性以及封装式算法需要大量执行时间的弊端,...
- 李波骆双双田琳宇万开方高晓光
- 文献传递
- 一种基于CEL-MADDPG的多无人机围捕策略方法
- 本发明提供了一种基于CEL‑MADDPG的多无人机围捕策略方法,建立一种基于多智能体深度确定性策略梯度算法的框架,将多无人机围捕任务拆分为目标追踪、包围过渡、靠近捕获三个子任务,通过设立三种奖励函数帮助多无人机对围捕过程...
- 李波黄晶益谢国燕杨志鹏杨帆万开方高晓光
- 一种基于SAC算法的无人机分层飞行决策方法
- 本发明提供了一种基于SAC算法的无人机分层飞行决策方法,首先构建无人机飞行控制模型,再根据马尔科夫决策过程构建状态空间、分层决策动作空间和奖励函数;接下来构建基于SAC算法的无人机分层飞行决策模型结构;再定义模型参数,初...
- 李波白双霞甘志刚康培棋杨慧林万开方高晓光
- 一种基于元强化学习并行训练算法的无人机飞行决策方法
- 本发明提供了一种基于元强化学习并行训练算法的无人机飞行决策方法,首先构建无人机飞行控制模型;然后依据马尔科夫决策过程构建无人机飞行决策的状态空间、动作空间和奖励函数;接下来构建存放元强化学习算法训练样本数据的多任务经验池...
- 李波白双霞甘志刚康培棋杨慧林万开方高晓光
- 基于改进QMAP的贝叶斯网络参数学习算法被引量:3
- 2021年
- 小数据集使得贝叶斯网络参数学习中的统计信息不准确,导致只依靠数据难以得到准确的贝叶斯网络参数。定性最大后验估计(QMAP)方法是目前小数据集条件下贝叶斯网络参数学习精度最高的算法。然而,当参数约束数量较多或参数可行域较小时,QMAP算法中的拒绝-接受采样过程会变得极为耗时甚至难以完成。为了提高QMAP算法的学习效率同时又尽量不影响其学习精度,设计了一种约束区域中心点的解析计算方法来替代原有的拒绝-接受采样计算方法。结合参数约束构建一个求解约束区域边界点的目标优化模型;利用凸优化引擎来求解该目标优化模型,获得约束区域的边界点和中心点;通过获得的约束区域中心点改进现有的QMAP算法。仿真实验证明,所提出的CMAP算法的参数学习精度稍差于QMAP算法,但计算效率比QMAP算法提高了2~5倍。
- 邸若海李叶万开方吕志刚王鹏
- 关键词:贝叶斯网络