搜索到84篇“ 对手建模“的相关文章
面向空战仿真的智能对手建模研究进展与展望
2024年
智能对手建模是空战仿真领域的重要课题,对于加快空战模拟训练的转型升级,提高训练效益、节约训练成本、降低训练风险等方面具有重要意义。总结了近年来国外智能对手建模技术研究进展;论述了智能对手能力需求与关键技术,分别对智能对手对抗空间表示与建模、态势评估与推理、智能对手自主决策与优化、多智能对手行动协同与控制进行分析。对未来空战智能对手建模技术的发展方向进行了总结和展望,以期为相关研究人员提供参考与启发。
郭亚楠曹小群杨术周晓光
关键词:空战对手建模人工智能
智能体水下攻防快速对手建模交互策略优化方法
以实现智能体水下攻防快速对手建模为目的,提出一种智能体交互策略优化方法,基于贝叶斯估计理论,从快速获取对手建模所需的关键数据角度出发,计算智能体采用各交互策略后对对手智能体策略偏好的置信的变化程度,选取能获得最大置信变化...
魏旭飞魏先利
关键词:贝叶斯估计
一种基于深度强化学习的隐式对手建模方法
本发明公开了一种基于深度强化学习的隐式对手建模方法,属于多智能体强化学习方向的对手建模领域。本发明围绕动态博弈环境下的对手建模问题,利用深度强化学习技术提出了一种改进的隐式对手建模方法。该隐式建模方法不依赖于特定领域知识...
刘婵娟赵天昊刘睿康
基于稀疏协作图和对手建模的大规模多智能体协作方法
本发明涉及智能决策技术领域,公开了一种基于稀疏协作图和对手建模的大规模多智能体协作方法,用于大规模多机器人自主协作任务中以提高团队协作性能,包括:步骤A:初始化网络;步骤B:预训练对手建模网络,对视野范围内的其他智能体进...
秦家虎骆轩玉李曼马麒超刘轻尘
基于隐式对手建模的作战任务分解技术研究
庄鑫平
不完全信息下的多智能体对手建模研究
对手建模的目标是对对手策略进行建模,以最大化主智能体的回报。大多数先前的工作未能有效处理对手信息有限的情况。为此,我们提出了一种不完全信息下的对手建模(OMII)方法,能够在对手信息有限的情况下,只使用自身观察,提取跨轮...
邓有朋范佳宣郑岩王振亚吕勇梁李雨霄
关键词:对手建模
基于深度强化学习的对手建模方法研究综述被引量:2
2023年
深度强化学习是一种兼具深度学习特征提取能力和强化学习序列决策能力的智能体建模方法,能够弥补传统对手建模方法存在的非平稳性适应差、特征选取复杂、状态空间表示能力不足等问题。将基于深度强化学习的对手建模方法分为显式建模和隐式建模两类,按照类别梳理相应的理论、模型、算法,以及适用场景;介绍基于深度强化学习的对手建模技术在不同领域的应用情况;总结亟需解决的关键问题以及发展方向,为基于深度强化学习的对手建模方法提供较全面的研究综述。
徐浩添秦龙曾俊杰胡越张琪
关键词:对手建模博弈论元学习
不完全信息下多智能体对手建模
2023年
对手建模的目标是对对手策略进行建模,以最大化主智能体的回报。大多数先前的工作未能有效处理对手信息有限的情况。为此,提出了一种不完全信息下的对手建模(OMII)方法,能够在对手信息有限的情况下,只使用自身观察,提取跨轮次的对手策略表征。OMII提出一种全新的基于策略的数据增广方式,通过对比学习,离线地学习对手策略表征并将其作为额外输入训练一个通用的响应策略。在线测试阶段,OMII从最近几轮的历史轨迹数据中提取对手策略表征,与通用策略结合实现动态的对手策略响应。此外,OMII还通过保守与利用间的平衡保证了期望收益的下界。实验结果表明在对手信息有限的情况下,OMII仍能准确提取对手策略表征,并对未知策略具有一定泛化能力,在性能上优于现有的对手建模算法。
邓有朋范佳宣郑岩王振亚吕勇梁李雨霄
关键词:对手建模多智能体系统
非完全信息下基于反事实后悔最小化和对手建模方法的博弈决策研究
现实世界下存在着许多与博弈决策有关的场景,诸如商业合同谈判、体育竞技战术安排和军事领域攻防对抗等。随着人工智能的飞速发展和博弈理论的实际应用,大量的模型和算法应时而生,在各种博弈决策场景上发挥着至关重要的辅助和指导作用。...
黄蕾
关键词:非完全信息博弈决策对手建模
一种基于隐式对手建模的强化学习抗干扰通信方法
本发明提出一种基于隐式对手建模的强化学习抗干扰通信方法。该方法包括:搭建一对一通信抗干扰模型,通信节点获取强化学习智能干扰节点干扰频段信息,将此信息与通信节点通信频段信息结合为隐含干扰节点建模信息的环境状态,将此环境状态...
侯长波马鹏周志超林佳昕刘秦蒋睿

相关作者

顿文力
作品数:3被引量:8H指数:2
供职机构:中国海洋大学信息科学与工程学院计算机科学与技术系
研究主题:多智能体系统 对手建模 多机器人系统 对抗性 机器学习方法
吴哲
作品数:9被引量:7H指数:1
供职机构:中国科学院自动化研究所
研究主题:指纹身份认证 指纹 指纹认证 对手建模 安全邮件系统
武鹤
作品数:3被引量:5H指数:1
供职机构:厦门大学信息科学与技术学院
研究主题:多智能体 交互式动态影响图 对手建模 动态贝叶斯网络 不确定环境
罗键
作品数:148被引量:740H指数:16
供职机构:厦门大学信息科学与技术学院自动化系
研究主题:交互式动态影响图 遗传算法 三角模糊数 煤炭 数据挖掘
孟庆春
作品数:51被引量:580H指数:12
供职机构:中国海洋大学信息科学与工程学院
研究主题:帆船 路径规划 足球机器人 多智能体系统 模糊逻辑