搜索到23262篇“ 多智能“的相关文章
离散时间智能体系统间歇事件触发输出一致性
2025年
对离散时间智能体系统间歇事件触发输出一致性进行了研究。首先,结合间歇控制和事件触发机制,针对离散智能体系统提出一个输出一致性控制协议。然后,构造误差系统,基于Lyapunov稳定性理论得到了依赖于网络的Laplacian矩阵和系统增益的输出一致性条件,实现离散时间智能体系统间歇事件触发输出一致性。最后,利用具体的仿真例子对结果的有效性进行分析验证。
赵娟徐承杰刘琛张荣强
控制方向未知的受限智能体系统的预设时间模糊控制
2025年
综合考虑受控制方向未知、输入受限和状态时延影响的有领导者智能体系统的编队控制问题,设计基于模糊逻辑系统的预设时间一致性控制策略.为了保证编队输出误差在预设时间内满足预定的约束范围要求,引入预设时间性能函数,构造Lyapunov-Krasovskii(L-K)泛函解决状态时延问题,将外界干扰和L-K泛函的导数中的部分项定义为未知非线性函数,并利用模糊逻辑系统对其进行估计,利用Nussbaum函数和均值定理分别处理控制方向未知和输入受限问题,基于以上设计,提出预设时间模糊控制策略,并通过Lyapunov稳定性理论,分析闭环系统的有界稳定性,数值对比仿真和两级化学反应器应用仿真说明控制方法的有效性.
李菲周超范利蓉王芳
关键词:多智能体系统
大模型驱动智能体的军事需求生成框架
2025年
联合作战军事需求生成涉及的参与人员、工作量庞大,生成过程大依赖个体经验与来源文档,存在需求生成效率较低等问题,难以有效支撑联合作战体系设计。随着大模型技术的发展,大模型驱动的智能体在诸领域展现出卓越的性能,智能体系统通过分布式决策实现群体智能,能够高效处理复杂任务。针对军事需求生成过程中存在的效率低下的问题,提出大模型驱动智能体的军事需求生成框架。该框架整合了模态信息获取智能体、军事专家智能体、会议主持人等要素。模态信息获取智能体集成模态信息处理工具,能够快速获取军事需求,并与用户进行问答交互;军事专家智能体以自然语言对话的形式模拟人类专家讨论生成需求的场景,大模型驱动军事专家智能体理解环境,并能自主调用开源论文库、搜索引擎等工具以支持对话;会议主持人接收人类用户的指令,利用大模型细化指令内容,生成对话提示词和问题背景描述。以俄乌冲突为实验背景,对相关模态信息进行军事需求生成。实验结果表明,当模态信息量在大模型最大处理容量以内时,该框架显著降低了军事需求生成的时间消耗,视频资源节省时间占比达到80%~85%,音频资源节省时间占比为90%~95%。
李嘉晖张萌萌陈洪辉
关键词:多智能体多模态
基于混合模仿学习的智能体追捕决策方法
2025年
针对传统模仿学习方法在处理样化专家轨迹时的局限性,尤其是难以有效整合质量参差不齐的固定模态专家数据的问题,创新性地融合了专家轨迹生成对抗模仿学习(Multiple Trajectories Generative Adversarial Imitation Learning, MT-GAIL)方法与时序差分误差行为克隆(Temporal-Difference Error Behavioral Cloning, TD-BC)技术,构建了一种混合模仿学习框架。该框架不仅可以增强模型对复杂变的专家策略的适应能力,还能够提升模型从低质量数据中提炼有用信息的鲁棒性。框架得到的模型具备直接应用于强化学习的能力,仅需经过细微的调整与优化,即可训练出一个直接可用的、基于专家经验的强化学习模型。在二维动静结合的目标追捕场景中进行了实验验证,该方法展现出良好的性能。结果表明,所提方法可以吸取专家经验,为后续的强化学习训练阶段提供一个起点高、效果佳的初始模型。
王焱宁张锋镝肖登敏孙中奇
智能体强化学习系统
本发明公开了一种智能体强化学习系统,包括本地协调控制子系统和全局协调控制子系统;本地协调控制子系统包括生物启发行为模块、集群行为控制模块和本地智能体策略池,生物启发行为模块用于实现智能体的避障、导航和智能体内个操作的...
郑兆 任雪峰
智能体控制方法及装置
本发明提供一种智能体控制方法及装置,涉及人工智能技术领域,该方法包括:将当前时刻的状态信息输入智能体控制模型,获取智能体控制模型输出的下一时刻每一智能体的目标动作;基于下一时刻每一智能体的目标动作,生成下一时刻每一...
陈杰唐振
时滞智能体系统编队控制
近年来,随着数字化时代的来临,生产力技术得到了飞速发展,这也为智能体系统的发展提供了便利,使得智能体系统能够在社会生产的各个领域中得到应用。编队控制作为智能体系统协调控制中的一类重要问题,旨在通过控制器使系统达到期...
杨惠阳
关键词:多智能体系统时滞编队控制
智能体强化学习方法综述被引量:2
2024年
在自动驾驶、团队配合游戏等现实场景的序列决策问题中,智能体强化学习表现出了优秀的潜力。然而,智能体强化学习面临着维度灾难、不稳定性、目标性和部分可观测性等挑战。为此,概述了智能体强化学习的概念与方法,并整理了当前研究的主要趋势和研究方向。研究趋势包括CTDE范式、具有循环神经单元的智能体和训练技巧。主要研究方向涵盖混合型学习方法、协同与竞争学习、通信与知识共享、适应性与鲁棒性、分层与模块化学习、基于博弈论的方法以及可解释性。未来的研究方向包括解决维度灾难问题、求解大型组合优化问题和分析智能体强化学习算法的全局收敛性。这些研究方向将推动智能体强化学习在实际应用中取得更大的突破。
陈人龙陈嘉礼李善琦谭营
关键词:多智能体强化学习多智能体系统维度灾难
智能体路径规划技术研究综述
2024年
针对智能体路径规划(multi-agent path finding, MAPF)问题研究的算法在户外危险场地、智能仓储系统和城市道路网络等领域有着广泛的应用。根据不同的求解思路,关于MAPF问题研究设计的算法主要可以分为基于搜索的传统算法和基于学习的智能算法2类。在基于搜索的传统算法研究中,按照路径规划效果不同,又可分为最优MAPF算法和次优MAPF算法。最优MAPF算法主要分为基于A~*的搜索、基于代价增长树的搜索(increasing cost tree search, ICTS)和基于冲突的搜索(conflict-based search, CBS)这3类;次优MAPF算法主要分为无边界次优的算法和有边界次优的算法2类。基于学习的智能MAPF算法可以大致分为结合专家经验的算法和基于图神经网络(graph neural network, GNN)的算法2类。根据上述分类介绍了近年来具有代表性的研究成果,分析了各种算法的特点,并对MAPF问题未来的研究方向进行了展望。
吴文君王腾达孙阳高强
关键词:多智能体系统路径规划人工智能移动机器人
异质智能体系统的分散镇定
2024年
文章研究了符号有向图下,由一阶和二阶动力学智能体组成的异质智能体系统的镇定性问题.利用Laplacian矩阵和图理论知识进行分析,分别针对一阶和二阶动态智能体设计相应的协议.基于文章提出的分层理论,通过对控制参数的设计,利用结构平衡的独立强连通分量(SBiSCC),给出了在通信拓扑下一阶-二阶异质系统实现镇定的充要条件.最后,文章给出了几个仿真验证理论结果.
熊晶晶纪志坚
关键词:符号有向图多智能体系统镇定性

相关作者

姜斌
作品数:426被引量:31H指数:4
供职机构:南京航空航天大学
研究主题:容错控制方法 容错控制 故障估计 观测器 高速列车
张柯
作品数:104被引量:157H指数:7
供职机构:南京航空航天大学
研究主题:故障估计 观测器 容错控制方法 故障诊断 多智能体系统
杨宜民
作品数:308被引量:1,669H指数:20
供职机构:广东工业大学自动化学院
研究主题:足球机器人 机器人 管道机器人 遗传算法 移动机器人
张俊格
作品数:44被引量:75H指数:4
供职机构:中国科学院自动化研究所
研究主题:多智能体 智能体 存储介质 电子设备 博弈
蒋国平
作品数:427被引量:882H指数:15
供职机构:南京邮电大学
研究主题:机器人 复杂网络 病毒传播 折弯机 复杂动态网络