在审
一种基于结构信息的多智能体作战状态表征与协作决策方法
彭
彭浩机构 暂无
闫
闫航机构 暂无
刘
刘鑫机构 暂无
王
王一鸣机构 暂无
马
马琳机构 暂无
朱
朱哲昊机构 暂无
摘要
本发明公开一种基于结构信息的多智能体作战状态表征与协作决策方法,包括步骤:S10,采集数据,并对数据做预处理;S20,对数据进行状态动作表示学习:基于预处理后的交互数据,采用结构互信息引导的变分自编码器框架,学习与作战环境动态相关的状态动作嵌入;S30,进行单智能体探索:基于价值估计构建状态动作空间的层次化结构,计算结构熵作为内在奖励;S40,进行多智能体协作:基于战场任务态势的动态预测构建交互图,融合预测型与新颖性两类内在奖励以形成协同作战决策。本发明通过结构信息理论构建统一框架,围绕多智能体作战状态表征中的“新颖性—可预测性”平衡、单/多智能体场景适配以及样本效率低下三大核心问题。
暂无引用专利



