《舰船科学技术》

文章标题:面向海洋巡逻任务的AUV集群能量短板效应抑制策略

文章作者:蒋可龙1,2, 彭浩1,3, 袁德利1,2, 徐伟峰1,2, 曾子卿1,3, 武子涵1,3
关 键 字:AUV集群;多智能体强化学习;能量管理;协同路径规划
文章摘要:为解决AUV集群在复杂海洋任务中因能量分配不均导致“短板效应”,提出一种基于多智能体强化学习的动态能量均衡策略。该策略将引入动态能耗奖惩函数的长短期记忆-多智能体近端策略优化(Long Short-Term Memory - Multi-Agent Proximal Policy Optimization,LSTM-MAPPO)深度强化学习、A星(A-star,A*)路径规划和比例-积分-微分控制(Proportional-Integral-Derivative Control,PID),构建三级集成智能控制架构,形成“全局决策-路径规划-精准控制”的完整闭环。仿真实验表明,有能耗奖惩函数的LSTM-MAPPO算法相较于基于前沿的探索算法,巡逻覆盖率提升了143.5%,平均巡逻时间减少了31.6%,能耗降低了58.3%;有效抑制了AUV集群能量的短板效应,提升了巡逻任务的执行能效。