文章下载

《舰船科学技术》

文章标题：面向海洋巡逻任务的AUV集群能量短板效应抑制策略

文章作者：蒋可龙^1,2, 彭浩^1,3, 袁德利^1,2, 徐伟峰^1,2, 曾子卿^1,3, 武子涵^1,3
关键字：AUV集群;多智能体强化学习;能量管理;协同路径规划
文章摘要：为解决AUV集群在复杂海洋任务中因能量分配不均导致“短板效应”，提出一种基于多智能体强化学习的动态能量均衡策略。该策略将引入动态能耗奖惩函数的长短期记忆-多智能体近端策略优化（Long Short-Term Memory - Multi-Agent Proximal Policy Optimization，LSTM-MAPPO）深度强化学习、A星（A-star，A*）路径规划和比例-积分-微分控制（Proportional-Integral-Derivative Control，PID），构建三级集成智能控制架构，形成“全局决策-路径规划-精准控制”的完整闭环。仿真实验表明，有能耗奖惩函数的LSTM-MAPPO算法相较于基于前沿的探索算法，巡逻覆盖率提升了143.5%，平均巡逻时间减少了31.6%，能耗降低了58.3%；有效抑制了AUV集群能量的短板效应，提升了巡逻任务的执行能效。

暂无DOC全文下载暂无PDF全文下载

返回卷期目录