《舰船科学技术》

文章标题:多智能体深度强化学习下多目标船舶避碰决策

文章作者:郭洪宇, 窦林涛, 贾贞, 顾浩
关 键 字:多智能体深度强化学习;碰撞危险度;协同决策;多目标船舶避碰
文章摘要:交通密集水域航行船舶较多,交通组成复杂,通航密度较大,多船会遇情况下由于船舶操纵性不同,难以准确预判他船动态轨迹与自身航线的冲突点,导致避碰策略失效。因此,提出多智能体深度强化学习下多目标船舶避碰决策方法。首先,基于人工势场法计算船舶的碰撞危险度,以确定存在碰撞风险的船舶;其次,基于船舶的状态、动作和奖励函数来构建船舶多智能体避碰决策系统,并将船舶的航行目标和安全性目标引入奖励函数设计中;最后,利用深度强化学习算法获得系统中的最优避碰策略。实验结果表明,该方法能够有效评估船舶碰撞风险,且避碰效果好,避碰路径短,具有实际应用价值。