《舰船科学技术》

文章标题:基于APF-DDPG改进的无人艇自治学习算法

文章作者:黄志坚1, 华顿2, 吴贤坤3, 王仁洪1
关 键 字:无人艇;自治学习;DDPG;人工势场;经验回放
文章摘要:针对无人艇深度学习算法易发散,以及无人艇强化学习算法难以适应连续动作与空间的问题,提出改进的深度确定策略梯度(DDPG)算法,即APF-DDPG。该算法利用人工势场等改进复合奖惩函数,优化经验池方案和随机采样策略,添加高斯噪声提高探索性,以及修改神经网络模型等;并搭建仿真环境,评价无人艇的探索策略。结果验证了APF-DDPG算法的可行性及其性能,证明了改进的APF-DDPG算法,在复杂环境下路径规划的有效性与优越性。