文章下载

《舰船科学技术》

文章标题：基于APF-DDPG改进的无人艇自治学习算法

文章作者：黄志坚¹, 华顿², 吴贤坤³, 王仁洪¹
关键字：无人艇;自治学习;DDPG;人工势场;经验回放
文章摘要：针对无人艇深度学习算法易发散，以及无人艇强化学习算法难以适应连续动作与空间的问题，提出改进的深度确定策略梯度（DDPG）算法，即APF-DDPG。该算法利用人工势场等改进复合奖惩函数，优化经验池方案和随机采样策略，添加高斯噪声提高探索性，以及修改神经网络模型等；并搭建仿真环境，评价无人艇的探索策略。结果验证了APF-DDPG算法的可行性及其性能，证明了改进的APF-DDPG算法，在复杂环境下路径规划的有效性与优越性。

暂无DOC全文下载暂无PDF全文下载

返回卷期目录