《舰船科学技术》

文章标题:微调Stable Diffusion的侧扫声呐图像数据集扩充方法

文章作者:高鑫1, 张龙刚1, 彭望3, 郝瑞亭2, 马双双3, 郑杰4
关 键 字:侧扫声呐;深度学习;参数高效微调;稳态扩散
文章摘要:针对水下声学图像获取难度大、优质数据少的问题,提出一种参数高效微调Stable Diffusion的侧扫声呐图像数据集扩充方法。旨在提升数据集质量与多样性,进而改善基于深度学习的舰船侧扫声呐目标检测系统的性能。首先冻结预训练模型全连接层的权重,随后注入可训练的秩分解矩阵(Rank Decomposition Matrices),最后嵌入提示词生成图像样本。实验结果表明,相比于目前主流基于CycleGAN的方法,提出的方法生成了更高质量、多样化、稳定的侧扫声呐图像。此外,数据集扩充后,多种主流的目标检测算法性能均有所增强,YOLOv8n的mAP@0.5提升了22.9%,证明了该方法的有效性。