Enhancing Underwater Imaging for Robot through Embedded Polarization Neural Network
EPNN:基于嵌入式偏振神经网络的水下成像增强方法
1 论文核心概念
本文提出了一种名为嵌入式偏振神经网络(Embedded Polarization Neural Network, EPNN) 的方法,用于显著提升水下机器人在高散射、高吸收水域中的成像能力。该方法通过结合偏振相机与深度学习模型,实现了对水下低质量图像的快速高质量重建,扩展了水下机器人的视觉范围,提升了成像速度与质量。
最核心的区别:它巧妙地绕过了水下视觉领域“缺乏真实配对数据”这个根本性障碍,通过一个基于物理光学模型(公式1)的“仿真流水线”,生成了无限量的、高质量的“算法级真值”训练数据。
物理模型与深度学习模型的结合提高泛化能力:
物理模型与深度学习模型的结合,其提升泛化能力的核心在于物理模型参数化的随机性。在生成训练数据时,物理退化模型中的关键参数(如衰减系数 c 和拍摄距离 z)并非固定不变,而是在一个符合真实水下情况的合理范围内动态随机取值。这意味着,同一张清晰的地面图像,能够被模拟生成出成千上万张在不同浑浊度、不同距离下拍摄的、退化程度各异的低质图像。因此,神经网络在训练中学到的并非是一种单一的修复映射,而是一种应对各种可能退化情况的通用性物理逆变换能力。当模型在真实水下环境中遇到它从未见过的场景时,该场景的退化模式