深度学习水论文:mamba+图像增强

🧀当前视觉领域对高效长序列建模需求激增,对Mamba+图像增强这方向的研究自然也逐渐火热。原因在于其高效长程建模,以及动态计算优势,在图像质量提升和细节恢复方面有难以替代的作用。

 

 🧀因此短时间内,就有不少Mamba+图像增强的成果陆续发表,比较突出的有字节等团队提出的图像恢复网络VmambaIR,仅使用26%的计算成本就实现了超越SOTA的重建精度,还有华为诺亚方舟实验室等提出的基于Mamba的图像增强方法TAMambaIR,计算效率起飞。 

 

为帮助大家紧跟领域发展,我总结了11篇热点研究成果,有代码的也都有

我还整理出了相关的论文+开源代码,以下是精选部分论文

 

 

论文1

标题:

MambaUIE: Unraveling the Ocean's Secrets with Only 2.8 GFLOPs

仅用2.8 GFLOPs解开海洋秘密的MambaUIE

法:

          • Mamba架构:基于状态空间模型(SSM)的Mamba架构,能够以线性复杂度对长距离依赖关系进行建模。

          • 动态交互-视觉状态空间块(DI-VSS):引入视觉状态空间(VSS)块来捕获全局上下文信息,同时挖掘局部信息。

          • 空间前馈网络(SGFN):设计SGFN来处理DI-VSS获得的特征图,进一步增强Mamba的局部建模能力。

          • 动态交互块(DIB):通过空间交互(S-I)和通道交互(C-I)操作,动态地对两个分支的特征图进行加权,以更好地融合全局和局部信息。

          创新点:

            • 首次将Mamba应用于UIE任务:打破了FLOPs对UIE准确性的限制,为未来探索更高效的UIE提供了新的基准。

            • 性能提升:相比之前的方法,MambaUIE在UIEB数据集上将GFLOPs降低了67.4%(从2.715G降低到2.8 GFLOPs),同时在PSNR和SSIM指标上取得了最佳性能。

            • 全局与局部信息融合:通过DI-VSS和DIB的设计,有效地将全局和局部信息结合在一起,提高了模型的准确性和效率。

             

            论文2

            标题:

            Mamba-UIE: Enhancing Underwater Images with Physical Model Constraint 

            Mamba-UIE:用物理模型约束增强水下图像

            法:

            • 物理模型约束框架:基于修订的水下图像形成模型,将输入图像分解为四个组件:水下场景辐射度、直接传输图、后向散射传输图和全局背景光。

            • Mamba-UIE网络:结合CNN和Mamba的混合架构,利用Mamba在通道和空间层面上对长距离依赖关系进行建模,同时保留CNN主干以恢复局部特征和细节。

            • 重建一致性约束:在重建图像和原始图像之间应用重建一致性约束,以实现对水下图像增强过程的有效物理约束。

            创新点:

                      • 物理模型约束:通过引入物理形成模型,考虑了图像形成过程中的物理定律和现实世界特征,提高了生成图像的真实性和鲁棒性。

                      • 性能提升:在UIEB数据集上,Mamba-UIE实现了27.13的PSNR和0.93的SSIM,超越了现有的最先进方法。

                      • 全局与局部依赖关系建模:通过结合CNN和Mamba,同时实现了全局和局部依赖关系的建模,提高了图像增强的效果

                       

                      论文3

                      标题:

                      O-Mamba: O-shape State-Space Model for Underwater Image Enhancement

                      O-Mamba:O型状态空间模型用于水下图像增强

                      方法:

                            • O型双分支网络:采用O型双分支网络分别对空间和跨通道信息进行建模,利用状态空间模型的高效全局感受野。

                            • 多尺度双向促进模块(MSBMP):设计MSBMP模块以增强两个分支之间的信息交互,并有效利用多尺度信息。

                            • 多尺度混合专家(MS-MoE):在每个分支内融合多尺度信息,通过多个Mamba专家学习不同尺度的特征表示。

                            • 循环多尺度优化策略(CMS):通过循环优化不同尺度的损失,减少同时优化多个尺度损失时的潜在冲突。

                            创新点:

                                    • 双分支结构:通过空间Mamba分支和通道Mamba分支,从不同维度对水下图像增强过程进行建模,空间分支起主导作用,通道分支从通道维度进行补充。

                                    • 性能提升:在多个数据集上实现了SOTA性能,例如在LSUI数据集上,PSNR从29提升到30,SSIM从0.9139提升到0.9245。

                                    • 多尺度信息利用:通过MS-MoE和CMS策略,充分利用多尺度信息,提高了模型对不同尺度特征的建模能力。

                                     

                                     

                                    论文4

                                    标题:

                                    PixMamba: Leveraging State Space Models in a Dual-Level Architecture for Underwater Image Enhancement

                                    PixMamba:利用状态空间模型的双层架构进行水下图像增强

                                    法:

                                          • 双层架构:PixMamba包含两个关键组件:用于重建增强图像特征的Efficient Mamba Net(EMNet)和用于确保增强图像全局一致性的PixMamba Net(PixNet)。

                                          • Efficient Mamba Net(EMNet):结合Efficient Mamba Block(EMB)进行高效的块级特征提取和依赖关系建模,以及Mamba Upsampling Block(MUB)进行细节保留的上采样。

                                          • PixMamba Net(PixNet):在像素级别处理整个图像,捕获全局视图中的详细特征,通过Block-wise Positional Embedding(BPE)提供空间信息。

                                          • 状态空间模型(SSM):利用SSM的线性复杂度和长距离建模能力,实现高效的全局依赖关系建模。

                                          创新点:

                                                  • 双层处理:通过结合块级和像素级处理,PixMamba能够同时增强微观细节和宏观图像质量,性能优于仅依赖跳过连接的方法。

                                                  • 性能提升:在C60数据集上,UIQM从2.667提升到2.868,UCIQE从0.574提升到0.586;在UCCS数据集上,UCIQE从0.55提升到0.561。

                                                  • 计算效率:通过引入Mamba Upsampling Block(MUB)和Block-wise Positional Embedding(BPE),在保持高效计算的同时,提高了图像增强的质量。

                                                   

                                                   

                                                   

                                                   

                                                   

                                                  本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/908893.shtml

                                                  如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

                                                  相关文章

                                                  今天对C语言中static和extern关键字的作用认识又深刻了

                                                  用了这么久的C语言,之前对于static关键字的用法总是一知半解,今天终于搞清楚了,写个文章简单记录一下。 用static修饰的变量,不管是全局变量还是局部变量,其存储位置都是静态存储区,全局变量作用域是当前文…

                                                  河北对口计算机高考MySQL笔记(完结版)(2026高考)持续更新~~~~

                                                  MySQL 基础概念 数据(Data):文本,数字,图片,视频,音频等多种表现形式,能够被计算机存储和处理。 **数据库(Data Base—简称DB):**存储数据的仓库…

                                                  vmware ubuntu扩展硬盘(可用)

                                                  一、 右键需要的虚拟机,选择设置,调整最大内存 二、安装gparted软件 sudo apt-get install gparted 三、搜索应用然后打开 四、右键/dev/sda3 五、调整大小 六、勾选确定 点绿色勾:

                                                  RoBERTa 和 BERT 的简介与对比

                                                  RoBERTa 和 BERT 是什么 一、BERT(Bidirectional Encoder Representations from Transformers) 提出背景:由谷歌于2019年提出,是自然语言处理领域的里程碑模型,基于Transformer编码器架构,通过预训练生成双向语言表示。 核心特点: 双向预训练:通过掩码语言模型(MLM)…

                                                  前端绘制道路鱼骨图

                                                  项目背景&#xff1a;需要实现道路情况鱼骨图&#xff0c;根据上下行道路分别显示对应的道路情况和沿路设施状况&#xff0c;箭头根据所示方向平滑移动 1.封装组件&#xff0c;创建FishboneDiagram.vue文件 <template><div class"fishedOneBox flex items-cente…

                                                  selinux firewalld

                                                  一、selinux 1.说明 SELinux 是 Security-Enhanced Linux 的缩写,意思是安全强化的 linux; SELinux 主要由美国国家安全局(NSA)开发,当初开发的目的是为了避免资源的误用 DAC(Discretionary Access Control)自主访问控制系统MAC(Mandatory Access Control)强制访问控…

                                                  RSS 2025|从说明书学习复杂机器人操作任务:NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill

                                                  视觉语言模型&#xff08;Vision-Language Models, VLMs&#xff09;&#xff0c;为真实环境中的机器人操作任务提供了极具潜力的解决方案。 尽管 VLMs 取得了显著进展&#xff0c;机器人仍难以胜任复杂的长时程任务&#xff08;如家具装配&#xff09;&#xff0c;主要受限于人…

                                                  NPOI Excel用OLE对象的形式插入文件附件以及插入图片

                                                  static void Main(string[] args) {XlsWithObjData();Console.WriteLine("输出完成"); }static void XlsWithObjData() {// 创建工作簿和单元格,只有HSSFWorkbook,XSSFWorkbook不可以HSSFWorkbook workbook new HSSFWorkbook();HSSFSheet sheet (HSSFSheet)workboo…

                                                  企业数字化转型实战:某行业研究院如何通过SD-WAN技术优化网络架构?

                                                  一、引言 随着企业数字化转型的深入推进&#xff0c;传统网络架构在灵活性、可靠性和管理效率方面逐渐暴露不足。SD-WAN&#xff08;软件定义广域网&#xff09;技术凭借其智能化、自动化和高效的特点&#xff0c;逐渐成为企业网络架构优化的首选方案。本文以某研究院数字化基…

                                                  数字证书_CA_详解

                                                  目录 一、数字证书简介 二、 CA&#xff08;证书颁发机构&#xff09; (一) 证书链&#xff08;信任链&#xff09; 1. 根证书 2. 中间证书 3. 网站证书 (二) 抓包软件的证书链与信任机制 1. 抓包通信流程 2. 证书链伪造与信任验证流程 (三) 关于移动设备的CA 一、数…

                                                  Android协程学习

                                                  目录 Android上的Kotlin协程介绍基本概念与简单使用示例协程的高级用法 结构化并发线程调度器(Dispatchers)自定义调度器并发:同步 vs 异步 异步并发(async 并行执行)同步顺序执行协程取消与超时 取消机制超时控制异步数据流 Flow协程间通信 使用 Channel使用 StateFlow /…

                                                  统计学(第8版)——假设检验学习笔记(考试用)

                                                  一、假设检验核心框架 &#xff08;一&#xff09;解决的核心问题 判断样本与总体 / 样本与样本的差异是由抽样误差还是本质差异引起 典型场景&#xff1a; 产品合格率是否达标&#xff08;比例检验&#xff09;工艺改进后均值是否显著变化&#xff08;均值检验&#xff09…

                                                  Java求职者面试:微服务技术与源码原理深度解析

                                                  Java求职者面试&#xff1a;微服务技术与源码原理深度解析 第一轮&#xff1a;基础概念问题 1. 请解释什么是微服务架构&#xff0c;并说明其优势和挑战。 微服务架构是一种将单体应用拆分为多个小型、独立的服务的软件开发方法。每个服务都运行在自己的进程中&#xff0c;并…

                                                  c# 局部函数 定义、功能与示例

                                                  C# 局部函数&#xff1a;定义、功能与示例 1. 定义与功能 局部函数&#xff08;Local Function&#xff09;是嵌套在另一个方法内部的私有方法&#xff0c;仅在包含它的方法内可见。 • 作用&#xff1a;封装仅用于当前方法的逻辑&#xff0c;避免污染类作用域&#xff0c;提升…

                                                  ava多线程实现HTTP断点续传:原理、设计与代码实现

                                                  一、引言 在当今互联网环境下&#xff0c;大文件下载需求日益增长。传统单线程下载方式效率低下&#xff0c;且一旦下载中断&#xff0c;需要重新开始。断点续传技术通过将文件分块并利用多线程并行下载&#xff0c;显著提升了下载效率&#xff0c;同时支持中断后继续下载。本…

                                                  vla学习 富

                                                  # 基于diffusion # π0 ## 架构 其核心思想是在预训练好的视觉语言模型&#xff08;VLM&#xff09;基础上添加一个“动作专家”&#xff08;action expert&#xff09;&#xff0c;通过流匹配&#xff08;flow matching&#xff09;的方式生成连续的高频控制指令。整个架构可以…

                                                  降雨预测系统(机器学习)

                                                  这是一个基于Python开发的降雨预测系统,使用机器学习算法对指定月份的降雨概率进行预测。该系统提供了友好的图形用户界面(GUI),支持数据可视化和交互式操作。 ## 功能特点 - 📊 生成历史降雨数据(2015-2024年) - 🤖 使用逻辑回归模型进行降雨预测 - 📈 可视化…

                                                  逻辑回归与Softmax

                                                  Softmax函数是一种将一个含任意实数的K维向量转化为另一个K维向量的函数,这个输出向量的每个元素都在(0, 1)区间内,并且所有元素之和等于1。 因此,它可以被看作是某种概率分布,常用于多分类问题中作为输出层的激活函数。这里我们以拓展逻辑回归解决多分类的角度对Softmax函…

                                                  基于PSO与BP神经网络分类模型的特征选择实战(Python实现)

                                                  说明&#xff1a;这是一个机器学习实战项目&#xff08;附带数据代码文档&#xff09;&#xff0c;如需数据代码文档可以直接到文章最后关注获取。 1.项目背景 在机器学习建模过程中&#xff0c;特征选择是提升模型性能、降低计算复杂度的重要环节。尤其在高维数据场景下&…

                                                  深度学习之模型压缩三驾马车:基于ResNet18的模型剪枝实战(1)

                                                  一、背景&#xff1a;为什么需要模型剪枝&#xff1f; 随着深度学习的发展&#xff0c;模型参数量和计算量呈指数级增长。以ResNet18为例&#xff0c;其在ImageNet上的参数量约为1100万&#xff0c;虽然在服务器端运行流畅&#xff0c;但在移动端或嵌入式设备上部署时&#xf…