Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【魔改UNet系列】Mamba-UNet: 医学图像分割的UNet类纯视觉Mamba

【魔改UNet系列】Mamba-UNet: 医学图像分割的UNet类纯视觉Mamba

作者头像
小白学视觉
发布于 2024-10-29 12:59:43
发布于 2024-10-29 12:59:43
9220
举报

论文信息

Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation
Mamba-UNet: 医学图像分割的UNet类纯视觉Mamba
作者:Ziyang Wang, Jian-Qing Zheng, Yichi Zhang, Ge Cui, Lei Li
源码:https://github.com/ziyangwang007/MambaUNet

论文创新点

  1. 新颖的架构融合:Mamba-UNet结合了UNet的对称编码器-解码器风格架构和Mamba架构的能力,特别擅长处理长序列和全局上下文信息。这种融合在医学图像分割领域是创新的,旨在改进长距离依赖的建模。
  2. 纯视觉Mamba(VMamba)基础的编码器-解码器结构:该网络采用了基于纯视觉Mamba的编码器-解码器结构,并注入了跳跃连接以保留不同尺度上的空间信息。这种设计促进了全面的特征学习过程,能够在医学图像中捕捉复杂的细节和更广泛的语义上下文。
  3. 视觉状态空间(VSS)块的引入:Mamba-UNet在编码器和解码器中使用了视觉状态空间(VSS)块,这些块通过交叉扫描模块(CSM)将非因果视觉图像转换为有序的补丁序列,增强了模型在计算机视觉任务中的适用性。
  4. 针对医学图像分割优化的集成机制:作者在VMamba块内引入了一种新颖的集成机制,确保了编码器和解码器路径之间的无缝连接和信息流动,从而增强了分割性能。这一机制针对医学图像分割任务进行了特别优化。

摘要

在医学图像分析的最新进展中,卷积神经网络(CNN)和视觉变换器(ViT)树立了重要的基准。前者通过其卷积操作擅长捕捉局部特征,后者通过自注意力机制实现了显著的全局上下文理解。然而,这两种架构在有效建模医学图像中的长距离依赖方面都存在局限性,这对于精确分割至关重要。受Mamba架构的启发,该架构以其在处理长序列和全局上下文信息方面的专业性而闻名,并且作为状态空间模型(SSM),我们提出了Mamba-UNet,这是一种新颖的架构,它将UNet在医学图像分割中的能力与Mamba的能力相结合。Mamba-UNet采用了基于纯视觉Mamba(VMamba)的编码器-解码器结构,并注入了跳跃连接以保留网络不同尺度上的空间信息。这种设计促进了全面的特征学习过程,在医学图像中捕捉复杂的细节和更广泛的语义上下文。我们引入了一种新颖的集成机制,在VMamba块内确保编码器和解码器路径之间的无缝连接和信息流动,从而增强了分割性能。我们在公开可用的ACDC MRI心脏分割数据集和Synapse CT腹部分割数据集上进行了实验。结果表明,在相同的超参数设置下,Mamba-UNet在医学图像分割方面优于几种类型的UNet。

关键字

医学图像分割 · 卷积 · 变换器 · Mamba · 状态空间模型

2 方法

2.1 架构概述

所提出的Mamba-UNet的架构在图2中进行了概述,其灵感来自UNet和Swin-UNet。输入的2D灰度图像大小为H × W × 1,首先被分割成类似于ViT和VMamba的补丁,然后转换为1-D序列,尺寸为H/4 × W/4 × 16。一个初始的线性嵌入层将特征维度调整为任意大小,表示为C。这些补丁令牌随后通过多个VSS块和补丁合并层进行处理,创建层次化特征。每个编码器阶段的输出分辨率分别为H/4 × W/4 × C、H/8 × W/8 × 2C、H/16 × W/16 × 4C和H/32 × W/32 × 8C。解码器由VSS块和补丁扩展层组成,遵循编码器的风格,使得输出的特征大小完全相同,从而通过跳跃连接增强了在下采样过程中丢失的空间细节。在编码器和解码器中,每个阶段都使用了2个VSS块,并且在编码器中加载了预训练的VMamba-Tiny,遵循与Swin-UNet加载预训练的SwinViT-Tiny相同的过程。VSS块、编码器的补丁合并和解码器的补丁扩展的细节在以下小节中讨论。

2.2 VSS块

VSS网络块在图3中进行了说明,主要基于视觉Mamba。具体来说,传统的SSM作为线性时不变系统,通过隐藏状态h(t) ∈ RN,将x(t) ∈ R映射到y(t) ∈ R,给定A ∈ CN×N作为演化参数,B、C ∈ CN作为状态大小N的投影参数,以及跳跃连接D ∈ C1。该模型可以被公式化为线性常微分方程(ODEs),如方程1所示:

这个线性模型的离散版本可以通过零阶保持在一个时间尺度参数∆ ∈ RD下进行转换。

其中A = e^∆A, B = (e^∆A − I)A−1B, C = C, B, C ∈ RD×N。使用一阶泰勒级数对B进行精细化的近似B = ∆A(∆A)−1 ∆B = ∆B。视觉Mamba进一步引入了交叉扫描模块(CSM),然后将卷积操作集成到块中,详细内容见[7,16]。在VSS块中,输入特征首先通过一个线性嵌入层,然后分成两个路径。一个分支经过深度卷积和SiLU激活,然后进入SS2D模块,并在层归一化后与另一个经过SiLU激活的分支合并。这个VSS块不像典型的视觉变换器那样使用位置嵌入,而是选择一个没有MLP阶段的流线型结构,使得在相同的深度预算内可以堆叠更密集的块。

2.3 编码器

在编码器中,C维的标记化输入在降低分辨率的情况下经历了两个连续的VSS块进行特征学习,保持维度和分辨率。补丁合并作为下采样过程在Mamba-UNet的编码器中使用了三次,通过将输入分割成1/4的象限,将它们连接起来,然后每次通过layernorm归一化维度,将令牌数量减少1/2,并将特征维度加倍2倍。

2.4 解码器

与编码器相镜像,解码器使用两个连续的VSS块进行特征重建,使用补丁扩展层而不是合并层进行上采样深度特征[3]。这些层增强了分辨率(2倍上采样),同时将特征维度减半1/2,例如,一个初始层在重新组织和降低它们以增强分辨率之前将特征维度加倍。

2.5 瓶颈和跳跃连接

Mamba-UNet的瓶颈使用了两个VSS块。编码器和解码器的每个级别都采用了跳跃连接,将多尺度特征与上采样输出混合,通过合并浅层和深层来增强空间细节。随后的线性层保持了这个集成特征集的维度,确保与上采样分辨率的一致性。

3 实验和结果

声明

本文内容为论文学习收获分享,受限于知识能力,本文对原文的理解可能存在偏差,最终内容以原论文为准。本文信息旨在传播和学术交流,其内容由作者负责,不代表本号观点。文中作品文字、图片等如涉及内容、版权和其他问题,请及时与我们联系,我们将在第一时间回复并处理。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-10-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小白学视觉 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
超越传统 UNet ,GCtx-UNet 结合全局与局部特征,实现高效图像分割 !
自动化医学图像分割在提供有价值信息以预防、诊断、进展监测和预测各种疾病以及定量病理学评估中至关重要。目前,包括编码器、解码器和跳跃连接在内的U形深度神经网络在医学图像分割中应用最为广泛。尽管U形网络在许多医学图像分割任务中取得了最先进的表现,但仍然存在局限性。一个主要的局限性是编码器在有效提取和整合长距离和局部特征方面的能力。
AIGC 先锋科技
2024/07/08
1K0
超越传统 UNet ,GCtx-UNet  结合全局与局部特征,实现高效图像分割 !
LoG-V Mamba ,高效图像分割的新视角 !
医学图像分割(MIS)的目标是2D或3D医学图像中组织和病变的边界和定位。这一过程对于发展自动化疾病识别、分期和治疗,以及开发医学机器人至关重要。近年来,最先进的MIS方法基于深度学习(DL),得益于它从大量数据集中学习复杂模式的能力。这证明在医学应用中产生高质量性能至关重要 。
未来先知
2024/09/11
5410
LoG-V Mamba ,高效图像分割的新视角 !
xLSTM成功杀入医学图像分割领域,取代Mamba成为新SOTA!魔芯科技联合多单位推出
近年来,Mamba作为一种处理长距离依赖关系的计算模块,在医学图像分割领域取得了显著进展。而近期,来自浙江大学,魔芯科技,中科大等单位的研究人员将Mamba替换为xLSTM,提出 xLSTM-UNet(xLSTM-UNet can be an Effective 2D \& 3D Medical Image Segmentation Backbone with Vision-LSTM (ViL) better than its Mamba Counterpart),通过引入扩展长短期记忆网络(xLSTM),在多个医学图像分割任务中表现出色,超越了基于Mamba的模型!
CV君
2024/07/12
3670
xLSTM成功杀入医学图像分割领域,取代Mamba成为新SOTA!魔芯科技联合多单位推出
注意力驱动与卷积并行:KAN-Mamba FusionNet 优化医学图像分割技术 !
医学图像分割有助于准确地定位解剖结构特征,从而及时发现异常并实现患者治疗。最近对开发高级深度学习和计算机视觉方法的研究为解决疾病器官定位的挑战提供了一个途径。可靠的图像分割技术对于帮助医学专家做出明智的决策并提高诊断结果至关重要。这可能潜在地增加患者的寿命。
未来先知
2024/12/19
4480
注意力驱动与卷积并行:KAN-Mamba FusionNet 优化医学图像分割技术 !
提升图像分割精度:学习UNet++算法
https://cloud.tencent.com/developer/article/2465647?shareByChannel=link
忆愿
2024/11/25
7481
提升图像分割精度:学习UNet++算法
CM-UNet: 利用Mamba架构的高效全局上下文建模进行图像语义分割
远程遥感图像语义分割涉及将大规模遥感图像中的像素分类到不同的类别中,以增强对遥感(RS)数据的分析和解释。这种大规模的语义分割对于自动驾驶[1]、城市规划[2]、环境保护[3]以及其他许多实际应用都至关重要。
AIGC 先锋科技
2024/07/08
2.6K0
CM-UNet: 利用Mamba架构的高效全局上下文建模进行图像语义分割
UNeXt:第一个基于卷积和MLP的快速医学图像分割网络
UNeXt: MLP-based Rapid Medical Image Segmentation Network
Amusi
2022/04/18
2K0
UNeXt:第一个基于卷积和MLP的快速医学图像分割网络
Transformer又一城 | Swin-Unet:首个纯Transformer的医学图像分割模型解读
在过去的几年中,卷积神经网络(CNN)在医学图像分析中取得了里程碑式的进展。尤其是,基于U形结构和skip-connections的深度神经网络已广泛应用于各种医学图像任务中。但是,尽管CNN取得了出色的性能,但是由于卷积操作的局限性,它无法很好地学习全局和远程语义信息交互。
集智书童公众号
2021/05/28
4.5K0
STA-Unet 医学影像分割语义冗余的再思考
利用深度学习技术的进步,计算机视觉技术已成为医学图像分析的重要组成部分。在这些技术中,图像分割具有重大意义。具体而言,精确可靠的医学图像分割是计算机辅助诊断和影像引导手术操作的基础组成部分[5, 10]。
未来先知
2024/10/31
2620
STA-Unet 医学影像分割语义冗余的再思考
医学图像分割:UNet++
在这篇文章中,我们将探索UNet++: A Nested U-Net Architecture for Medical Image Segmentation这篇文章,作者是亚利桑那州立大学的Zhou等人。本文是U-Net的延续,我们将把UNet++与Ronneberger等人的U-Net原始文章进行比较。
AI算法与图像处理
2020/11/23
1.5K0
医学图像分割:UNet++
通过特征蒸馏与迭代学习改进 UNet 的图像分割能力!
医学图像分割是计算机辅助诊断和图像引导系统中的关键应用。近年来,深度学习已成为这一领域的主要方法,这主要归功于UNet[18]的里程碑式贡献。UNet通过利用编码器将语义信息投射到低级特征,以及解码器逐步将语义特征上采样到分割 Mask ,定义了一个通用的分割网络架构。其许多后续工作在卷积神经网络(CNN)的背景下扩展了这一想法。最近,许多研究引入了视觉 Transformer ,通过使用自注意力机制来解决CNN的限制。尽管ViT具有较大的感受野,并能捕获不同图像块之间的长距离依赖,但由于缺乏局部性,它难以保留细粒度的局部上下文。为了缓解这个问题,一些方法[8, 17]在UNet设计中引入了CNN和ViT之间的桥梁(即混合模型)。请注意,这些方法也带来了更多的计算复杂性和参数数量。过参数化是深度学习中的常见问题,通常导致特征冗余和特征表示不佳[6, 12, 13]。然而,这个问题在当前的医学分割模型中尚未正式研究或考虑。
未来先知
2024/08/08
6390
通过特征蒸馏与迭代学习改进 UNet 的图像分割能力!
从入门到精通UNet: 让你快速掌握图像分割算法
https://cloud.tencent.com/developer/article/2465647?shareByChannel=link
忆愿
2024/11/24
1.1K0
从入门到精通UNet: 让你快速掌握图像分割算法
LV-UNet 轻量级的图像分割模型!
医学图像分割,旨在准确界定解剖结构或异常,在疾病诊断和治疗计划中至关重要。与传统方法(如依赖于手工或半自动方法)相比,计算机辅助技术可以更高效。随着深度学习的发展,这些方法利用大型标注数据集和设计良好的神经网络学习复杂的图像表示和自动推理像素级标签,使得医学图像分割得到了革新。
未来先知
2024/10/21
6470
LV-UNet 轻量级的图像分割模型!
Mamba精神!只能说ICLR输麻了其实更新频率还可以再快一点点的
Github链接:https://github.com/yyyujintang/Awesome-Mamba-Papers/blob/main/README.md
NewBeeNLP
2024/03/06
1.2K0
Mamba精神!只能说ICLR输麻了其实更新频率还可以再快一点点的
UNet家族最强系列 | UNet、UNet++、TransUNet与SWin-UNet究竟哪个更强!!!
本文首发于 【集智书童】,白名单账号转载请自觉植入本公众号名片并注明来源,非白名单账号请先申请权限,违者必究。
集智书童公众号
2023/09/04
22.6K0
UNet家族最强系列 | UNet、UNet++、TransUNet与SWin-UNet究竟哪个更强!!!
Mamba-U-Net,集成 Mamba 模型的 3D图像分割,在标准U-Net中实现精确的 Voxel Level 交互 !
图像分割在医学影像分析中至关重要,通常作为检查解剖结构和手术计划的前期步骤 [2]。近年来,卷积神经网络(CNN) [25] 以及特别是 U-shaped 全卷积神经网络(FCNN) [31] 在研究社区中得到了广泛应用。尽管它们具有有效性,但自视觉 Transformer (vision transformers)爆发以来,FCNN已被由卷积和多头自注意力层组成的混合架构所取代,这些混合架构旨在减轻卷积操作的特征,即局部感受野问题,并依赖 Transformer 的注意力机制 [36]。文献中已经尝试在经典的 U-Net 中集成基于 Transformer 架构。即使这些方法在性能上有所提高,但注意力机制的平方级内存占用以及与数据需求相伴随的注意力机制的计算密集性使得这些方法在大规模 3D 体积的应用中并不理想。
未来先知
2024/11/11
6090
Mamba-U-Net,集成 Mamba 模型的 3D图像分割,在标准U-Net中实现精确的 Voxel Level 交互 !
医学图像分割 | U-Net网络及他的变体
今天来简单归纳一下,医学图像分割的内容,还有很多代表性的工作在之后的文章中不断更新,由于同一个网络结构可能在不同的数据集上表现出不一样的性能,在具体的任务场景中还是要结合数据集来选择合适的网络。
AI算法修炼营
2020/05/18
4.4K0
医学图像分割 | U-Net网络及他的变体
CFPFormer| 将特征金字塔与 Transformer 完美融合,显著提升图像分割与目标检测效果!
深度学习技术的出现,特别是像U-Net [20]这样的卷积神经网络(CNNs),通过提高图像分割和分析等任务的准确性和效率,显著推动了该领域的发展。这在现代医疗中发挥着关键作用,帮助临床医生进行准确诊断、治疗规划以及疾病监测。
集智书童公众号
2024/04/30
1.8K0
CFPFormer| 将特征金字塔与 Transformer 完美融合,显著提升图像分割与目标检测效果!
【魔改UNet系列】ID-UNet: 一种用于红外小目标分割的密集连接UNet架构
现有的基于CNN的方法在有效和高效地处理复杂场景中不同尺度的小型红外目标时面临挑战,主要是由于池化层引起的聚合效应。因此,关键的深层目标可能会丢失。为了应对这一挑战,本研究提出了一种红外深度密集连接网络,称为ID-UNet。具体来说,本研究设计了一个特征提取模块,名为红外小目标特征提取(ISTFE),嵌入在ID-UNet架构中,以实现深层高级和浅层低级特征之间的跨层和连续交互。ISTFE内的连续连接有助于在深层保留红外小目标的语义信息,以及在浅层保留分辨率信息。此外,UNet结构参数被压缩,与传统UNet配置相比,参数减少了81%。在三个典型的公共数据集上的评估结果表明,所提出的方法在分割指标上超越了所有其他方法,包括交集比(IoU)、归一化IoU(nIoU)和F1分数。所提出的方法实现了高精度分割和低计算需求的双赢。
小白学视觉
2024/10/31
3170
【魔改UNet系列】ID-UNet: 一种用于红外小目标分割的密集连接UNet架构
基于深度学习的自然图像和医学图像分割:网络结构设计
来源:知乎、极市平台、深度学习爱好者作者丨李慕清@知乎  https://zhuanlan.zhihu.com/p/104854615本文约5100字,建议阅读10分钟本文首先介绍一些经典的语义分割网络及其创新点,然后介绍网络结构设计在医学图像分割领域内的一些应用。 本文总结了利用CNNs进行图像语义分割时,针对网络结构的创新,这些创新点主要包括新神经架构的设计(不同深度、宽度、连接和拓扑结构)和新组件或层的设计。前者是利用已有的组件组装复杂的大型网络,后者是更偏向于设计底层组件。首先介绍一些经典的语义分割
数据派THU
2022/03/21
7860
推荐阅读
超越传统 UNet ,GCtx-UNet 结合全局与局部特征,实现高效图像分割 !
1K0
LoG-V Mamba ,高效图像分割的新视角 !
5410
xLSTM成功杀入医学图像分割领域,取代Mamba成为新SOTA!魔芯科技联合多单位推出
3670
注意力驱动与卷积并行:KAN-Mamba FusionNet 优化医学图像分割技术 !
4480
提升图像分割精度:学习UNet++算法
7481
CM-UNet: 利用Mamba架构的高效全局上下文建模进行图像语义分割
2.6K0
UNeXt:第一个基于卷积和MLP的快速医学图像分割网络
2K0
Transformer又一城 | Swin-Unet:首个纯Transformer的医学图像分割模型解读
4.5K0
STA-Unet 医学影像分割语义冗余的再思考
2620
医学图像分割:UNet++
1.5K0
通过特征蒸馏与迭代学习改进 UNet 的图像分割能力!
6390
从入门到精通UNet: 让你快速掌握图像分割算法
1.1K0
LV-UNet 轻量级的图像分割模型!
6470
Mamba精神!只能说ICLR输麻了其实更新频率还可以再快一点点的
1.2K0
UNet家族最强系列 | UNet、UNet++、TransUNet与SWin-UNet究竟哪个更强!!!
22.6K0
Mamba-U-Net,集成 Mamba 模型的 3D图像分割,在标准U-Net中实现精确的 Voxel Level 交互 !
6090
医学图像分割 | U-Net网络及他的变体
4.4K0
CFPFormer| 将特征金字塔与 Transformer 完美融合,显著提升图像分割与目标检测效果!
1.8K0
【魔改UNet系列】ID-UNet: 一种用于红外小目标分割的密集连接UNet架构
3170
基于深度学习的自然图像和医学图像分割:网络结构设计
7860
相关推荐
超越传统 UNet ,GCtx-UNet 结合全局与局部特征,实现高效图像分割 !
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档