Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Unet神经网络为什么会在医学图像分割表现好?

Unet神经网络为什么会在医学图像分割表现好?

作者头像
AI算法与图像处理
发布于 2019-10-14 08:03:51
发布于 2019-10-14 08:03:51
3.6K0
举报

重磅干货,第一时间送达

推荐文章【点击下面可直接跳转】:

2020 年校招,最值得加入的互联网公司有哪些?

本文转自知乎问答,已获作者授权转载,禁止二次转载。

问题:Unet神经网络为什么会在医学图像分割表现好?

https://www.zhihu.com/question/269914775

Unet网络在被提出后,就大范围地用于医学图像的分割。其能在医学图像展现优秀的性能和它本身网络结构存在怎样的一种联系?

专业回答

作者:王沈

https://www.zhihu.com/question/269914775/answer/586501606

这个问题在面试医疗影像算法岗位的时候,偶尔会提到,我这里提供一些个人的思考。问题中有两个关键词,【UNet】和【医疗影像】,接下来我们一一分析这两个关键词。

首先我们说说【UNet】。

UNet最早发表在2015的MICCAI上,短短3年,引用量目前已经达到了4070,足以见得其影响力。而后成为大多做医疗影像语义分割任务的baseline,也启发了大量研究者去思考U型语义分割网络。而如今在自然影像理解方面,也有越来越多的语义分割和目标检测SOTA模型开始关注和使用U型结构,比如语义分割Discriminative Feature Network(DFN)(CVPR2018),目标检测Feature Pyramid Networks for Object Detection(FPN)(CVPR 2017)等。

我们言归正传,UNet只是一个网络结构的代号而已,我们究其细节,到底UNet是由哪些组件构成的呢?

UNet的结构,我认为有两个最大的特点,U型结构和skip-connection(如下图)。

UNet的encoder下采样4次,一共下采样16倍,对称地,其decoder也相应上采样4次,将encoder得到的高级语义特征图恢复到原图片的分辨率。

相比于FCN和Deeplab等,UNet共进行了4次上采样,并在同一个stage使用了skip connection,而不是直接在高级语义特征上进行监督和loss反传,这样就保证了最后恢复出来的特征图融合了更多的low-level的feature,也使得不同scale的feature得到了的融合,从而可以进行多尺度预测和DeepSupervision。4次上采样也使得分割图恢复边缘等信息更加精细。

其次我们聊聊【医疗影像】,医疗影像有什么样的特点呢(尤其是相对于自然影像而言)?

1.图像语义较为简单、结构较为固定。我们做脑的,就用脑CT和脑MRI,做胸片的只用胸片CT,做眼底的只用眼底OCT,都是一个固定的器官的成像,而不是全身的。由于器官本身结构固定和语义信息没有特别丰富,所以高级语义信息和低级特征都显得很重要(UNet的skip connection和U型结构就派上了用场)。举两个例子直观感受下。

A.脑出血. 在CT影像上,高密度的区域就大概率是一块出血,如下图红色框区域。

B.眼底水肿。左图原图,右图标注(不同灰度值代表不同的水肿病变区域)。在OCT上,凸起或者凹陷的区域就大概率是一个水肿病变的区域。

2.数据量少。医学影像的数据获取相对难一些,很多比赛只提供不到100例数据。所以我们设计的模型不宜多大,参数过多,很容易导致过拟合。

原始UNet的参数量在28M左右(上采样带转置卷积的UNet参数量在31M左右),而如果把channel数成倍缩小,模型可以更小。缩小两倍后,UNet参数量在7.75M。缩小四倍,可以把模型参数量缩小至2M以内,非常轻量。个人尝试过使用Deeplab v3+和DRN等自然图像语义分割的SOTA网络在自己的项目上,发现效果和UNet差不多,但是参数量会大很多。

3.多模态。相比自然影像,医疗影像比较有趣和不同的一点是,医疗影像是具有多种模态的。以ISLES脑梗竞赛为例,其官方提供了CBF,MTT,CBV,TMAX,CTP等多种模态的数据。

这就需要我们更好的设计网络去提取不同模态的特征feature。这里提供两篇论文供大家参考。

Joint Sequence Learning and Cross-Modality Convolution for 3D Biomedical Segmentation(CVPR 2017) ,

Dense Multi-path U-Net for Ischemic Stroke Lesion Segmentation in Multiple Image Modalities.

4.可解释性重要。由于医疗影像最终是辅助医生的临床诊断,所以网络告诉医生一个3D的CT有没有病是远远不够的,医生还要进一步的想知道,病灶在哪一层,在哪一层的哪个位置,分割出来了吗,能求体积嘛?同时对于网络给出的分类和分割等结果,医生还想知道为什么,所以一些神经网络可解释性的trick就有用处了,比较常用的就是画activation map。看网络的哪些区域被激活了,如下图。

这里推荐两篇工作:周博磊老师的Learning Deep Features for Discriminative Localization(CVPR2016)和其实验室同学的 Deep Learning for Identifying Metastatic Breast Cancer(上图的出处)

(周博磊知乎主页:https://www.zhihu.com/people/zhou-bo-lei/activities)

BTW:没有偏题的意思,只是觉得医疗影像的特点和本问题息息相关,就一起总结了。

最后提一个问题,引发关注医疗影像的同学们思考和讨论?

前面有提到,UNet成为大多做医疗影像语义分割任务的baseline,也启发了大量研究者去思考U型语义分割网络。那UNet还有什么不足呢?欢迎大家关注我的项目UNet-family,寻找答案。

(相关链接:https://github.com/ShawnBIT/UNet-family)

同时也推荐,UNet++作者周纵苇的分享:研习Unet。

周纵苇知乎主页:https://www.zhihu.com/people/zongweiz/activities

研习Unet链接:https://zhuanlan.zhihu.com/p/44958351

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-10-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI算法与图像处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
医学图像分割 | U-Net网络及他的变体
今天来简单归纳一下,医学图像分割的内容,还有很多代表性的工作在之后的文章中不断更新,由于同一个网络结构可能在不同的数据集上表现出不一样的性能,在具体的任务场景中还是要结合数据集来选择合适的网络。
AI算法修炼营
2020/05/18
4.4K0
医学图像分割 | U-Net网络及他的变体
深度学习实战之医学图像分割
计算机视觉领域有三大问题:图像分类、目标检测以及图像分割。前两类问题及应用在公众号之前的文章里都有介绍,那么今天我们就来介绍剩下的图像分割问题,并以医学图像分割为例介绍它在现实中的应用。
用户1621951
2021/10/14
8.6K1
深度学习实战之医学图像分割
图像分割必备知识点 | Unet详解 理论+ 代码
语义分割(Semantic Segmentation)是图像处理和机器视觉一个重要分支。与分类任务不同,语义分割需要判断图像每个像素点的类别,进行精确分割。语义分割目前在自动驾驶、自动抠图、医疗影像等领域有着比较广泛的应用。
机器学习炼丹术
2020/12/02
9.6K1
UNet家族最强系列 | UNet、UNet++、TransUNet与SWin-UNet究竟哪个更强!!!
本文首发于 【集智书童】,白名单账号转载请自觉植入本公众号名片并注明来源,非白名单账号请先申请权限,违者必究。
集智书童公众号
2023/09/04
23.7K0
UNet家族最强系列 | UNet、UNet++、TransUNet与SWin-UNet究竟哪个更强!!!
深度学习如何在医学影像分割上大显神通?——分割网络的三个改进思路
一、医学影像分割有助于临床工作 图像分割在影像学诊断中大有用处。自动分割能帮助医生确认病变肿瘤的大小,定量评价治疗前后的效果。除此之外,脏器和病灶的识别和甄别也是一项影像科医生的日常工作。CT和磁共振的数据都是三维数据,这意味着对器官和病灶的分割就需要逐层进行。如果都是手工分割的话,会给医生带来繁重的工作量。实际上,已经有很多学者提出了许多医学影像的分割方法,但由于医学影像复杂,分割目标多变,仍有很多自动分割问题等待解决。 近年来深度学习在计算机视觉的各个细分邻域都取得了出色的成绩,那么,深度学习如何帮助医
企鹅号小编
2018/01/25
9.9K0
医学图像半监督分割Baselines
近年来,CNN在医学图像分割领域取得了统治级的地位,nnUNet及其各种魔改版本几乎霸占了各大比赛的leaderboard,但大多医学图像分割任务一直因为标注数量太少而饱受诟病。目前大多研究集中于调整网络结构等方面(加各种attention,各种feature fusion),希望在有限的数据上拟合出更加性能强悍的模型,而较少的去利用未标注数据来训练更加鲁棒和泛化性更好的模型(在临床场景下海量的未标注原始数据被保留在数据中心中,医生没有时间和精力对其大规模标注,只有少量数据会被标注用于临床或算法研究)。如何缓解标注图像数量太少,未标注数量太多和有效利用未标注的原始数据等问题,已然成为了医学图像分割发展的主要矛盾。
Amusi
2020/11/11
1.6K0
医学图像半监督分割Baselines
【魔改UNet系列】Mamba-UNet: 医学图像分割的UNet类纯视觉Mamba
在医学图像分析的最新进展中,卷积神经网络(CNN)和视觉变换器(ViT)树立了重要的基准。前者通过其卷积操作擅长捕捉局部特征,后者通过自注意力机制实现了显著的全局上下文理解。然而,这两种架构在有效建模医学图像中的长距离依赖方面都存在局限性,这对于精确分割至关重要。受Mamba架构的启发,该架构以其在处理长序列和全局上下文信息方面的专业性而闻名,并且作为状态空间模型(SSM),我们提出了Mamba-UNet,这是一种新颖的架构,它将UNet在医学图像分割中的能力与Mamba的能力相结合。Mamba-UNet采用了基于纯视觉Mamba(VMamba)的编码器-解码器结构,并注入了跳跃连接以保留网络不同尺度上的空间信息。这种设计促进了全面的特征学习过程,在医学图像中捕捉复杂的细节和更广泛的语义上下文。我们引入了一种新颖的集成机制,在VMamba块内确保编码器和解码器路径之间的无缝连接和信息流动,从而增强了分割性能。我们在公开可用的ACDC MRI心脏分割数据集和Synapse CT腹部分割数据集上进行了实验。结果表明,在相同的超参数设置下,Mamba-UNet在医学图像分割方面优于几种类型的UNet。
小白学视觉
2024/10/29
1.1K0
【魔改UNet系列】Mamba-UNet: 医学图像分割的UNet类纯视觉Mamba
医学图像分割:U-Net系列网络简介
在图像分割任务特别是医学图像分割中,U-Net[1]无疑是最成功的方法之一,该方法在2015年MICCAI会议上提出,目前已达到四千多次引用。其采用的编码器(下采样)-解码器(上采样)结构和跳跃连接是一种非常经典的设计方法。目前已有许多新的卷积神经网络设计方式,但很多仍延续了U-Net的核心思想,加入了新的模块或者融入其他设计理念。本文对U-Net及其几种改进版做一个介绍。
马上科普尚尚
2020/05/11
8K0
医学图像分割:U-Net系列网络简介
CP-UNet:基于轮廓的医学超声图像分割概率模型 !
超声成像广泛应用于各种疾病的诊断,由于其低成本、简单操作和非侵入性,因此在医学超声图像的病变分割中,基于深度学习的分割方法得到了应用。然而,由于超声图像中存在不均匀的病变区域分布、斑点噪声和成像伪迹,这增加了分割任务的难度。如图1(b)(c)(d)所示的病变与正常组织之间的结构边界线模糊,以及如图1(e)(f)所示的病变形状和纹理的不规则变化,都导致了轮廓模糊。这些因素共同影响了分割的准确性。
未来先知
2024/12/23
3910
CP-UNet:基于轮廓的医学超声图像分割概率模型 !
医学图像处理
医学图像处理的对象是各种不同成像机理的医学影像,临床广泛使用的医学成像种类主要有X-射线成像 (X-CT)、核磁共振成像(MRI)、核医学成像(NMI)和超声波成像(UI)四类。在目前的影像医疗诊断中,主要是通过观察一组二维切片图象去发现病变体,这往往需要借助医生的经验来判定。利用计算机图象处理技术对二维切片图象进行分析和处理,实现对人体器官、软组织和病变体的分割提取、三维重建和三维显示,可以辅助医生对病变体及其它感兴趣的区域进行定性甚至 定量的分析,从而大大提高医疗诊断的准确性和可靠性;在医疗教学、手术规划、手术仿真及各种医学研究中也能起重要的辅助作用[1,2]。目前,医学图像处理主要集中表现在病变检测、图像分割、图像配准及图像融合四个方面。
用户1150922
2019/07/10
3.7K0
为什么U-Net在医学图像上表现优越?
做图像分割方向的朋友,一定都用过U-Net,或者做分割方向研究的朋友们,也许都有过魔改U-Net的经历。作为2015年MICCAI上发表的一篇论文,U-Net目前在谷歌学术的引用是11487次,几乎做分割的人人都会引用。
AI算法与图像处理
2020/02/20
6.4K0
为什么U-Net在医学图像上表现优越?
双边监督网络在半监督医学图像分割中的应用
Along He, Tao Li, Juncheng Yan, Kai Wang, Huazhu Fu
小白学视觉
2024/07/16
3470
双边监督网络在半监督医学图像分割中的应用
超越UNet:TP-UNet引入时间Prompt实现高级医学图像分割 !
医学图像分割在现代医学领域占有重要地位,在疾病诊断、手术计划和治疗监测等方面发挥基础作用 [1]。该任务的主要目标是准确地分离和 Token 医学图像中呈现的特定结构或组织,以便医疗专业行人能够进行细致分析并实现精确诊断。值得注意的是,随着深度学习技术的进步,一些基于UNet及其变体的网络已经展示了通过提取医学图像中的语义信息来实现令人称赞的分割准确性 [2]。
未来先知
2024/12/19
3520
超越UNet:TP-UNet引入时间Prompt实现高级医学图像分割 !
Transformer又一城 | Swin-Unet:首个纯Transformer的医学图像分割模型解读
在过去的几年中,卷积神经网络(CNN)在医学图像分析中取得了里程碑式的进展。尤其是,基于U形结构和skip-connections的深度神经网络已广泛应用于各种医学图像任务中。但是,尽管CNN取得了出色的性能,但是由于卷积操作的局限性,它无法很好地学习全局和远程语义信息交互。
集智书童公众号
2021/05/28
4.6K0
超越传统 UNet ,GCtx-UNet 结合全局与局部特征,实现高效图像分割 !
自动化医学图像分割在提供有价值信息以预防、诊断、进展监测和预测各种疾病以及定量病理学评估中至关重要。目前,包括编码器、解码器和跳跃连接在内的U形深度神经网络在医学图像分割中应用最为广泛。尽管U形网络在许多医学图像分割任务中取得了最先进的表现,但仍然存在局限性。一个主要的局限性是编码器在有效提取和整合长距离和局部特征方面的能力。
AIGC 先锋科技
2024/07/08
1.1K0
超越传统 UNet ,GCtx-UNet  结合全局与局部特征,实现高效图像分割 !
吴博:目标检测集成框架在医学图像 AI 辅助分析中的应用 | AI 研习社第 78 期大讲堂总结
如何界定 AI 用于医学图像分析时的范畴,设置相关的任务及采用合理的模型方法?医学图像分析中目标检测任务的普遍性,使得开发目标检测集成框架显得必要。
朱晓霞
2022/03/04
1.5K0
吴博:目标检测集成框架在医学图像 AI 辅助分析中的应用 | AI 研习社第 78 期大讲堂总结
【图像分割应用】医学图像分割小总结
这是专栏《图像分割应用》的第4篇文章,本专栏主要介绍图像分割在各个领域的应用、难点、技术要求等常见问题。
用户1508658
2019/07/23
2.6K1
从入门到精通UNet: 让你快速掌握图像分割算法
https://cloud.tencent.com/developer/article/2465647?shareByChannel=link
忆愿
2024/11/24
1.2K0
从入门到精通UNet: 让你快速掌握图像分割算法
提升图像分割精度:学习UNet++算法
https://cloud.tencent.com/developer/article/2465647?shareByChannel=link
忆愿
2024/11/25
8811
提升图像分割精度:学习UNet++算法
CVPR 2017精彩论文解读:综合使用多形态核磁共振数据的3D生物医学图像分割方法 | 分享总结
论文的故事还在继续 相对于 CVPR 2017收录的共783篇论文,即便雷锋网(公众号:雷锋网) AI 科技评论近期挑选报道的获奖论文、业界大公司论文等等是具有一定特色和代表性的,也仍然只是沧海一粟,其余的收录论文中仍有很大的价值等待我们去挖掘,生物医学图像、3D视觉、运动追踪、场景理解、视频分析等方面都有许多新颖的研究成果。 所以我们继续邀请了宜远智能的刘凯博士对生物医学图像方面的多篇论文进行解读,延续之前最佳论文直播讲解活动,此次是第2篇。 刘凯博士是宜远智能的总裁兼联合创始人,有着香港浸会大学的博
AI研习社
2018/03/19
1.1K0
CVPR 2017精彩论文解读:综合使用多形态核磁共振数据的3D生物医学图像分割方法 | 分享总结
推荐阅读
相关推荐
医学图像分割 | U-Net网络及他的变体
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档