Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >论文阅读: 2005.U2Net

论文阅读: 2005.U2Net

作者头像
JNingWei
发布于 2021-12-06 13:50:54
发布于 2021-12-06 13:50:54
3140
举报
文章被收录于专栏:JNing的专栏JNing的专栏

2005.09007:U2-Net: Going Deeper with Nested U-Structure for Salient Object Detection

  • 该网络用于轻量级的 SOD(显著目标检测,Salient Object Detection),能够取得出色的效果,同时模型文件较小,更适合于移动设备。

创新点

  • U-shape套娃:
    • 原有的U-shape架构套娃U-shape子架构,最终能取得十分出色的效果:
      • 原文表示甚至还能继续往下套娃(不过会too complicated to be implemented)。
      • 网络结构能做的更深,能够更好的利用更高分辨率下(更准确的说,多尺度下)的特征。
    • RSU(残差U形块,如图e):
      • 由于U型结构导致的计算开销很小,这是因为大多数操作是对下采样的特征进行。
      • 多尺度特征从逐渐下采样的特征图中提取,并通过逐渐上采样、拼接和卷积编码成高分辨率特征图。
      • 该过程减轻了由大规模直接上采样引起的精细细节的损失。
      • 参数L:
        • 更大的L会有更深的RSU块,更多的池化操作,更大范围的感受野和更丰富的局部和全局特征。
        • 使用不同L的RSU可以从具有任意空间分辨率的输入特征图中提取多尺度特征。
    • 第三步残差连接,也就是计算局部特征和多尺度特征的和。
  • 详细结构:
    • Backbone:
      • 结构中的一个个小U Net在文中称为U block,一共有11个(En_1~De_1):
      • En_1~En_4:U block的高度在逐渐降低(7,6,5,4),因为特征图的尺寸也在逐渐降低,如果此时高度仍不变的话则容易在深层造成特征丢失。实际上在代码中高度参数也是可以调整的,从而适应不同尺寸的原始输入,比如输入特征图尺寸更大的话则可以适当调高U block高度。
      • En_5~De_5: 此时由于特征图的尺寸已经很低了,因此U block中就没有再进行下采样上采样,防止特征损失,只使用空洞卷积来提取特征。
      • De_4~De_1: 与Encode部分基本对称,并且同样引入了skip connection。
    • Side Output:
      • 也就是中间Decoder的输出,在图中为S1~S6。由于低层的中间结果尺寸较低,因此也会采用双线性插值回原尺寸。最后对这六张结果(按通道)连接后进行1×1卷积压缩为单通道,获得最终的输出。
      • 这种利用中间结果的思想可能来源于HED(Holistically-Nested Edge Detection)。
    • Loss:
      • 直接使用的是BCE Loss,将六个side output与最终结果各自的bce loss进行平均。需要注意还是由于side output的尺寸较低,因此同样也会上采样再计算loss。
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/09/06 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
U^2 Net显著性检测分割抠图
论文:U^2 -Net: Going Deeper with Nested U-Structure for Salient Object Detection
烤粽子
2021/07/07
9890
U^2 Net显著性检测分割抠图
Tensorflow入门教程(三十八)——V2-Net
今天将分享Unet的改进模型U2-Net,改进模型来自2020年的论文《U2-Net: Going Deeper with Nested U-Structure for Salient Object Detection》,通过理解该模型思想,在VNet基础上可以做同样的改进。
医学处理分析专家
2020/06/29
1.4K0
论文回顾:U2-Net,由U-Net组成的U-Net
来源:DeepHub IMBA本文约1700字,建议阅读9分钟本文为你介绍2020年发布的一种称为 U²-Net 或 U-squared Net 的 U-net 变体。 分割给定图像中的不同对象一直是计算机视觉领域的一项非常重要的任务。多年来,我们已经看到像 Deeplab 这样的自编码器模型被用于语义分割。在所有分割模型中,仍然有一个名字居于首位那就是U-Net。U-Net 于 2018 年发布,从那时起它获得了巨大的普及,并以某种形式用于与分割相关的几个不同任务。在这篇文章中,我们将介绍2020年发布的
数据派THU
2022/03/08
1.7K0
一键智能抠图-原理与实现
有些朋友已经体验过了cvpy.net最近新上的一键智能抠图和换背景的功能,智能判断前景并自动抠图,效果还是挺惊艳的,放几张图看看效果:
OpenCV学堂
2020/09/08
2.5K0
一键智能抠图-原理与实现
论文阅读: 1908.HRNetv1
1908.07919:Deep High-Resolution Representation Learning for Visual Recognition
JNingWei
2021/12/06
3840
论文阅读: 1908.HRNetv1
U平方Net:深入使用嵌套的U型结构进行显著目标检测
作者设计了一个简单而强大的深层网络架构,U2-Net,用于显著目标检测(SOD)。作者的U2-Net的体系结构是一个两层嵌套的U型结构。设计具有以下优点:(1)它能够捕捉更多上下文信息从不同尺度的混合接受字段大小不同的在计划的剩余U-blocks (RSU),(2)它增加了整个架构的深度没有显著增加池的计算成本,因为这些RSU块中使用的操作。这种架构使作者能够从头开始训练一个深度网络,而不需要从图像分类任务中使用骨干。为了方便在不同的环境下使用,作者对所提出的架构U2- Net (176.3 MB, 30 FPS在GTX 1080Ti GPU上)和U2- Net+ (4.7 MB, 40 FPS)两个模型进行了实例化。这两种模型在6个SOD数据集上都具有竞争性能。
小白学视觉
2021/01/22
1.9K0
U平方Net:深入使用嵌套的U型结构进行显著目标检测
轮廓检测论文解读 | 整体嵌套边缘检测HED | CVPR | 2015
轮廓检测,对我这样的初学者而言,与语义分割类似。分割任务是什么我就不再赘述了,轮廓检测则是完成这样的一个任务:
机器学习炼丹术
2020/12/16
1.3K0
资深大佬:基于深度学习的图像边缘和轮廓提取方法介绍
导读 边缘和轮廓的提取是一个非常棘手的工作,细节也许就会被过强的图像线条掩盖,纹理(texture)本身就是一种很弱的边缘分布模式,分级(hierarchical)表示是常用的方法,俗称尺度空间(scale space)。以前做移动端的视觉平台,有时候不得不把一些图像处理功能关掉,原因是造成了特征畸变。现在CNN模型这种天然的特征描述机制,给图像预处理提供了不错的工具,它能将图像处理和视觉预处理合二为一。
AI算法与图像处理
2019/08/26
6.4K0
资深大佬:基于深度学习的图像边缘和轮廓提取方法介绍
U²-Net:使用显著性物体检测来生成真实的铅笔肖像画
铅笔素描肖像生成已出现作为Alberta大学的U²-Net的一个有趣和流行的新应用。自用于显著目标检测的新的深度网络架构开源以来,该项目的GitHub页面在三天内收到了超过2400颗星。
OpenCV学堂
2021/03/12
7920
U²-Net:使用显著性物体检测来生成真实的铅笔肖像画
【目标检测系列】CNN中的目标多尺度处理方法
【导读】本篇博文我们一起来讨论总结一下目标检测任务中用来处理目标多尺度的一些算法。视觉任务中处理目标多尺度主要分为两大类:
深度学习技术前沿公众号博主
2020/06/10
1.9K0
【目标检测系列】CNN中的目标多尺度处理方法
皱眉细节完美复刻,阿尔伯塔大学团队标星1.7K的项目生成超逼真的肖像画
从人脸图片生成艺术肖像画的 AI 应用不在少数,但效果惊艳的不多。上面这张图片中的输入 - 输出结果,来源于一个 GitHub 热门项目 U^2-Net (U square net),开源至今已经获得了 1.7K 的 star 量。
小白学视觉
2020/12/07
3750
皱眉细节完美复刻,阿尔伯塔大学团队标星1.7K的项目生成超逼真的肖像画
HED 和 RCF 图像边缘检测
虽然传统边缘检测算法在不断发展的过程中也取得了很大的进步,但仍然无法做到精细的边缘检测处理。随着近年来深度学习的快速发展,计算机视觉领域因此获益颇丰,当下最先进的计算机视觉应用几乎都离不开深度学习,深入我们生活的各个领域如目标检测、工业、农业、医疗等。由于深度学习的特性,使得它成为最适合处理计算机视觉任务的工具之一,特别是卷积神经网络(CNN),得益于它强大的自动学习能力,图像边缘检测任务得到了长足的发展,涌现出了许多优秀的方法,如 N4-field、DeepContour、HED、RCF,基于神经网络的边缘检测算法成为了研究热点之一。
EmoryHuang
2022/10/31
1.3K0
HED 和 RCF 图像边缘检测
简述Yolo系列网络的发展史
YOLOv1是单阶段目标检测方法,不需要像Faster RCNN这种两阶段目标检测方法一样,需要生成先验框。Yolo算法采用一个单独的CNN模型实现end-to-end的目标检测。
AIWalker
2021/07/05
1.6K0
简述Yolo系列网络的发展史
论文阅读理解 - Learning Feature Pyramids for Human Pose Estimation
Hourglass 网络以 feed-forward 方式学习每个 scale 的信息.
AIHGF
2019/02/18
1K0
《SegNet》论文阅读
2015年,Segnet模型由Vijay Badrinarayanan, Alex Kendall, Roberto Cipolla发表, 在FCN的语义分割任务基础上,搭建编码器-解码器对称结构,实现端到端的像素级别图像分割。
BBuf
2019/12/04
1K0
《SegNet》论文阅读
《DeepLab V3》论文阅读
本文首先回顾了空洞卷积在语义分割中的应用,这是一种显式调整滤波器感受野和控制网络特征响应分辨率的有效工具。为了解决多尺度分割对象的问题,我们设计了采用级联或并行多个不同膨胀系数的空洞卷积模块,以更好的捕获上下文语义信息。此外,我们扩充了在DeepLab V2中提出的ASPP模块,进一步提升了它的性能。并且我们还分享了一些训练系统方面的经验和一些实施方面的细节。
BBuf
2019/12/09
1.2K0
论文阅读理解 - Multi-Context Attention for Human Pose Estimation
整合多内容信息注意力机制(multi-context attention mechanism)到CNN网络,得到人体姿态估计 end-to-end 框架.
AIHGF
2019/02/18
1.4K0
CVPR2021 | 重新思考BiSeNet让语义分割模型速度起飞(文末获取论文)
BiSeNet已被证明在实时分割two-stream网络中是有效的。但是,其添加额外path以对空间信息进行编码的原理很耗时,并且由于缺少任务专用设计,因此从预训练任务(例如图像分类)中借用的主干可能无法有效地进行图像分割。
集智书童公众号
2021/05/28
2.3K0
语义分割 | 轻量级实时分割经典BiSeNet及其进化
基于轻量化网络模型的设计作为一个热门的研究方法,许多研究者都在运算量、参数量和精度之间寻找平衡,希望使用尽量少的运算量和参数量的同时获得较高的模型精度。目前,轻量级模型主要有SqueezeNet、MobileNet系列和ShuffleNet系列等,这些模型在图像分类领域取得了不错的效果,可以作为基本的主干网络应用于语义分割任务当中。
AI算法修炼营
2020/05/22
3.1K0
深度学习时代下的语义分割综述
http://www.tensorinfinity.com/paper_168.html
SIGAI学习与实践平台
2019/06/13
2.1K0
推荐阅读
相关推荐
U^2 Net显著性检测分割抠图
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档