前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >资深大佬:基于深度学习的图像边缘和轮廓提取方法介绍

资深大佬:基于深度学习的图像边缘和轮廓提取方法介绍

作者头像
AI算法与图像处理
发布于 2019-08-26 08:32:45
发布于 2019-08-26 08:32:45
6.4K0
举报

作者:黄浴 链接:https://zhuanlan.zhihu.com/p/78051407 已授权转载,仅供学习分享,禁止二次转载

导读 边缘和轮廓的提取是一个非常棘手的工作,细节也许就会被过强的图像线条掩盖,纹理(texture)本身就是一种很弱的边缘分布模式,分级(hierarchical)表示是常用的方法,俗称尺度空间(scale space)。以前做移动端的视觉平台,有时候不得不把一些图像处理功能关掉,原因是造成了特征畸变。现在CNN模型这种天然的特征描述机制,给图像预处理提供了不错的工具,它能将图像处理和视觉预处理合二为一。

边缘提取

• HED

整体嵌套边缘检测(Holistically-Nested Edge Detection,HED 是一个深度学习的边缘提取的算法,两个特色:(1)整体图像训练和预测; (2)多尺度、多层特征学习。该深度模型利用全卷积网络,自动学习丰富的分层表示(基于侧面响应的深层监督指导)。

多尺度深度学习可分为四类,即多流学习(multi-stream)、跳网(skip-net learning)学习、多输入单模型以及独立网训练,如图所示:(a)多流架构; (b)跳网架构; (c)多尺度输入的单一模型; (d)不同网络独立训练; (e)HED,其中添加多个侧面输出。

在表示和计算复杂性方面,(a)-(d)方法存在冗余。(e)HED是一个相对简单的变体,能够从多个尺度产生预测。该结构可以被解释为(d)“独立网络”法的“整体嵌套”版,包括多个侧输出的单流深度网络。隐藏层监督可以改善图像分类任务的优化和泛化。如果需要统一输出,多侧向输出可以灵活地添加额外的融合层。

如图是HED的网络架构图,在卷积层之后插入侧输出层,在每个侧输出层施加深度监督,引导侧输出成为边缘预测。HED输出是多尺度多层,侧输出面变小,感受野变大。一个加权融合层自动学习如何组合来自多个尺度的输出。整个网络通过多个误差传播路径(虚线)训练。

下图给出HED的部分实验结果。(a)测试图像; (b)手工标注的边缘; (c)HED结果。(d)、(e)和(f)卷积神经网络的层2、3和4的侧边响应。(g)、(h)和(i)Canny边缘检测器在尺度σ= 2.0、σ= 4.0和σ= 8.0的边缘响应。HED与Canny在一致性方面显示出明显的优势。

• CASENet

CASENet将每个边缘像素与多于一个的边缘类相关联,是一种基于ResNet的端到端深度语义边缘学习的架构,同时也是一种跳层(skip-layer)架构,其中顶层卷积层的类别边缘激活共享并与底层特征的同一集融合,这里一种多标签损失函数来监督激活的融合。

三种CNN架构的比较如图(a)-(c)所示。图中实心矩形表示CNN层的组合块。宽度减小表示输出特征图的空间分辨率下降2倍。箭头旁边的数字表示输出特征的通道数。蓝色实心矩形是一堆ResNet块。紫色实心矩形是分类模块。红色虚线框表示输出由损失函数监控。灰色实心矩形是侧面特征提取模块。深绿色实心矩形是融合分类模块,执行K个分组1×1卷积。图(d)-(h)是图(a)-(c)中模块细节,其中矩形是输入和输出特征图。

图(a)是基础网络,采用全卷积网络框架,在ResNet-101删除平均池化和全连接层并保留底部卷积块;将ResNet-101中第一个和第五个卷积块(“res1”和“res5”)的步幅从2改为1;将扩张因子(dilation factors)引入后续的卷积层以保持原始ResNet相同的感受野;在基础网络的顶部,添加分类模块(图(d))作为1×1卷积层,然后是双线性上采样(由K分组反卷积层实现)产生一个K个激活图{A1,···,AK}的集合,其中每个激活图都与图像尺寸相同;然后,Yk(p)=σ(Ak(p))定义的sigmoid单元对像素属于第k类边缘的概率建模。

前面HED网络的基本思路是除了顶部网络损失以外还考虑底层卷积损失。另外,通过监督侧面激活的线性组合来获得融合边缘图。不过,HED仅执行二进制边缘检测。深度监督网络(DSN)扩展了这种架构,处理侧输出的K通道和最终输出的K通道,如图(b)所示。在该网络中,将上述分类模块连接到每个残差块的输出,产生5个侧分类激活图{A(1),.。。,A(5)},其中每个激活图都有K通道。然后,通过切片连接层(sliced concatenation layer)融合这5个激活图(图中颜色表示图(g)的通道索引)产生5K通道激活图:

Af馈入融合分类层,该分类层执行K-组 1×1卷积(图(f))产生K-通道激活图A(6)。最后,在激活图{A(1),...,A(6)}计算6个损失函数,为该网络提供深入监督。

由于监督5个侧面激活,隐含地约束了那些侧面激活的每个通道只带有该类别最相关的信息。由于切片级联和分组卷积,像素p的融合激活由下式给出:

CASENet采用嵌套式架构(nested architecture),改进点如下:

  • 1) 将底部分类模块更换为特征提取模块。
  • 2) 放置分类模块,仅在网络顶部施加监督。
  • 3) 采用共享串联(图(h))而不是切片连接。

侧面特征提取和侧面分类之间的区别在于前者仅输出单个通道特征图F(j)而不是K类激活。共享级联从Side-1-3复制底部特征F = {F(1),F(2),F(3)},分别与K个顶部激活的每一个相连接:

得到的连接激活图再被馈送到有K-分组卷积的融合分类层,产生K-通道激活图A(6)。

通常CASENet被认为是联合边缘检测和分类的网络,它让较低级的特征参与并通过跳层结构增强高级的语义分类。

下图是CASENet和DSN的结果比较,从左到右:输入,基础事实,DSN和CASENet。CASENet在具有挑战性的目标上显示出更好的检测质量,而DSN在非边缘像素有更多的误报。

轮廓提取

  • DeepEdge

以前大多使用纹理或显著性等低级特征来检测轮廓,而DeepEdge利用目标相关特征作为轮廓的高级线索检测。设计的是多级深度网络,由五个卷积层和一个分叉全连接子网络(bifurcated fully-connected subnetwork)组成。从输入层到第五个卷积层是预训练网络,直接用于图像输入的四个不同尺度。将这四个平行且相同的数据流连接到两个独立训练的分支组成的分叉子网络,一个分支学习预测轮廓似然(以分类为目标),而另一个分支训练学习在给定点轮廓的存在(基于回归测度),如图是DeepEdge架构图,其中Canny边缘检测器提取候选轮廓点,然后在每个候选点周围,提取四个不同尺度的补丁,同时通过预训练的KNet五个卷积层。

一个解释模型架构的单尺度示意图,在下图给出:首先,输入以候选点为中心的补丁,经过KNet五个卷积层;为了提取高级特征,在每个卷积层提取围绕中心点的特征图的小子容积,并在子容积上执行最大、平均和中心池化。池化值馈入分叉子网络。测试时,从分叉子网络的分支计算的标量输出做平均,生成最终轮廓预测。

如图给出部分实验结果:左到右依次为输入图像、Canny边缘检测器产生的候选点集合、非阈值预测、阈值预测和基础事实图。为了生成阈值预测,概率阈值设为0.5。

  • CEDN

另外一种方法利用全卷积编码器-解码器网络(CEDN),端到端训练的数据来自PASCAL VOC中修正的不准确的多边形标注,其网络架构如图所示。

部分实验结果见图: 从左到右依此是(a)输入图像,(b)GT轮廓,(c)具有预训练CEDN的轮廓检测,和(d)具有细调CEDN的轮廓检测。

参考文献

  • 1. G Bertasius, J Shi, L Torresani,“DeepEdge: A Multi-Scale Bifurcated Deep Network for Top-Down Contour Detection”, CVPR, 2015
  • 2. S Xie, Z Tu,“Holistically-Nested Edge Detection“, ICCV 2015
  • 3. W Shen et al.,“DeepContour: A Deep Convolutional Feature Learned by Positive-sharing Loss for Contour Detection”, CVPR 2015
  • 4. Z Yu et al.,“CASENet: Deep Category-Aware Semantic Edge Detection”, CVPR 2017
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI算法与图像处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
HED 和 RCF 图像边缘检测
虽然传统边缘检测算法在不断发展的过程中也取得了很大的进步,但仍然无法做到精细的边缘检测处理。随着近年来深度学习的快速发展,计算机视觉领域因此获益颇丰,当下最先进的计算机视觉应用几乎都离不开深度学习,深入我们生活的各个领域如目标检测、工业、农业、医疗等。由于深度学习的特性,使得它成为最适合处理计算机视觉任务的工具之一,特别是卷积神经网络(CNN),得益于它强大的自动学习能力,图像边缘检测任务得到了长足的发展,涌现出了许多优秀的方法,如 N4-field、DeepContour、HED、RCF,基于神经网络的边缘检测算法成为了研究热点之一。
EmoryHuang
2022/10/31
1.2K0
HED 和 RCF 图像边缘检测
参数极少、速度极快 , UHNet 轻量级边缘检测技术 !
边缘检测是计算机视觉中的关键基础技术,对各种医学图像处理领域产生了深远的影响,如X光片,CT扫描和MRI图像。这些图像包含丰富的结构信息,边缘是这些结构的重要表现。准确的边缘检测不仅有助于病理区域的精确定位,而且还为后续图像分析和诊断提供了强大的支持。因此,轻量、快速和高性能的边缘检测模型在实际部署场景中面临着越来越复杂的挑战。
未来先知
2024/08/14
3090
参数极少、速度极快 , UHNet 轻量级边缘检测技术 !
轮廓检测论文解读 | 整体嵌套边缘检测HED | CVPR | 2015
轮廓检测,对我这样的初学者而言,与语义分割类似。分割任务是什么我就不再赘述了,轮廓检测则是完成这样的一个任务:
机器学习炼丹术
2020/12/16
1.3K0
边缘检测论文笔记
摘要:这篇论文提出了一种基于FCNN和深度监督网络的新的边缘检测算法HED,它解决了两个重要的问题,1)整体图片的训练和预测,2)多尺度多层级的特征学习。HED能实现端到端的训练,输入一个图片,输出对应的边缘图片。
用户1332428
2018/07/30
9710
边缘检测论文笔记
汇总 | OpenCV4中的非典型深度学习模型
前面给大家分别汇总了OpenCV中支持的图像分类与对象检测模型,视觉视觉任务除了分类与检测还有很多其他任务,这里我们就来OpenCV中支持的非分类与检测的视觉模型汇总一下。注意一点,汇总支持的模型都是OpenCV4.4 Github上已经提供的,事实上除了官方的提供的模型,读者还可以自己探索更多非官方模型支持。这里的汇总模型主要来自OpenCV社区官方测试过的。
OpenCV学堂
2020/09/22
8290
汇总 | OpenCV4中的非典型深度学习模型
全卷积网络:从图像级理解到像素级理解
卷积神经网络(CNN):图像级语义理解的利器 自2012年AlexNet提出并刷新了当年ImageNet物体分类竞赛的世界纪录以来,CNN在物体分类、人脸识别、图像检索等方面已经取得了令人瞩目的成就。通常CNN网络在卷积层之后会接上若干个全连接层, 将卷积层产生的特征图(feature map)映射成一个固定长度的特征向量。 以AlexNet为代表的经典CNN结构适合于图像级的分类和回归任务,因为它们最后都期望得到整个输入图像的一个数值描述, 比如AlexNet的ImageNet模型输出一个1000
智能算法
2018/04/02
2.1K0
全卷积网络:从图像级理解到像素级理解
轮廓检测论文解读 | Richer Convolutional Features| CVPR | 2017
孪生网络入门(下) Siamese Net分类服装MNIST数据集(pytorch)
机器学习炼丹术
2021/01/05
8680
轮廓检测论文解读 | Richer Convolutional Features| CVPR | 2017
深度学习视觉研究综述
近年来,深度学习在计算机视觉各个领域中的应用成效显著,新的深度学习方法和深度神经网络模型不断涌现,算法性能被不断刷新。
算法进阶
2023/10/10
8010
深度学习视觉研究综述
图片修补 EdgeConnect 论文的阅读与翻译:生成边缘轮廓先验,再填补缺失内容
本文将要介绍的论文就是:EdgeConnect: Generative Image Inpainting with Adversarial Edge Learning,因为知乎在(2019-02-02)前,缺少详细介绍这篇论文的文章,而我最近需要复现它,所以顺便在这里对这篇论文进行介绍,毕竟还是中文母语阅读起来方便,关于翻译或者算法的指正与争议。
汀丶人工智能
2023/10/11
6260
图片修补 EdgeConnect 论文的阅读与翻译:生成边缘轮廓先验,再填补缺失内容
更丰富的卷积特征用于目标边缘检测
【导读】边缘检测是计算机视觉中的一个基本问题。近年来,卷积神经网络(CNNs)的出现极大地推动了这一领域的发展。现有的方法采用特定的深层CNN,但由于尺度和纵横比的变化,可能无法捕捉到复杂的数据结构。今天分享的paper提出了一种利用更丰富的卷积特征(RCF)来精确的边缘检测方法。
计算机视觉研究院
2019/07/19
1K0
基于 TensorFlow 在手机端实现文档检测
手机端运行卷积神经网络的一次实践 — 基于 TensorFlow 和 OpenCV 实现文档检测功能 1. 前言 本文不是神经网络或机器学习的入门教学,而是通过一个真实的产品案例,展示了在手机客户端上运行一个神经网络的关键技术点 在卷积神经网络适用的领域里,已经出现了一些很经典的图像分类网络,比如 VGG16/VGG19,Inception v1-v4 Net,ResNet 等,这些分类网络通常又都可以作为其他算法中的基础网络结构,尤其是 VGG 网络,被很多其他的算法借鉴,本文也会使用 VGG16 的基础
腾讯Bugly
2018/03/23
1.8K0
直观理解深度学习卷积部分
近几年随着功能强大的深度学习框架的出现,在深度学习模型中搭建卷积神经网络变得十分容易,甚至只需要一行代码就可以完成。
AI研习社
2018/07/26
5810
直观理解深度学习卷积部分
深度学习中的图像分割:方法和应用
基于人工智能和深度学习方法的现代计算机视觉技术在过去10年里取得了显著进展。如今,它被用于图像分类、人脸识别、图像中物体的识别、视频分析和分类以及机器人和自动驾驶车辆的图像处理等应用上。
OpenCV学堂
2020/12/08
3.4K0
深度学习中的图像分割:方法和应用
CP-UNet:基于轮廓的医学超声图像分割概率模型 !
超声成像广泛应用于各种疾病的诊断,由于其低成本、简单操作和非侵入性,因此在医学超声图像的病变分割中,基于深度学习的分割方法得到了应用。然而,由于超声图像中存在不均匀的病变区域分布、斑点噪声和成像伪迹,这增加了分割任务的难度。如图1(b)(c)(d)所示的病变与正常组织之间的结构边界线模糊,以及如图1(e)(f)所示的病变形状和纹理的不规则变化,都导致了轮廓模糊。这些因素共同影响了分割的准确性。
未来先知
2024/12/23
2970
CP-UNet:基于轮廓的医学超声图像分割概率模型 !
专栏 | 手机端运行卷积神经网络实践:基于TensorFlow和OpenCV实现文档检测功能
机器之心投稿 作者:腾讯 iOS 客户端高级工程师冯牮 本文作者通过一个真实的产品案例,展示了在手机客户端上运行一个神经网络的关键技术点。 前言 本文不是神经网络或机器学习的入门教学,而是通过一个真实的产品案例,展示了在手机客户端上运行一个神经网络的关键技术点。 在卷积神经网络适用的领域里,已经出现了一些很经典的图像分类网络,比如 VGG16/VGG19,Inception v1-v4 Net,ResNet 等,这些分类网络通常又都可以作为其他算法中的基础网络结构,尤其是 VGG 网络,被很多其他的算法借鉴
机器之心
2018/05/07
1.4K0
专栏 | 手机端运行卷积神经网络实践:基于TensorFlow和OpenCV实现文档检测功能
OpenCV4中调用HED边缘检测算法
图像边缘检测是图像处理与计算机视觉领域最基础也是最重要的任务之一,早期的Canny边缘检测到现在还在使用,但是Canny边缘检测过于依赖人工阈值的设定,无法在通用场景下工作,如何找到一个在自然场景下可以正确工作的边缘检测器,答案是使用CNN。2015年的时候有人提出了基于卷积神经网络的边缘检测算法HED全称为《Holistically-Nested Edge Detection》, 先看一下HED与Canny的效果对比:
OpenCV学堂
2019/06/14
4.4K1
OpenCV4中调用HED边缘检测算法
在OpenCV中基于深度学习的边缘检测
分析了Canny的优劣,并给出了OpenCV使用深度学习做边缘检测的流程,文末有代码链接。
AI算法与图像处理
2021/01/20
1.9K0
在OpenCV中基于深度学习的边缘检测
深度学习的卷积
近年来,随着一些强大、通用的深度学习框架相继出现,把卷积层添加进深度学习模型也成了可能。这个过程很简单,只需一行代码就能实现。但是,你真的理解“卷积”是什么吗?当初学者第一次接触这个词时,看到堆叠在一起的卷积、核、通道等术语,他们往往会感到困惑。作为一个概念,“卷积”这个词本身就是复杂、多层次的。
bye
2020/12/29
3630
深度学习图语义分割的综述
图像分割是计算机视觉和机器学习领域发展最快的领域之一,包括分类、分类与定位、目标检测、语义分割、实例分割和Panoptic分割。
算法进阶
2023/12/26
6790
深度学习图语义分割的综述
AI降维打击人类画家,文生图引入ControlNet,深度、边缘信息全能复用
来源:机器之心 本文约2000字,建议阅读5分钟 本文提出了一种端到端的神经网络架构 ControlNet,该架构可以通过添加额外条件来控制扩散模型。 通过「添加额外条件」来控制扩散模型,斯坦福大学最新的一项研究让图生图效果更上了一层楼。 随着大型文本 - 图像模型的出现,生成一幅吸引人的图像已经变得非常简单,用户需要做的就是动动手指输入简单的 prompt 就可以。通过一系列操作得到图像后,我们不免又会产生这样几个问题:基于 prompt 生成的图像能够满足我们的要求吗?我们应该构建怎样的架构来处理用户提
数据派THU
2023/03/29
4030
AI降维打击人类画家,文生图引入ControlNet,深度、边缘信息全能复用
推荐阅读
相关推荐
HED 和 RCF 图像边缘检测
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档