论文:ICNet for Real-Time Semantic Segmentation on High-Resolution Images
会议:ECCV2018
研究任务:本文设计的实时性分割模型ICNet可以在确保分割准确度的情况下保证分割的速度
设计算法的目标不仅希望模型准确率更高,效果更好,也是为了可以在实际生活中应用,而实时性分割能够保证算法的应用落地,与准确度相比也一样重要!
图解:
图中纵轴表示分割准确率,越往上,分割准确率越高,横轴表示分割的效率,越往右表示,分割效率越高,蓝线右侧表示模型已经达到实时性效果。由上图可以看出,比较出名的分割模型PSPNet和ResNet38模型,分割准确率高,但是效率不高,像实时性比较好的ENet分割效率高但是分割准确度还没有60%。
正是由于当前的模型没有综合考虑测试速度和分割准确率,本文希望设计ICNet解决这个问题,在保证分割准确率的同时提升分割速度。
定义卷积层中函数输入为:V(c,h,w)输出为:U(c',h',w'),其中c表示特征channels数目,h和w表示特征的尺寸。
则卷积操作复杂度为:
从公式中可以看出,模型中卷积层复杂度与模型输入的尺寸,卷积核的大小(一般为3,不分析),和channels数目有关。
分析下面这张图,不同的分辨率图片输入PSPNet50网络,观察每一个阶段的计算时间,由此,我们可以看出,模型中每层的复杂度同输入图像的分辨率和模型的channel数目有关,输入图片尺寸越大,卷积层channels数目越多,耗费时间越长。
根据上面分析的影响模型复杂度的因素,我们设计了基于PSPNet模型的多分辨率输入ICNet模型,将图片按一定比例缩放为不同的尺寸,将最小尺度的图片输入复杂度最高的分割模型,将高分辨率图片输入低复杂度模型,通过特征融合以及label指导训练,得到比较好的分割结果。
(1)Cascade Image Input : 模型的输入数据,将原始图片按1/2,1/4比例缩放,同原尺寸图片一起输入模型的不同分值
(2)Cascade Label Guidance: 模型的监督信息,按不同比例缩放的Label
(3)Cascade Feature Fusion(CFF):特征融合模块,融合不同分支,不同模块的特征
(4)上方:一个完整的PSPNet分割网络,输入尺寸最小的图片 --> 复杂度比较高
(5)中间:一系列卷积层,与上方部分网络共享网络参数,输入1/2的图片 --> 复杂度较低
(6)下方:通过3个卷积层对原尺寸图片进行下采样,再通过特征分类器对特征中每个像素进行分类 --> 复杂度较低
输入:F1(上一层的特征)、F2(本层的特征)以及Label(特定比例的Label)
操作:
①将F1上采样2倍,通过1*1的卷积层更改channels数目,再与Label利用加权softmaxloss计算loss。
②将F1上采样2倍利用3X3的Conv(dialted rate=2)更改channels数目,通过BatchNorm;将F2通过1X1的Conv更改channels数目,再通过BatchNorm;将上面得到的两个特征通过element-wise 相加,再通过ReLU,输出F2'.
从CFF模块中看到Loss的计算方法,计算公式如下:
每个分支均有相应的Label计算loss训练网络
Cityscapes数据集下的结果
由结果可知,ICNet在分割准确度和运行效率之间取得了很好的平衡,达到了预期目标
分析ICNet三个分支的作用,从左到右分别对应网络从上到下的分支
(1)channels数目和输入特征的尺度影响卷积层的复杂度
(2)模型存在三个分支,对应不同复杂度的模型以及不同尺度的输入图片
(3)一个完整的PSPNet模型,和两个分支优化分割结果
(4)低分辨率图片输入复杂度较高的模型,高分辨率的图片输入复杂度较低的模型,综合减小模型复杂度
(5)相邻的分支的特征进行匹配融合
(1)Downsampling Input(下采样输入图片)
下采样图片输入尺寸,送入PSPNet50模型,直接上采样至原始尺寸,结果粗糙,遗失了一些很小但是重要的细节。图中scale为图片下采样比例,可以看出,输入尺寸越小,模型准确度越低,但运行速度越快。
(2)Downsample Feature
按1:8、1:16、1:32的比例下采样图片特征
(3)Model Compression
通过压缩卷积核,从而压缩模型
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有