前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >LiteSeg: 一种用于语义分割的轻量级ConvNet

LiteSeg: 一种用于语义分割的轻量级ConvNet

作者头像
3D视觉工坊
发布2020-12-11 16:37:21
9010
发布2020-12-11 16:37:21
举报
文章被收录于专栏:3D视觉从入门到精通

一、主要内容

本文介绍了一种用于语义图像分割的轻量级结构LiteSeg。论文探索了一个新的更深层的Atrous Spatial Pyramid Pooling module (ASPP),并应用了长短残差连接以及深度可分离卷积,从而得到了一个更快、更有效的分割模型。LiteSeg体系结构在多个backbone上进行测试,如Darknet19、MobileNet和ShuffleNet,在准确性和计算成本之间提供多重权衡。以MobileNetV2为主干网的LiteSeg模型,在Cityscapes数据集上针对640×360分辨率的图像以每秒161帧的速度,达到了67.81%的mIoU精度。

二、创新点

基于编解码结构、Atours Spatial Pyramid Pooling (ASPP)、空洞卷积和深度可分离卷积,论文设计了一种能够适应任何backbone的LiteSeg结构。通过选择不同的backbone,将允许在计算成本和精度之间进行权衡,以满足多种需求。

详细来说主要有两点:

  • 1、提出了一种实时有竞争力的网络结构,并用三种不同的backbone Darknet19、MobileNetV2和ShuffleNet进行了测试,在Cityscapes数据集上实现了70.75%、67.81%和65.17%的分割性能。
  • 2、新的更深层版本的ASPP模块经过调整并结合长短残差连接,可以更好地提升实验效果。

三、网络结构

下图所示的网络结构思想也比较简单,主要是不同膨胀率的空洞卷积和浅层深层特征连接,后期进行解码生成分割图。其实思想比较简单,但是可以将该思想广泛应用到不同backbone中~

四、实验结果

编码效果对比:

参数和fps对比:

Cityscapes数据集上实验结果对比:

可以发现,LightSeg结构有很大的优越性。

上述内容,如有侵犯版权,请联系作者,会自行删文。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-02-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 3D视觉工坊 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、主要内容
  • 二、创新点
  • 三、网络结构
  • 四、实验结果
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档