DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs PAMI Code : http://liangchiehchen.com/projects/DeepLab.html
本文针对深度卷积模型用于语义分割存在的三个问题分别提出对应的解决方法。 问题1: reduced feature resolution 特征图分辨率降低 问题2 :目标的尺度多样性 问题3: 分割的精确性差
对于问题1,特征图分辨率降低的原因是 一系列的 max-pooling and downsampling,我们的解决方法:去除了网络后面的一些降采样,使用了 atrous convolution 来提高分辨率(就是 dilated convolution) 对于老大难多尺度问题2:multiple scales,这里我们参考 spatial pyramid pooling 思想,提出了 atrous spatial pyramid pooling 来解决 对于问题3,我们使用 Conditional Random Field (CRF) 来提高分割的精度
Model Illustration
一维 atrous convolution 示意图
二维 atrous convolution 示意图
Atrous Spatial Pyramid Pooling
Conditional Random Field (CRF)