会议:CVPR2018
研究任务:场景语义分割
当前方法:
(1)目前分割任务主要应用的都是pixel-level prediction,考虑类别本身的所属类别,却因此孤立了像素和图片整体性,导致一些目标,类别出现一些预测为别的类别的像素,即出现一些类别噪声。
(2)当前的方法通过扩大感受野和利用多分辨率金字塔来提高分割性能,甚至将获取上下文信息等价为扩大感受野。
这篇文章:
(1)利用encode模块,提取图片的全局上下文信息,通过结合上下文信息给channel map加权重,从而利用全局信息进行分割。
(2)分类辅助分割的SE-Loss,依赖于场景于类别之间存在的关系来使分割任务变得简单,基于上下文信息缩减图片中出现的类别噪声,通过训练,学习到类别之间的相互依存关系,辅助判定类别出现的合理性,减小类别噪声,进行分割任务提高分割的准确率。
研究方法:
网络架构
网络细节:
Encode Encodeing Layer:参考论文:Deep ten: Texture encoding network.
EncNet:一个预训练的ResNet网络,在最后一层预测层,之前加入Encode encoding Layer编码全局上下文信息,结合上下文信息再对像素进行预测。
网络中的dilated以及SE-Loss设置:
分割结果:
(1)定性结果:
EncNet相比FCN,对图片类别噪声上处理效果好很多。
(2)定量结果
PASCAL-Context数据集:
PASCAL VOC 2012数据集:
ADE20K 数据集:
更多阅读笔记,参见AI灶网站
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有