重磅干货,第一时间送达
语义分割(Semantic Segmentation)
语义分割(semantic segmentation)是计算机视觉中的基本任务,在语义分割中我们需要将视觉输入分为不同的语义可解释类别,「语义的可解释性」即分类类别在真实世界中是有意义的。例如,我们可能需要区分图像中属于汽车的所有像素,并把这些像素涂成蓝色。
注:语义分割简单粗暴理解就是对像素进行分类
本文简单介绍两篇很新的关于应用深度学习技术的语义分割论文给大家
~希望有助于你进一步学习。
《Dilated Temporal Fully-Convolutional Network for Semantic Segmentation of Motion Capture Data》
ACM SIGGRAPH 2018
dilated temporal fully-convolutional neural network
Dilated convolution
Abstract:运动捕捉序列的语义分割在许多数据驱动的运动合成框架中起着关键作用。 这是一个预处理步骤,其中运动捕捉序列的长记录被划分为较小的段。之后,可以将诸如统计建模的其他方法应用于每组结构相似的段以学习抽象运动流形。然而,分段任务通常仍然是手动任务,这增加了生成大规模运动数据库的工作量和成本。因此,我们提出了一种使用扩张的时间完全卷积网络的运动捕捉数据的语义分段的自动框架。我们的模型优于action segmentation中的最先进模型,以及用于序列建模的三个网络。 我们进一步显示我们的模型对高噪音训练标签是鲁棒的。
arXiv:https://arxiv.org/abs/1806.09174
《Effective Use of Synthetic Data for Urban Scene Semantic Segmentation》
ECCV 2018
Fusing foreground and background predictions
Qualitative results on Cityscapes
Abstract:训练深度网络以执行语义分割需要大量标记数据。为了减轻注释真实图像的手动工作,研究人员研究了合成数据的使用,这些数据可以自动标记。不幸的是,在合成数据上训练的网络在真实图像上表现得相对较差。虽然这可以通过域适应(domain adaptation)来解决,但是现有方法都需要在训练期间访问真实图像。在本文中,我们介绍了一种截然不同的处理合成图像的方法,这种方法不需要在训练时看到任何真实的图像。Our approach builds on the observation that foreground and background classes are not affected in the same manner by the domain shift, and thus should be treated differently。特别是,前者应该以基于检测的方式处理,以更好地解释这样的事实:虽然它们在合成图像中的纹理不是照片般逼真的,但它们的形状看起来很自然。我们的实验证明了我们的方法对Cityscapes和CamVid的有效性,仅对合成数据进行了训练。
arXiv:https://arxiv.org/abs/1807.06132
领取专属 10元无门槛券
私享最新 技术干货