作者:Andreas Pfeuffer,Klaus Dietmayer
摘要:语义分割是自动驾驶汽车等自动机器人的重要模块。与单个图像分割相比,视频分割方法的优点在于考虑了时间图像信息,并且由于这个原因,它们的性能增加。因此,单个图像分割方法由诸如卷积LSTM(convLSTM)单元的循环单元扩展,其被放置在基本网络架构中的适当位置。然而,基于递归神经网络的视频分割方法的主要批评是它们的大参数计数和它们的计算复杂性,因此,它们的一个视频帧的推理时间比它们的基本版本长达66%。受空间和深度可分离卷积神经网络成功的启发,我们在这项工作中为convLSTM推广了这些技术,从而显着减少了参数的数量和所需的FLOP。在不同数据集上的实验表明,使用所提出的修改的convLSTM细胞的分割方法实现了相似或稍差的准确度,但在GPU上比使用标准convLSTM细胞的分割方法快15%。此外,引入了新的评估度量,其测量分割的视频序列中的闪烁像素的量。
原文标题:Separable Convolutional LSTMs for Faster Video Segmentation
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。