前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >CVPR2022 | UCC:不确定性引导的十字头联合训练半监督语义切分

CVPR2022 | UCC:不确定性引导的十字头联合训练半监督语义切分

作者头像
一点人工一点智能
发布于 2022-12-27 02:05:21
发布于 2022-12-27 02:05:21
7590
举报

华为诺亚方舟实验室自动驾驶研究团队的最新自主研究成果《UCC: Uncertainty guided Cross-head Co-training for Semi-Supervised Semantic Segmentation》发表在计算机视觉领域的顶级会议CVPR 2022。

本研究以深度神经网络为依托,面向半监督语义分割,针对现有文献对半监督语义分割中伪标签中噪声高、类别不平衡以及标注数据和无标注数据中Domain GAP的问题,文章提出了Cross-head Co-Training的方法,考虑到了如何有效地利用一致性约束和self-training的方式联合训练对任务进行提升;利用Uncertainty过滤伪标签中的噪声,降低噪声对模型的影响;同时利用Cross-Set的增强方式降低标注数据和无标注数据分布差异的影响,避免了伪标签噪声、Domain GAP所带来的影响。

该方法具有较好的域适应、跨域能力,标注数据和无标注数据可以来自于不同分布的域,这一性质对深度神经网络的鲁棒性和分割结果的稳定性起到了重要作用。在训练过程中,利用Cross-head丰富特征提高其通用能力,有效地利用不同head之间输出来计算伪标签的Uncertainty,进而对其进行Pixel Level的加权。

本文将该半监督语义分割框架应用到Cityscapes、VOC2012数据集中,在投稿时均取得了各个Setting的SOTA。

图1:Cross-Head Co-Training框架

01 网络架构

本文提出的UCC方法可以充分利用一致性正则和伪标签训练的优势,利用二者联合训练从而大幅提升半监督语义分割的性能。图1是整体的网络结构图,图像进入一个共享的骨干网络后紧接着有两个不同的分割头独立完成分割任务。与用两个独立的模型相比,我们的这种方式可以学到一种更紧致的特征表达并且能进一步提升其泛化能力。

对于标注数据,我们对其进行弱增强并与真值计算损失。对于未标注数据,我们用弱增强后产生的伪标签来监督强增强的结果,并且在不同分割头之间交叉进行。

一方面,伪标签在扩大样本数据上很重要,另一方面,在强增强和弱增强之间施加约束可以充分利用一致性正则。紧接着为了抑制伪标签中噪声的影响,我们提出了估计不确定性并加权的UGRM模块用于无监督损失,可以在训练过程中鼓励置信度高的样本权重更大,反之则相反。此外,DCSCP被提出用来增强一致性训练中样本的多样性,同时可以处理长尾和分布不一致问题。

1.1 Cross Head

我们通过共享Backbone接着有两个不同的分割头作为我们的结构,Cross Head 网络可以进一步提高泛化能力,然后从不同的视图中学习更紧凑的特征。CM为Cross-Model,CH为Cross-Head。其中Cross-Head的性能会比Cross-Model高出1.03%,一方面是由于Cross-Head能够提升模型的泛化能力,另一方面也能学到不同的模型的View。

1.2 UGRM

利用不同Head之间预测的不一致性作为不确定性进行建模加权,我们的方法不仅能有效减轻伪标签的负面影响,同时也解决了错误累积问题。

Wm,ij为第i,j位置上的像素属于{1,…,C}的最大类别。Um,ij由下边的公式计算而来。

最后我们联合

作用于半监督训练损失,所以最后我们的总损失函数如下:

1.3 DCSCP

我们使用一种Cross-set的Copy Paste策略通过复制属于特定类别的所有像素并将它们粘贴到标注和未标注的图像上,能够处理标注数据和未标注数据之间分布不同的问题,同时也能够解决长尾问题。

02 实验结果

我们在Cityscapes和COCO数据集上均进行了验证,和Baseline相比,我们的方法在ResNet50作为Backbone的情况下分别在1/16,1/8,1/4和1/2上取得了10.74%,6.27%,4.50%,3.50%的精度提升;在ResNet101作为Backbone的情况下分别在1/16,1/8,1/4和1/2上取得了10.01%,6.41%,4.99%,3.87%的精度提升。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一点人工一点智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
CVPR2022 论文速递!半监督语义分割 + 少样本字体生成
CVPR2022论文和代码整理:https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo
AI算法与图像处理
2022/07/06
1.1K0
CVPR2022 论文速递!半监督语义分割 + 少样本字体生成
基于一致性的半监督语义分割方法:刷新多项SOTA,还有更好泛化性
机器之心专栏 机器之心编辑部 在本工作中,来自阿德莱德大学、乌鲁姆大学的研究者针对当前一致性学习出现的三个问题做了针对性的处理, 使得经典的 teacher-student 架构 (A.K.A Mean-Teacher) 在半监督图像切割任务上得到了显著的提升。 该研究已被计算机视觉顶会 CVPR 2022 大会接收,论文标题为《Perturbed and Strict Mean Teachers for Semi-supervised Semantic Segmentation》: 文章地址:https
机器之心
2022/08/25
3520
基于一致性的半监督语义分割方法:刷新多项SOTA,还有更好泛化性
CVPR 2021 | 北大&MSRA提出CPS:基于交叉伪监督的半监督语义分割
在这篇文章,我们将解读一下我们发表在CVPR 2021的工作CPS: Semi-Supervised Semantic Segmentation with Cross Pseudo Supervision. 我们提出的半监督语义分割算法,在Cityscapes数据集中,使用额外3000张无标注的图像,可以在val set达到82.4% mIoU (单尺度测试)。
Amusi
2021/06/09
1.9K0
CVPR 2021 | 北大&MSRA提出CPS:基于交叉伪监督的半监督语义分割
DAFormer | 使用Transformer进行语义分割无监督域自适应的开篇之作
DAFormer代表了UDA的一个重大进步。它在GTA→Cityscapes改善了10.8 mIoU、Synthia→Cityscapes提升了5.4 mIoU。
集智书童公众号
2022/05/26
2.8K0
DAFormer | 使用Transformer进行语义分割无监督域自适应的开篇之作
CVPR 2023 中的半监督学习:FixMatch 的升级版 UniMatch
我们首先回顾下发表在 NeurIPS 2020 上的 FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence,FixMatch 是一种更轻量的半监督分类方法。如下图所示,FixMatch 首先使用模型(带标签数据训练后的)对弱增强的未标记图像进行预测,生成伪标签。对于给定的图像,只有在模型产生高置信度的预测时,伪标签才会被保留。然后,在输入同一图像的强增强版本时,训练模型预测伪标签。
BBuf
2023/08/22
3.2K0
CVPR 2023 中的半监督学习:FixMatch 的升级版 UniMatch
HybridCR:基于混合对比正则化的弱监督3D点云语义分割(CVPR 2022)
HybridCR: Weakly-Supervised 3D Point Cloud Semantic Segmentation via Hybrid Contrastive Regularization
3D视觉工坊
2023/04/29
5810
HybridCR:基于混合对比正则化的弱监督3D点云语义分割(CVPR 2022)
半监督方法:不确定性感知自增强模型(MICCAI 2019)[github代码]
今天分享一篇发表在MICCAI 2019上的论文:Uncertainty-aware Self-ensembling Model for Semi-supervised 3D Left Atrium Segmentation (原文链接:[1],代码链接:[2])。
Minerva
2020/06/24
1.4K0
半监督方法:不确定性感知自增强模型(MICCAI 2019)[github代码]
CVPR 2019 Oral 论文解读 | 无监督域适应语义分割
基于深度学习的语义分割方法效果出众,但需要大量的人工标注进行监督训练。不同于图像分类等任务,语义分割需要像素级别的人工标注,费时费力,无法大规模实施。借助于计算机虚拟图像技术,如3D游戏,用户可以几乎无成本地获得无限量自动标注数据。然而虚拟图像和现实图像间存在严重的视觉差异(域偏移),如纹理、光照、视角差异等等,这些差异导致在虚拟图像上训练出的深度模型往往在真实图像数据集上的分割精度很低。
AI科技评论
2019/05/31
1.4K0
双边监督网络在半监督医学图像分割中的应用
Along He, Tao Li, Juncheng Yan, Kai Wang, Huazhu Fu
小白学视觉
2024/07/16
2650
双边监督网络在半监督医学图像分割中的应用
复旦大学提出SemiSAM | 如何使用SAM来增强半监督医学图像分割?这或许是条可行的路!
医学图像分割的目标是从医学图像(如器官和病变)中识别特定的解剖结构,这是为提供可靠的体积和形状信息并协助许多临床应用(如疾病诊断和定量分析)提供基础和重要的一步。尽管基于深度学习的方法在医学图像分割任务上表现出色,但大多数这些方法都需要相对大量的优质标注数据进行训练,而获取大规模的仔细 Token 数据集是不切实际的,尤其是在医学成像领域,只有专家能够提供可靠和准确的分割标注。此外,常用的医学成像模式如CT和MRI是3D体积图像,这进一步增加了手动标注的工作量,与2D图像相比,专家需要逐层从体积切片进行分割。
集智书童公众号
2024/01/03
1.8K0
复旦大学提出SemiSAM | 如何使用SAM来增强半监督医学图像分割?这或许是条可行的路!
TPAMI 2022|3D语义分割中域适应的跨模态学习
域适应是在标签稀缺时实现学习的一项重要任务。虽然大多数工作只关注图像模态,但存在许多重要的多模态数据集。为了利用多模态进行域适应,我们提出了跨模态学习,我们通过相互模仿来加强两种模态的预测之间的一致性。我们限定网络对标记的数据做出正确的预测,并对未标记的目标域数据进行跨模态的一致性预测。无监督和半监督的域适应 settings 的实验证明了这种新颖的域适应策略的有效性。具体来说,我们评估来自 2D 图像、3D 点云或两者都有的 3D 语义分割任务。我们利用最近的自动驾驶数据集来产生各种各样的域适应场景,包括场景布局上、光照上、传感器设置上、天气上的变化,以及 synthetic-to-real 的设置。在所有域适应场景中,我们的方法显著地改进了以前的单模态域适应的 baseline 。
3D视觉工坊
2022/06/28
1.4K0
TPAMI 2022|3D语义分割中域适应的跨模态学习
韩国高研院优化CLIP | 通过全局-局部训练方案解决CLIP中小目标丢失和Mask噪声问题
值得注意的是,所提出的该方法在Cityscapes测试数据集上实现了51.8%的“mIoU”,展示了其在驾驶场景数据集上的强大WSSS Baseline 的潜力。在CamVid和WildDash2上的实验结果表明,作者的方法在各种数据集上具有有效性,即使数据集较小或具有视觉挑战性条件。 代码:https://github.com/k0u-id/CARB
集智书童公众号
2024/04/12
7960
韩国高研院优化CLIP | 通过全局-局部训练方案解决CLIP中小目标丢失和Mask噪声问题
CVPR2021 | 重新思考BiSeNet让语义分割模型速度起飞(文末获取论文)
BiSeNet已被证明在实时分割two-stream网络中是有效的。但是,其添加额外path以对空间信息进行编码的原理很耗时,并且由于缺少任务专用设计,因此从预训练任务(例如图像分类)中借用的主干可能无法有效地进行图像分割。
集智书童公众号
2021/05/28
2.3K0
点云分割训练哪家强?监督,弱监督,无监督还是半监督?
近年来,自动驾驶领域的各项下游任务基本上都要求了对场景的语义理解,比如自动驾驶车辆要能够理解哪个是路面、哪个是交通灯、哪个是行人、哪个是树木,因此点云分割的作用就不言而喻。
3D视觉工坊
2023/04/29
9380
点云分割训练哪家强?监督,弱监督,无监督还是半监督?
弱监督三维点云语义分割研究综述
作者:Jingyi Wang, Yu Liu, Hanlin Tan, Maojun Zhang
一点人工一点智能
2023/11/15
6060
弱监督三维点云语义分割研究综述
ReliableStudent | 减轻噪声伪标签的半监督3D目标检测方法,超越 KITTI 3D目标检测在点云水平!
在深度学习近期发展的推动下,图像分类和目标检测领域已取得显著进展。大量数据集的可用性有助于加速这些进步。然而,为大规模数据集标注仍然是瓶颈,特别是对于2D和3D目标检测。半监督方法(SSA)已提出以解决此问题。与监督方法不同,这些方法仅需要有限数量的标注数据进行训练,其余数据未标注。
AIGC 先锋科技
2024/07/08
2610
ReliableStudent | 减轻噪声伪标签的半监督3D目标检测方法,超越 KITTI 3D目标检测在点云水平!
小样本利器1.半监督一致性正则 Temporal Ensemble & Mean Teacher代码实现
这个系列我们用现实中经常碰到的小样本问题来串联半监督,文本对抗,文本增强等模型优化方案。小样本的核心在于如何在有限的标注样本上,最大化模型的泛化能力,让模型对unseen的样本拥有很好的预测效果。之前在NER系列中我们已经介绍过Data Augmentation,不熟悉的童鞋看过来 中文NER的那些事儿4. 数据增强在NER的尝试。样本增强是通过提高标注样本的丰富度来提升模型泛化性,另一个方向半监督方案则是通过利用大量的相同领域未标注数据来提升模型的样本外预测能力。这一章我们来聊聊半监督方案中的一致性正则~
风雨中的小七
2022/06/06
1.2K0
小样本利器1.半监督一致性正则 Temporal Ensemble & Mean Teacher代码实现
OpenAI 研究员:数据不足时,如何实现监督学习
作者丨Lilian Weng 编译丨丛末 编辑丨陈彩娴 现实应用中,数据易得,而有标签的数据少有。 一般而言,当监督学习任务面临标签数据不足问题时,可以考虑以下四种解决办法: 1.预训练+微调:首先在一个大规模无监督数据语料库上对一个强大的任务无关模型进行预训练(例如通过自监督学习在自由文本上对语言模型进行预训练,或者在无标签图像上对视觉模型进行预训练),之后再使用一小组标签样本在下游任务上对该模型进行微调。 2.半监督学习:同时从标签样本和无标签样本中学习,研究者使用该方法在视觉任务上进行了大量研究。
AI科技评论
2022/07/19
9360
OpenAI 研究员:数据不足时,如何实现监督学习
CVPR 2022丨特斯联AI提出:用于视觉任务中无监督域自适应的类别对比
深度神经网络(Deep Neural Networks, DNNs)由于跨域不匹配(cross-domain mismatch),通常在新域表现不佳。而无监督域自适应(UDA)技术则可通过利用未标记的目标域样本缓解跨域不匹配问题。 近日,特斯联科技集团首席科学家邵岭博士及合作者们提出了基于类别对比的新颖方法Category Contrast (CaCo),并公布了所取得的最新研究成果。该方法在视觉UDA任务的实例判别之上引入了语义先验。该研究成果(标题为: Category Contrast for Uns
AI科技评论
2022/06/16
6360
CVPR 2022丨特斯联AI提出:用于视觉任务中无监督域自适应的类别对比
半监督辅助目标检测:自训练+数据增强提升精度(附源码下载)
计算机视觉研究院专栏 作者:Edison_G 近年来,半监督学习(SSL)受到越来越多的关注。在当没有大规模注释数据时,SSL提供了使用unlabel data来改善模型性能的方法。 公众号ID|ComputerVisionGzq学习群|扫码在主页获取加入方式 论文: https://arxiv.org/pdf/2005.04757.pdf 1 简要 半监督学习 (SSL) 有可能提高使用未标记数据的机器学习模型的预测性能。尽管最近取得了显着进展,但SSL的演示范围主要是图像分类任务。  在今天
计算机视觉研究院
2022/03/04
9860
推荐阅读
CVPR2022 论文速递!半监督语义分割 + 少样本字体生成
1.1K0
基于一致性的半监督语义分割方法:刷新多项SOTA,还有更好泛化性
3520
CVPR 2021 | 北大&MSRA提出CPS:基于交叉伪监督的半监督语义分割
1.9K0
DAFormer | 使用Transformer进行语义分割无监督域自适应的开篇之作
2.8K0
CVPR 2023 中的半监督学习:FixMatch 的升级版 UniMatch
3.2K0
HybridCR:基于混合对比正则化的弱监督3D点云语义分割(CVPR 2022)
5810
半监督方法:不确定性感知自增强模型(MICCAI 2019)[github代码]
1.4K0
CVPR 2019 Oral 论文解读 | 无监督域适应语义分割
1.4K0
双边监督网络在半监督医学图像分割中的应用
2650
复旦大学提出SemiSAM | 如何使用SAM来增强半监督医学图像分割?这或许是条可行的路!
1.8K0
TPAMI 2022|3D语义分割中域适应的跨模态学习
1.4K0
韩国高研院优化CLIP | 通过全局-局部训练方案解决CLIP中小目标丢失和Mask噪声问题
7960
CVPR2021 | 重新思考BiSeNet让语义分割模型速度起飞(文末获取论文)
2.3K0
点云分割训练哪家强?监督,弱监督,无监督还是半监督?
9380
弱监督三维点云语义分割研究综述
6060
ReliableStudent | 减轻噪声伪标签的半监督3D目标检测方法,超越 KITTI 3D目标检测在点云水平!
2610
小样本利器1.半监督一致性正则 Temporal Ensemble & Mean Teacher代码实现
1.2K0
OpenAI 研究员:数据不足时,如何实现监督学习
9360
CVPR 2022丨特斯联AI提出:用于视觉任务中无监督域自适应的类别对比
6360
半监督辅助目标检测:自训练+数据增强提升精度(附源码下载)
9860
相关推荐
CVPR2022 论文速递!半监督语义分割 + 少样本字体生成
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文