Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【视觉分类】开源 | Nvidia团队新作:合成zero-shot识别的因果视角!

【视觉分类】开源 | Nvidia团队新作:合成zero-shot识别的因果视角!

作者头像
CNNer
发布于 2021-01-27 07:44:53
发布于 2021-01-27 07:44:53
6670
举报
文章被收录于专栏:CNNerCNNer

论文地址: http://arxiv.org/pdf/2006.14610v2.pdf

代码: 公众号回复:09051337661

来源: NVIDIA, 巴伊兰大学

论文名称:A causal view of compositional zero-shot recognition

原文作者:Yuval Atzmon

内容提要

人们很容易识别新的视觉类别,这些视觉类别是已知组件的新组合。因为新组合的长尾支配着分布,所以这种组合泛化能力对于在视觉和语言等现实世界中的学习非常重要。不幸的是,学习系统很难与组成概括相结合,因为它们通常建立在与类标签相关的特征上,即使这些特征对类来说不是必需的。这将导致对来自新分布的样本进行一致的错误分类,就像已知组件的新组合一样。

这里我们描述了一种建立在因果观念上的组合概括方法。首先,我们从因果的角度来描述组合的zero-shot学习,并提出将zero-shot推理视为找出哪一种干预导致了图像?其次,我们提出了一个因果启发的嵌入模型,从相关的(混杂的)训练数据中学习视觉对象的基本成分的解缠表示。我们在预测属性-对象对的新组合的两个数据集上评估这种方法:一个控制良好的合成图像数据集和一个由细粒度类型的鞋子组成的真实数据集。我们的结果相比于强基准显示出改进。

主要框架及实验结果

声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请加上文微信联系删除。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CNNer 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
7 Papers & Radios | 因果研究大佬B Schölkopf论因果表示学习;OpenAI DALL·E官方论文
论文 1:Towards Causal Representation Learning
机器之心
2021/03/15
5820
7 Papers & Radios | 因果研究大佬B Schölkopf论因果表示学习;OpenAI DALL·E官方论文
结合GAN的零次学习(zero-shot learning)
采用GAN生成样本(生成seen和unseen样本), 提出新的Loss来测量生成样本质量(通过梯度信号), 促使生成样本更为真实.
公众号机器学习与AI生成创作
2020/04/28
9970
结合GAN的零次学习(zero-shot learning)
CVPR 19系列1 | 基于深度树学习的Zero-shot人脸检测识别(文末论文)
【导读】今天我们主要讲解零次学习及深度树学习用于人脸检测识别。今天主要会讲解人脸检测的13种欺骗攻击中的ZSFA(Zero-Shot Face Anti-spoofing)问题,包括打印、重放、3D掩码等,利用新的深度树网络(DTN),以无监督的方式将欺骗样本划分为语义子组。当数据样本到达、已知或未知攻击时,DTN将其划分到最相似的欺骗集群,并做出二进制决策。最后实验表明,达到了ZSFA多个测试协议的最新水平。
计算机视觉研究院
2019/07/09
1.9K0
CVPR 19系列1 | 基于深度树学习的Zero-shot人脸检测识别(文末论文)
Zero-Shot Learning 指南
深度学习有一个大问题: 它需要吞噬大量的数据,然后才能很好地泛化而变得实用。这实际上是深度学习的局限性之一,限制了它在数据不丰富或难以获得的许多领域的应用。
McGL
2020/10/30
9210
Zero-Shot Learning 指南
CVPR 19系列 | 基于深度树学习的Zero-shot人脸检测识别(文末论文)
【导读】今天我们主要讲解零次学习及深度树学习用于人脸检测识别。今天主要会讲解人脸检测的13种欺骗攻击中的ZSFA(Zero-Shot Face Anti-spoofing)问题,包括打印、重放、3D掩码等,利用新的深度树网络(DTN),以无监督的方式将欺骗样本划分为语义子组。当数据样本到达、已知或未知攻击时,DTN将其划分到最相似的欺骗集群,并做出二进制决策。最后实验表明,达到了ZSFA多个测试协议的最新水平。
计算机视觉研究院
2019/11/29
1.2K0
用自然语言教育人工智能:百度新算法发展出zero-shot学习能力
选自Baidu Research 机器之心编译 百度最新的研究使用监督学习和强化学习的组合开发了一个系统,该系统允许虚拟教师( virtual teacher)通过将语言与感知和行动连接起来而从头教授虚拟 AI 智能体语言,这一过程就类似于父母教导他们的小孩。读者可点击阅读原文下载此论文。 尽管有了极大的进步,人工智能在许多方面仍旧有限。例如,在计算机游戏中,如果 AI 智能体没用游戏规则预编程,在知道如何做出正确行为之前它需要进行百万次的尝试。人类能在非常短的时间内完成同样的成就,因为我们善于使用语言将过
机器之心
2018/05/07
5840
用自然语言教育人工智能:百度新算法发展出zero-shot学习能力
TRACE:因果事件建模助力视频理解大模型的时间定位能力
下班回家后你正深陷于一部两小时的综艺节目中,渴望找到那些让人捧腹的爆笑片段,却如同大海捞针。或者,在紧张刺激的足球赛中,你渴望捕捉到那决定性的绝杀瞬间,但传统 AI 视频处理技术效率低下,且模型缺乏泛化能力。为解决这些问题,香港中文大学(深圳)唐晓莹课题组联合腾讯 PCG 发布 TRACE 技术,通过因果事件建模为视频理解大模型提供精准的时间定位能力。
机器之心
2025/03/17
1000
TRACE:因果事件建模助力视频理解大模型的时间定位能力
【小样本识别】开源 | 基于动态蒸馏网络的无标签数据跨域Few-Shot识别
论文地址: http://arxiv.org/pdf/2106.07807v1.pdf
CNNer
2021/09/23
8540
没有指数级数据就没有Zero-shot!生成式AI或已到达顶峰
毕竟,随着数据和模型规模的增大、计算能力的增加,我们似乎不再怀疑拥有超强人工智能的未来。
新智元
2024/05/22
1810
没有指数级数据就没有Zero-shot!生成式AI或已到达顶峰
深度学习 | 论文笔记(Lifelong Zero-Shot Learning)
https://www.ijcai.org/Proceedings/2020/0077.pdf
Justlovesmile
2021/12/14
2K0
深度学习 | 论文笔记(Lifelong Zero-Shot Learning)
ImageNet零样本准确率首次超过80%,地表最强开源CLIP模型更新
虽然ImageNet早已完成历史使命,但其在计算机视觉领域仍然是一个关键的数据集。
CV君
2023/03/06
1.6K0
ImageNet零样本准确率首次超过80%,地表最强开源CLIP模型更新
[计算机视觉论文速递] 2018-06-19 CVPR 2018专场
这篇文章有4篇论文速递,都是CVPR 2018论文,包括zero-shot learning、图像合成和图像转换等方向。
Amusi
2018/07/24
7030
[计算机视觉论文速递] 2018-06-19 CVPR 2018专场
CVPR2021佳作 | One-Shot都嫌多,Zero-Shot实例样本分割
实例分割(Instance Segmentation)是视觉经典四个任务中相对最难的一个,它既具备语义分割(Semantic Segmentation)的特点,需要做到像素层面上的分类,也具备目标检测(Object Detection)的一部分特点,即需要定位出不同实例,即使它们是同一种类。因此,实例分割的研究长期以来都有着两条线,分别是自下而上的基于语义分割的方法和自上而下的基于检测的方法,这两种方法都属于两阶段的方法,下面将分别简单介绍。
计算机视觉研究院
2021/07/09
1.1K0
【动作识别】开源 | 基于语义感知的自适应知识蒸馏的传感器-视觉动作识别
论文地址: http://arxiv.org/pdf/2009.00210v5.pdf
CNNer
2021/12/05
7490
【动作识别】开源 | 基于语义感知的自适应知识蒸馏的传感器-视觉动作识别
过半作者是华人!Google Research全新图像表征模型ALIGN霸榜ImageNet
神经网络实际上就是在学习一种表示,在CV领域,良好的视觉和视觉语言(vision and vision-language)表征对于解决计算机视觉问题(图像检索、图像分类、视频理解)至关重要,并且可以帮助人们解决日常生活中的难题。
新智元
2021/05/28
7030
过半作者是华人!Google Research全新图像表征模型ALIGN霸榜ImageNet
生成模型得到的合成数据,对图像分类会有帮助吗?
今天新出了一篇很有意思的文章,来自香港大学、牛津大学、字节跳动的研究人员对合成数据是否对图像分类有帮助进行了细致研究,相信结论会给我们一些启发。
CV君
2022/11/28
6130
生成模型得到的合成数据,对图像分类会有帮助吗?
AI的下一个台阶——识别未知分类(ZSL方法)
摘要: 目前AI在图片分类方向已经做得非常优秀,有的甚至超过人类。但是,这仅仅限于模型经过已知样本的学习。令模型像人一样具有推理能力,通过已知样本可以对未知分类进行识别,这将是未来的一个主要方向,也是AI技术智能化的下一个台阶。
代码医生工作室
2020/02/24
4.4K0
ChatGPT要怎么微调?MIT韩松团队新作告诉你!
---- 新智元报道   来源:CVHub 作者:派派星 编辑:好困 【新智元导读】众所周知,迁移学习对于基础模型适应下游任务很重要。然而,对于许多的私有基础模型,数据所有者必须与模型所有者分享他们的数据以微调模型,这是非常昂贵的,并容易引起隐私问题(双向的,一个怕泄露模型,一个怕泄露数据)。此外,对大型基础模型进行微调是一项计算密集型的任务,这对于大多数下游用户来说是不现实的。 本文中,韩松团队提出了一个能够保护隐私且高效的迁移学习框架——Offsite-Tuning,可以将数十亿级参数的基础模型
新智元
2023/02/24
1.3K0
ChatGPT要怎么微调?MIT韩松团队新作告诉你!
【目标检测】开源 | 一种新的目标检测体系结构——基于卷积视觉变换的专注单镜头多盒检测器CvT-ASSD,性能良好,效率高!
论文地址: http://arxiv.org/pdf/2110.12364v1.pdf
CNNer
2022/02/09
3630
【目标检测】开源 | 一种新的目标检测体系结构——基于卷积视觉变换的专注单镜头多盒检测器CvT-ASSD,性能良好,效率高!
【点云分割】开源 | 激光视觉融合的小障碍物分割算法
论文地址: http://arxiv.org/pdf/2003.05970v1.pdf
CNNer
2021/04/22
8970
推荐阅读
7 Papers & Radios | 因果研究大佬B Schölkopf论因果表示学习;OpenAI DALL·E官方论文
5820
结合GAN的零次学习(zero-shot learning)
9970
CVPR 19系列1 | 基于深度树学习的Zero-shot人脸检测识别(文末论文)
1.9K0
Zero-Shot Learning 指南
9210
CVPR 19系列 | 基于深度树学习的Zero-shot人脸检测识别(文末论文)
1.2K0
用自然语言教育人工智能:百度新算法发展出zero-shot学习能力
5840
TRACE:因果事件建模助力视频理解大模型的时间定位能力
1000
【小样本识别】开源 | 基于动态蒸馏网络的无标签数据跨域Few-Shot识别
8540
没有指数级数据就没有Zero-shot!生成式AI或已到达顶峰
1810
深度学习 | 论文笔记(Lifelong Zero-Shot Learning)
2K0
ImageNet零样本准确率首次超过80%,地表最强开源CLIP模型更新
1.6K0
[计算机视觉论文速递] 2018-06-19 CVPR 2018专场
7030
CVPR2021佳作 | One-Shot都嫌多,Zero-Shot实例样本分割
1.1K0
【动作识别】开源 | 基于语义感知的自适应知识蒸馏的传感器-视觉动作识别
7490
过半作者是华人!Google Research全新图像表征模型ALIGN霸榜ImageNet
7030
生成模型得到的合成数据,对图像分类会有帮助吗?
6130
AI的下一个台阶——识别未知分类(ZSL方法)
4.4K0
ChatGPT要怎么微调?MIT韩松团队新作告诉你!
1.3K0
【目标检测】开源 | 一种新的目标检测体系结构——基于卷积视觉变换的专注单镜头多盒检测器CvT-ASSD,性能良好,效率高!
3630
【点云分割】开源 | 激光视觉融合的小障碍物分割算法
8970
相关推荐
7 Papers & Radios | 因果研究大佬B Schölkopf论因果表示学习;OpenAI DALL·E官方论文
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档