Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >NeurIPS 2024|腾讯优图实验室10篇论文入选,含持续学习、大型语言模型、深度伪造检测等研究方向

NeurIPS 2024|腾讯优图实验室10篇论文入选,含持续学习、大型语言模型、深度伪造检测等研究方向

作者头像
小腾资讯君
发布于 2024-10-23 01:05:33
发布于 2024-10-23 01:05:33
6750
举报

近期,第38届神经信息处理系统大会(NeurIPS 2024)公布了录取结果。会议共收到了15671篇有效论文投稿,共有超四千篇收录,录取率为25.8%。NeurIPS是CCF推荐的A类国际学术会议,在人工智能及计算机理论领域享有较高学术声誉。NeurIPS 2024将于12月9日至15日在加拿大温哥华举行,届时,众多学术界和工业界的专家将共聚一堂,探讨人工智能的最新进展。

今年,腾讯优图实验室共有10篇论文被录用,内容涵盖持续学习、大型语言模型、数据集浓缩、深度伪造检测等研究方向,展示了腾讯优图实验室在人工智能领域的技术能力和研究成果。

以下为腾讯优图实验室的入选论文概览:

01

DF40:面向下一代的深度伪造检测

DF40: Toward Next-Generation Deepfake Detection

Zhiyuan Yan (北京大学), Taiping Yao, Shen Chen, Yandan Zhao, Xinghe Fu, Junwei Zhu, Donghao Luo, Chengjie Wang, Shouhong Ding, Yunsheng Wu,  Li Yuan (北京大学)

我们构建了一个全新的综合基准,致力于推动当前深度伪造检测技术向下一代迈进。在深度伪造检测领域,大多数现有研究遵循一个普遍认可的方法来评估顶尖的检测算法:即在特定的数据集(例如FF++)上训练检测器,并在其他常用的深度伪造数据集上进行测试。这种研究协议通常被视为寻找最先进检测器的“黄金标准”。然而,这些在测试中脱颖而出的“佼佼者”是否真的能够应对现实世界中大量真实且多样化的深度伪造挑战?如果不能,又是什么潜在因素导致了这种差距?在本研究中,我们发现数据(包括训练和测试数据)可能是导致这一问题的主要原因,主要原因包括:

伪造多样性不足:深度伪造技术通常包括面部伪造(如换脸和面部重现)以及整个图像生成(如AIGC)。大多数现有的数据集只涵盖了部分类型,且实现的伪造方法有限。

伪造真实感不足:主流的训练数据集FF++包含的是五年前的伪造技术。仅通过这些旧技术的数据训练,难以确保能有效检测当前最先进的深度伪造。

评估协议的局限:大多数检测研究仅对一种类型的伪造进行评估,例如仅在换脸上进行训练和测试,这限制了通用深度伪造检测器的发展。

为了解决这一困境,我们构建了一个高度多样化且大规模的深度伪造基准,名为DF40,涵盖了40种不同的深度伪造技术。我们随后使用4种标准评估协议和7个代表性检测器进行了全面评估,总计超过2,000次评估。通过这些评估,我们从多个角度进行了深入分析,得出了12项对该领域具有重要贡献的新颖见解。此外,我们还提出了5个宝贵但此前未充分探索的研究问题,以启发未来的研究工作。

02

DiffusionFake:基于引导型稳定扩散模型提升泛化性深度伪造检测模型的泛化性

DiffusionFake: Enhancing Generalization in Deepfake

Detection via Guided Stable Diffusion

Ke Sun (厦门大学),Shen Chen,Taiping Yao,Hong Liu(大阪大学),Xiaoshuai Sun(厦门大学),Shouhong Ding,Rongrong Ji(厦门大学)

针对人工智能生成内容(AIGC)技术的快速发展,特别是Deepfake等换脸技术的广泛应用所带来的安全挑战, 本文提出了一种新颖的人脸篡改检测方法。本文通过分析Deepfake图像的生成过程,发现了一个关键洞见:Deepfake图像本质上融合了源图像和目标图像的信息,而真实图像则保持一致的身份特征。基于这一洞见,论文提出了DiffusionFake框架,这是一种即插即用的方法,通过利用预训练的Stable Diffusion模型来指导检测器学习Deepfake中固有的源和目标特征。DiffusionFake通过反转生成过程来增强现有检测器的泛化能力,无需额外的推理参数即可显著提高检测模型在未见数据集上的性能。实验结果表明,该方法在各种检测器架构上都取得了显著的跨域泛化性能提升,为应对日益复杂的人脸篡改技术提供了一种有效的解决方案。

03

SAFE: 慢速与快速高效微调在预训练模型上的持续学习

SAFE: Slow and Fast Parameter-Efficient Tuning for Continual Learning with Pre-Trained Models

Linglan Zhao, Xuerui zhang (浙江大学), Ke Yan, Shouhong Ding, Weiran Huang (上海交通大学)

数据流中持续学习新概念,同时抵抗遗忘旧知识,是人工智能领域的一个重要挑战。随着强大预训练模型的崛起,越来越多的研究者开始关注如何利用这些基础模型进行增量学习,而不是从零开始训练。现有的方法通常将预训练模型视为一个强大的初始点,并在增量学习的第一个阶段直接应用高效微调方法来适应下游任务。在随后的阶段,大多数方法选择冻结模型参数,以应对遗忘问题。然而,直接将高效微调策略应用于下游数据并不能充分挖掘预训练模型中的内在知识。此外,在后续增量阶段冻结参数会限制模型对第一阶段未覆盖的新概念的适应能力。为了解决上述问题,我们提出了一种基于快慢学习的新框架。具体来说,为了继承预训练模型中的通用知识,我们基于预训练模型中的通用知识对慢速子网络进行微调,使得慢速子网络可以捕捉到更多有用的特征,从而提高对新类别的泛化能力;此外,为了进一步融入新概念,我们在慢速子网络指引下持续更新快速子网络。通过集成两者的预测,整体框架在稳定性和可塑性之间取得平衡。在六个基准数据集上的大量实验验证了我们方法的有效性,显著超越了当前的最先进方法。

04

LLM-ESR: 大模型增强长尾序列推荐

LLM-ESR: Large Language Models Enhancement for Long-tailed Sequential Recommendation

Qidong Liu(西安交通大学), Xian Wu, Xiangyu Zhao(香港城市大学), Yejing Wang(香港城市大学), Zijian Zhang(香港城市大学), Feng Tian(西安交通大学), Yefeng Zheng(西湖大学)

顺序推荐系统(SRS)旨在基于用户的历史交互来预测用户的后续选择。然而,在现实系统中,大多数用户只与少数几个项目进行交互,而大部分项目很少被消费。这两个问题,被称为长尾用户和长尾项目挑战,常常给现有的SRS带来困难。因此解决它们至关重要。尽管有一些工作已经解决了这些挑战,但由于交互的内在稀缺,他们仍然在处理秋千或噪声问题上挣扎。大型语言模型(LLMs)的进步从语义角度为这些问题提供了一个有前景的解决方案。我们提出了大型语言模型增强顺序推荐(LLM-ESR)框架。这个框架利用从LLMs中得到的语义嵌入来增强SRS,而不增加额外的推理负担。为了解决长尾项目的挑战,我们设计了一个双视图建模框架,它结合了来自LLMs的语义和来自传统SRS的协作信号。对于长尾用户的挑战,我们提出了一种检索增强的自我蒸馏方法,使用来自相似用户的更多信息交互来增强用户偏好表示。为了验证我们提出的增强框架的有效性和通用性,我们在三个真实世界的数据集上使用三种流行的SRS模型进行了广泛的实验。结果一致地显示,我们的方法超过了现有的基线。实现代码可以在补充材料中找到。

05

Samba:用于跨域医学图像分级的严重度感知模型

Samba: Severity-aware Recurrent Modeling for Cross-domain Medical Image Grading

Qi Bi(西湖大学), Jingjun Yi(武汉大学), Hao Zheng, Wei Ji(耶鲁大学), Haolan Zhan(蒙纳士大学), Yawen Huang, Yuexiang Li(广西医科大学), Yefeng Zheng(西湖大学)

疾病分级是医学图像分析中的一项关键任务,但由于疾病的发展的连续性,同一级别内的个体间差异和相邻阶段之间的相似性使得准确的分期极具挑战。此外,在实际应用中,在有限的源域数据集上训练的模型要能够处理其他医院或中心的图像。而源域和目标域之间的特征分布可能存在显著差异,导致模型性能大幅下降。为了解决跨域疾病分级中的挑战,本文提出了一种基于严重度感知的分期模型(Samba)。由于大多数分级任务的核心目标是识别最严重的病灶,而这些病灶可能仅出现在图像的一小块区域,我们提出以序列的方式对图像块进行编码,借助状态空间模型以隐藏状态存储和传递严重度信息。此外,为了减轻域间差异的影响,本文设计了一种基于期望最大化(EM)的状态重校准机制,将表征映射到更紧凑的空间。我们通过高斯混合模型(GMM)对不同病灶的特征分布进行建模,并基于可学习的严重度感知基重构中间特征。大量实验表明,本文提出方法在不同医学模态下具有更强的跨域分级能力。

06

用于跨域语义分割的视觉基座模型频域微调方法

Learning Frequency-Adapted Vision Foundation Model for Domain Generalized Semantic Segmentation

Qi Bi(西湖大学), Jingjun Yi(武汉大学), Hao Zheng, Haolan Zhan(蒙纳士大学), Yawen Huang, Wei Ji(耶鲁大学), Yuexiang Li(广西医科大学), Yefeng Zheng(西湖大学)

视觉基座模型(VFM)的涌现为各种类下游任务提供了更强的固有域泛化能力。其中,域泛化语义分割(DGSS)的关键挑战在于跨域风格变化导致的域间差异,如不同城市景观和环境的变化。因此,在不同域风格下保持表征的不变性成为利用VFM进行DGSS的关键。经过Haar小波变换后的频率空间提供了一种可行的方式来解耦域特征中的内容和风格信息,具体的,内容和风格信息主要保留在该空间的低频和高频分量中。为此,我们提出了一种新颖的频率自适应学习方法,其总体思路是将冻结的基座模型特征在低频分支和高频分支中分别进行微调。前者用于巩固特定场景中内容相关的表示,而后者关注于风格变化并消除其对DGSS的影响。在多种DGSS设置上的实验表明,本文提出的方法具有领先的性能,并可适配于不同的VFM基座。

07

MedJourney: 大模型在患者流程中的评估

MedJourney: Benchmark and Evaluation of Large Language Models over Patient Clinical Journey

Xian Wu, Yutian Zhao, Yunyan Zhang, Jiageng Wu(浙江大学), Zhihong Zhu(北京大学), Yingying Zhang, Yi Ouyang, Ziheng Zhang, Huimin WANG, Zhenxi Lin, Jie Yang(哈佛医学院), Shuang Zhao(湘雅医院), Yefeng Zheng(西湖大学)

大型语言模型(LLMs)在语言理解和生成方面展示了显著的能力,在各种领域得到了广泛应用。其中,医疗领域特别适合LLMs的应用,因为许多医疗任务可以通过大模型得到增强。尽管存在用于评估LLMs在医疗问题回答和考试中的表现,但在评估LLMs在支持患者在整个医院访问过程中的表现方面,仍存在显著的差距。在本文中,我们通过将典型的患者医院访问过程划分为四个阶段来解决这个差距:计划、接入、交付和持续护理。对于每个阶段,我们都引入了多个任务,能够覆盖整个患者旅程,从而提供了对LLMs有效性的全面评估。我们还评估了三类LLMs对其的表现:1)专有的LLM服务,如GPT-4;2)公共的LLMs,如QWen;以及3)专门的医疗LLMs,如HuatuoGPT2。通过这种全面的评估。

08

Fetch and Forge:用于目标检测的数据蒸馏

Fetch and Forge: Dataset Condensation for Object Detection

Ding Qi(同济大学), Jian Li, Jinlong Peng, Bo Zhao(上海交通大学), Shuguang Dou(同济大学), Jialin Li, Jiangning Zhang, Yabiao Wang, Chengjie Wang, Cairong Zhao(同济大学)

数据集浓缩(DC)是一种新兴技术,能够从大型原始数据集中创建紧凑的合成数据集,同时保持相当的性能。这对加速网络训练和减少数据存储需求至关重要。然而,目前关于DC的研究主要集中在图像分类上,而对目标检测的探索较少。这主要是由于两个挑战:(i)目标检测的多任务特性使浓缩过程变得复杂;(ii)目标检测数据集的规模大、分辨率高,使现有的DC方法难以处理。为此,我们提出了DCOD,这是第一个针对目标检测的数据集浓缩框架。它分为两个阶段:获取(Fetch)和构建(Forge),最初将关键的定位和分类信息存储到模型参数中,然后通过模型反演重建合成图像。针对图像中多个对象的复杂性,我们提出了前景背景解耦,以集中更新多个实例的前景,并提出增量补丁扩展,进一步增强前景的多样性。在多个检测数据集上进行的广泛实验表明DCOD的优越性。即使在极低的压缩率1%下,我们在VOC和COCO上分别实现了46.4%和24.7%的AP@50,显著减少了检测器的训练时间。

09

基于扩散模型的人脸识别数据合成

ID^3:Identity-Preserving-yet-Diversified Diffusion Models for Synthetic Face Recognition

Jianqing Xu, Shen Li(NUS), Jiaying Wu(NUS), Miao Xiong(NUS), Ailin Deng(NUS), Jiazhen Ji, Yuge Huang, Guodong Mu, Wenjie Feng(NUS), Shouhong Ding, Bryan Hooi(NUS)

合成人脸识别 (SFR) 旨在生成模拟真实人脸数据分布的合成人脸数据集,从而允许以保护隐私的方式训练人脸识别模型。尽管扩散模型在图像生成方面具有巨大潜力,但当前基于扩散模型的 SFR 很难推广到现实世界的人脸。为了解决这一限制,我们列出了 SFR 的三个关键目标:(1) 促进跨身份的多样性(类间多样性),(2) 通过注入各种面部属性(类内多样性)来确保每个身份的多样性,以及 维护每个身份组内的身份一致性类内身份保存)。受上述目标的启发,我们引入了一种名为 ID^3 的扩散模型,用于SFR研究 。  ID^3 采用 ID 保留损失来生成多样化但身份一致的面部外观。从理论上讲,最小化这种损失相当于最大化 ID 保留数据的调整后条件对数似然的下界 。这种等价性激发了 ID 保留采样算法,该算法在调整后的梯度矢量场上运行 ,从而能够生成近似真实世界人脸分布的合成人脸识别数据集。我们在五个具有挑战性的基准上,广泛测试验证了 ID^3 的优势。

10

MambaAD: 探索用于多类别无监督异常检测的状态空间模型(高校合作)

Mambaad: Exploring state space models for multi-class unsupervised anomaly detection

Haoyang He (浙江大学), Yuhu Bai (浙江大学), Jiangning Zhang, Qingdong He, Hongxu Chen (浙江大学), Zhenye Gan, Chengjie Wang, Xiangtai Li (南洋理工大学), Guanzhong Tian (浙江大学), Lei Xie (浙江大学)

过去基于CNN和Transformer的结构的算法被广泛应用于异常检测领域取得了一定的效果。但是CNN无法处理长距离信息的关联性,而Transformer受限于其平方级别的计算复杂度。最近基于Mamba的模型凭借着其长距离建模的出色能力与线性计算复杂度引起了广泛的研究。在本文中,我们首次将Mamba应用于多类无监督异常检测领域并提出MambaAD如图1所示包含一个预训练的CNN编码器和由不同尺度的局部增强状态空间(LSS)模块成的Mamba解码器。被提出的LSS 模块包含并行的连续混合状态空间(HSS)模块和多核的卷积操作,能够同时具有长距离的建模能力与局部信息的建模能力。HSS模块所包含的混合扫描(HS)编码器将特征图编码至5种不同的扫描方式和8种不同的扫描方向并输送至SSM中建立全局的联系。其中我们采用了Hilbert扫描方式和8种扫描方向有利于提升特征序列的建模能力。大量实验表明,我们在6种不同异常检测数据集上、7种不同的指标上取得了SoTA,证明了Mamba AD方法了有效性。

论文链接:

https://arxiv.org/abs/2404.06564

项目主页:

https://lewandofskee.github.io/projects/MambaAD

项目主页:

https://github.com/lewandofskee/MambaAD

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
腾讯优图实验室22篇论文入选,含深度伪造检测、自回归视觉生成、多模态大语言模型等研究方向
近日, CVPR 2025(IEEE/CVF Conferenceon on Computer Vision and Pattern Recognition)论文录用结果揭晓,本次大会共2878篇被录用,录用率为22.1%。CVPR是计算机视觉领域的顶级国际会议,CCF A类会议,每年举办一次。CVPR 2025将于6月11日-15日,在美国田纳西州纳什维尔音乐城市中心召开。
小腾资讯君
2025/04/28
1430
ICLR 2025|腾讯优图实验室6篇论文入选,含多模态大语言模型、人脸识别等研究方向
近日,第 13 届 ICLR(International Conference on Learning Representations)国际学习表征会议公布了论文录用结果。本次大会共收到 11,565 篇有效论文投稿,录用率为 32.08%。
小腾资讯君
2025/03/19
2170
CVPR 2024 | 腾讯优图实验室20篇论文入选,含图文多模态大模型、高分辨视觉分割、跨模态生成、人脸识别等研究方向
近日,CVPR 2024 (IEEE Conference on Computer Vision and Pattern Recognition) IEEE国际计算机视觉与模式识别会议公布了论文录用结果。
CV君
2024/04/25
2.1K0
CVPR 2024 | 腾讯优图实验室20篇论文入选,含图文多模态大模型、高分辨视觉分割、跨模态生成、人脸识别等研究方向
AAAI 2024 | 腾讯优图实验室27篇论文入选,含表格结构识别、异常图像生成、医学图像分割等研究方向
AAAI 2024 (AAAI Conference on Artificial Intelligence) 人工智能国际会议于近日公布论文录用结果,本届会议共收到9862篇份论文投稿,最终录用2342篇论文,录用率23.75%。
小腾资讯君
2024/01/17
1.8K0
CVPR 2024 | 腾讯优图实验室20篇论文入选,含图文多模态大模型、高分辨视觉分割、跨模态生成、人脸识别等研究方向
近日,CVPR 2024 (IEEE Conference on Computer Vision and Pattern Recognition) IEEE国际计算机视觉与模式识别会议公布了论文录用结果。
小腾资讯君
2024/03/12
3.8K0
腾讯优图实验室7篇论文入选神经信息处理系统大会,含多模态查询、互联网图像监督学习等研究方向
NeurIPS 2023(Neural Information Processing Systems)神经信息处理系统大会于近日公布论文录用结果,根据官网邮件显示,本届会议共有12343篇有效论文投稿,接收率为 26.1%,高于 2022 年的 25.6%。
小腾资讯君
2023/10/10
8070
ICCV 2023 | 腾讯优图实验室16篇论文入选,含掌纹生成,人脸隐私保护,图像和谐化等研究方向
作为全球计算机领域顶级的学术会议之一,ICCV2023(International Conference on Computer Vision)国际计算机视觉大会将于今年10月在法国巴黎举行。近日,ICCV公布了论文录用结果,本届会议共有8068篇投稿,接收率为26.8%。
小腾资讯君
2023/08/01
1K0
ICCV 2023 | 腾讯优图实验室16篇论文入选,含掌纹生成,人脸隐私保护,图像和谐化等研究方向
ECCV 2024|腾讯优图实验室14篇论文入选,含工业缺陷异常检测、图文引导图像编辑、多模态标签等研究方向
近日,ECCV(European Conference on Computer Vision)组委会公布了录用论文名单,共有2395篇论文被录用,录用率27.9%。ECCV,即欧洲计算机视觉国际会议,是计算机视觉领域中最顶级的会议之一,与ICCV和CVPR并称为计算机视觉领域的“三大顶会”。ECCV每两年举行一次,会议内容广泛覆盖了计算机视觉的所有子领域,包括但不限于图像识别、物体检测、场景理解、视觉跟踪、三维重建、深度学习在视觉中的应用等。
公众号-arXiv每日学术速递
2024/07/31
7270
ECCV 2024|腾讯优图实验室14篇论文入选,含工业缺陷异常检测、图文引导图像编辑、多模态标签等研究方向
ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述,覆盖主流基准库、模型
本文作者包括香港大学的王天一、Kam Pui Chow,湖南大学的廖鑫 (共同通讯),圭尔夫大学的林晓东和齐鲁工业大学 (山东省科学院) 的王英龙 (第一通讯)。
机器之心
2025/02/03
1150
ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述,覆盖主流基准库、模型
NeurIPS 2023 | 腾讯 AI Lab 18 篇入选论文解读
NeurIPS 2023(Neural Information Processing Systems)神经信息处理系统大会是当前全球最负盛名的 AI 学术会议之一,将于 12 月 10 日在美国新奥尔良召开。官方信息显示,本届会议共有 12343 篇有效论文投稿,接收率为 26.1%,略高于 2022 年的 25.6%。
小腾资讯君
2023/12/11
9620
AAAI 2022 | 腾讯优图14篇论文入选,含图像着色、人脸安全、场景文本识别等前沿领域
12月1日,国际人工智能顶级会议AAAI 2022论文接受结果公布!本届会议共收到全球的9215篇投稿论文,接受率为15%。AAAI(Association for the Advance of Artificial Intelligence)是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。
优图实验室
2021/12/11
2.1K0
AAAI 2022 | 腾讯优图14篇论文入选,含图像着色、人脸安全、场景文本识别等前沿领域
CVPR 2022 | 腾讯优图实验室30篇论文入选,含场景文本语义识别、3D人脸重建、目标检测、视频场景分割和视频插帧等领域
近日,CVPR 2022官方公布了接收论文列表,来自腾讯优图实验室共计30篇论文被CVPR收录,论文涵盖包括场景文本语义识别、3D人脸重建、人体姿态估计 (HPE)、目标检测、图像风格转换、视频场景分割和视频插帧等研究领域。
优图实验室
2022/04/20
3K0
CVPR 2022 | 腾讯优图实验室30篇论文入选,含场景文本语义识别、3D人脸重建、目标检测、视频场景分割和视频插帧等领域
IJCAI 2022 放榜,腾讯优图实验室三篇论文入选
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 计算机视觉研究院专栏 作者:Edison_G 近日,AI顶级学术会议IJCAI 2022(人工智能国际联合会议,International Joint Conference on Artificial Intelligence)发布了论文录用结果。 转自腾讯腾讯优图 腾讯优图实验室共有三篇论文入选,内容涵盖语义分割、人脸伪造视频检测、神经头像合成等研究领域。文中提及的多项AI技术
计算机视觉研究院
2022/05/07
6170
IJCAI 2022 放榜,腾讯优图实验室三篇论文入选
想用GAN和Deepfake瞒天过海,没那么容易:这是Adobe和加州伯克利的新研究
近来,诸如生成对抗网络(GAN)的深度图像生成技术快速发展,引发了公众的广泛关注和兴趣,但这也使人们担心,我们会逐渐走入一个无法分辨图像真实与否的世界。
机器之心
2020/03/12
5430
想用GAN和Deepfake瞒天过海,没那么容易:这是Adobe和加州伯克利的新研究
EMNLP 2023 | 腾讯优图实验室3篇论文入选,含信息抽取、知识图谱编码等研究方向
近日,EMNLP 2023( Conference on Empirical Methods in Natural Language Processing)论文接收结果公布。本次会议共接收 4909 篇投稿,主会录用论文 1047 篇,录用率 21.3 %,高于2022年的20%。
小腾资讯君
2024/01/19
3500
EMNLP 2023 | 腾讯优图实验室3篇论文入选,含信息抽取、知识图谱编码等研究方向
RSAC 2024创新沙盒|Reality Defender:深度伪造检测平台
Reality Defender是2021年成立的一家专注于检测深度伪造(Deepfakes)和合成媒体(Synthetic Media)的初创公司,提供针对多种模态的深度伪造检测服务,其研发的检测工具适用于识别人工智能合成和伪造的文本、图像、视频和音频,为政府机构、金融企业、媒体以及其他大型组织提供深度伪造检测解决方案。Reality Defender的官网[1]提到其曾协助亚洲国家公共广播公司、跨国银行应对深度伪造引起的虚假信息传播和身份诈骗。
绿盟科技研究通讯
2024/05/09
1.1K0
RSAC 2024创新沙盒|Reality Defender:深度伪造检测平台
14篇论文入选CVPR!快手视觉研究成果精华总结
机器之心发布 机器之心编辑部 在正在进行的 CVPR 2021 上,快手有多篇论文被接收,涵盖三维视觉、目标检测、视频目标分割、人脸伪造技术检测等热门研究领域。 计算机视觉和模式识别领域的顶级会议 CVPR 正在进行中,本次大会接收率为 23.7%,其中快手有 14 篇论文被接收,这也是快手在国际视觉技术相关领域顶级会议上中稿最多的一次,研究成果数量的阶段性爆发标志着快手产学研合作从探索期逐步进入成熟期。 此次快手的中稿论文,涵盖了三维视觉、目标检测、视频目标分割、人脸伪造技术检测等热门研究领域,部分研究成
机器之心
2023/03/29
5490
14篇论文入选CVPR!快手视觉研究成果精华总结
用户界面开发自动化,新研究根据设计图自动生成用户界面属性|一周AI最火论文
呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!
大数据文摘
2020/02/12
4370
【学习】Deep Learning for Deepfakes Creation and Detection[通俗易懂]
论文题目:Deep Learning for Deepfakes Creation and Detection 翻译:基于深度学习的Deepfake创建与检测
全栈程序员站长
2022/08/24
1.2K0
【学习】Deep Learning for Deepfakes Creation and Detection[通俗易懂]
2020422 | 10篇计算机视觉检测分类相关论文(附GitHub代码)
Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection
代码医生工作室
2020/05/09
1.7K0
2020422 | 10篇计算机视觉检测分类相关论文(附GitHub代码)
推荐阅读
腾讯优图实验室22篇论文入选,含深度伪造检测、自回归视觉生成、多模态大语言模型等研究方向
1430
ICLR 2025|腾讯优图实验室6篇论文入选,含多模态大语言模型、人脸识别等研究方向
2170
CVPR 2024 | 腾讯优图实验室20篇论文入选,含图文多模态大模型、高分辨视觉分割、跨模态生成、人脸识别等研究方向
2.1K0
AAAI 2024 | 腾讯优图实验室27篇论文入选,含表格结构识别、异常图像生成、医学图像分割等研究方向
1.8K0
CVPR 2024 | 腾讯优图实验室20篇论文入选,含图文多模态大模型、高分辨视觉分割、跨模态生成、人脸识别等研究方向
3.8K0
腾讯优图实验室7篇论文入选神经信息处理系统大会,含多模态查询、互联网图像监督学习等研究方向
8070
ICCV 2023 | 腾讯优图实验室16篇论文入选,含掌纹生成,人脸隐私保护,图像和谐化等研究方向
1K0
ECCV 2024|腾讯优图实验室14篇论文入选,含工业缺陷异常检测、图文引导图像编辑、多模态标签等研究方向
7270
ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述,覆盖主流基准库、模型
1150
NeurIPS 2023 | 腾讯 AI Lab 18 篇入选论文解读
9620
AAAI 2022 | 腾讯优图14篇论文入选,含图像着色、人脸安全、场景文本识别等前沿领域
2.1K0
CVPR 2022 | 腾讯优图实验室30篇论文入选,含场景文本语义识别、3D人脸重建、目标检测、视频场景分割和视频插帧等领域
3K0
IJCAI 2022 放榜,腾讯优图实验室三篇论文入选
6170
想用GAN和Deepfake瞒天过海,没那么容易:这是Adobe和加州伯克利的新研究
5430
EMNLP 2023 | 腾讯优图实验室3篇论文入选,含信息抽取、知识图谱编码等研究方向
3500
RSAC 2024创新沙盒|Reality Defender:深度伪造检测平台
1.1K0
14篇论文入选CVPR!快手视觉研究成果精华总结
5490
用户界面开发自动化,新研究根据设计图自动生成用户界面属性|一周AI最火论文
4370
【学习】Deep Learning for Deepfakes Creation and Detection[通俗易懂]
1.2K0
2020422 | 10篇计算机视觉检测分类相关论文(附GitHub代码)
1.7K0
相关推荐
腾讯优图实验室22篇论文入选,含深度伪造检测、自回归视觉生成、多模态大语言模型等研究方向
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档