Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >北京大学 | 三维高斯溅射隐写术

北京大学 | 三维高斯溅射隐写术

作者头像
CV君
发布于 2024-06-17 05:54:55
发布于 2024-06-17 05:54:55
2940
举报

本篇分享论文GS-Hider: Hiding Messages into 3D Gaussian Splatting,三维高斯溅射隐写术。

详细信息如下:

  • 论文信息:Xuanyu Zhang, Jiarui Meng, Runyi Li, Zhipei Xu, Yongbing Zhang, Jian Zhang*. GS-Hider: Hiding Messages into 3D Gaussian Splatting. (*通讯作者)
  • 论文网站:https://arxiv.org/pdf/2405.15118
  • 项目网址:https://xuanyuzhang21.github.io/project/gshider/

图1:应用场景。3DGS训练者(Alice)需要原始场景与待隐藏场景的训练视图来训练我们的GS-Hider,这包括一个3DGS点云文件、场景解码器和信息解码器。之后,Alice会将3DGS点云文件和场景解码器上传至网络。3DGS用户(Bob)能够渲染查看原始三维场景,但只有用于信息提取器的训练者有权提取隐藏的三维场景,以此实现版权保护或秘密通信。

作为计算机视觉与图形领域的前沿技术,三维场景重建与新视角合成在电影制作、游戏引擎虚拟现实自动驾驶等领域发挥着至关重要的作用。特别是,三维高斯溅射(3D Gaussian Splatting,简称3DGS)因其优秀的保真度和实时的渲染速度,已成为三维渲染的主流方法。

鉴于3DGS的渲染成本极高,保护三维资产的版权与隐私显得尤为重要。作为版权保护领域内广为研究的技术,数字水印与隐写术旨在以不可见的方式将音频、图像或比特等信息隐藏于数字内容中。

在解密过程中,仅接收方通过预定义的解密操作才能从载体中恢复出秘密信息。因此,一个直观的想法是,我们能否设计一种针对3DGS的隐写术方法,用以保护三维场景的版权与隐私呢?

与神经辐射场(NeRF)不同,3DGS具有两大显著特点:

  1. 显式的三维表示;
  2. 实时的渲染速度。

这些特性使得3DGS的点云文件能够被直接上传到网上以供实时渲染,公开且透明,每个高斯点都具有明确的物理意义。因此,在将信息嵌入到3DGS点云文件的同时,确保原始三维场景的安全性与保真度是一项极其艰巨的挑战。

任务定义

由于NeRF隐式表示的渲染速度较慢,用户通常只能在线上访问少数离散渲染的视角,而非获取整个NeRF模型权重。因此,NeRF训练者通常需要将信息嵌入模型权重中,并确保从每个渲染的二维视角中能够提取出相同图像或比特信息。

然而,对于3DGS隐写而言,由于其具备实时渲染能力,训练好的点云文件可能会直接上传至网络。因此,我们的任务设定是在拟合原始三维场景获得容器3DGS的过程中隐藏信息,随后从该容器3DGS中提取嵌入的信息。

与NeRF隐写术设置的不同之处在于:

  1. 我们的提取过程需要获取整个3DGS点云文件;
  2. 我们不仅仅追求从渲染出的二维视角中提取信息,更侧重于在更本质的3D高斯点中进行隐藏与提取。

特别地,根据不同的目的,我们的隐藏信息可以分为以下几类:

  • 加密通信:在原始三维场景中隐藏其他三维场景。我们利用原始三维场景来保护秘密三维场景,防止被恶意窃取和提取。
  • 版权保护:在3DGS的固定视角中隐藏图像。通过预先添加的版权图像与解码后的图像对比,验证3DGS的所有权。

图2:所提GS-Hider的总体框架概述。该框架采用安全耦合的特征属性与渲染器融合隐藏与原始信息,得到渲染后的高维耦合特征。随后,利用场景与信息解码器对渲染出的原始RGB场景和隐藏信息进行解耦。

提出方法

为解决上述问题,我们提出了一种高效且灵活的隐写术框架——GS-Hider。该框架旨在将三维场景或图像以不可见的方式嵌入原始场景中,并通过预先设计的解码模块准确提取隐藏的信息。

具体而言,我们定义了一种更灵活、安全的耦合特征属性,用以替换原始3DGS的球谐系数。进一步地,而非直接渲染RGB视图,我们设计了一个耦合的特征渲染器,渲染得到一个耦合的高维特征,实现信息的嵌入和融合。

最终,我们使用一个场景解码器和不公开的信息解码器并行地从耦合特征中解耦原始3D场景和隐藏场景。

实验结果

由于我们是首个提出的3DGS隐写方法,我们和几个直观的3DGS隐写方法,包括添加一个球谐系数来拟合隐藏场景(3DGS+SH),添加一个隐藏场景解码器(3DGS+Decoder)进行比较。

如表1所示,GS-Hider能够以更小的GS文件大小取得更高的原始场景、隐藏场景渲染保真度。

表1:GS-Hider和其他直观3DGS隐写做法渲染质量比较。

此外,我们的GS-Hider也能够实现将多个3D场景藏到一个3D场景中,或者在3D场景的某一个视角中隐藏一张代表版权的图片。

如表2和图4所示。

图3:GS-Hider与其他直观隐写方法的可视化对比。

表2:GS-Hider与其他直观GS隐写方法在藏单张图上的性能对比。

图4:GS-Hider隐藏多个3D场景的效果展示图。

实验室简介: 视觉信息智能学习实验室(VILLA)由张健助理教授在2019年创立并负责,致力于AI内容生成与安全、底层视觉、三维场景理解等研究方向。近几年,已在CVPR、ICCV、ECCV、NeurIPS、ICLR、TPAMI、TIP、IJCV、AAAI等高水平国际期刊会议上发表成果50余篇。VILLA在图像/视频编辑、AIGC安全领域发布多款爆火技术和产品,包括T2I-Adapter、DragonDiffusion、DiffEditor, 360DVD,EditGuard和V2A-Mark。其中T2I-Adapter、DragonDiffusion等已被Stability AI,Huggingface,兔展等国内外知名AIGC公司用于落地产品中。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 我爱计算机视觉 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
北京大学 | 联合篡改定位和版权保护的多功能图像水印
本篇文章分享论文EditGuard: Versatile Image Watermarking for Tamper Localization and Copyright Protection ,联合篡改定位和版权保护的多功能图像水印研究。
CV君
2023/12/19
4580
北京大学 | 联合篡改定位和版权保护的多功能图像水印
Nerf技术在三维重建中起到什么作用?
NeRF的核心思想是将三维场景建模成一个连续的函数,这个函数可以接收三维空间中的一点以及观察这个点的相机的方向,然后输出该点的颜色和不透明度。这样,通过学习这个函数,我们就可以得到整个三维场景的信息,从而可以渲染出从任何角度观察这个场景的结果。
一点人工一点智能
2024/04/02
6240
Nerf技术在三维重建中起到什么作用?
ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
是否还在担心大规模场景训练和压缩耗时太长、显存开销太大?是否还在苦恼重建出的建筑物和道路表面破碎不堪?是否还在困扰如何定量衡量大规模场景几何重建的精确程度?
机器之心
2025/02/06
1830
ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
告别3D高斯Splatting算法,带神经补偿的频谱剪枝高斯场SUNDAE开源了
本论文作者包括帝国理工学院硕士生杨润一、北航二年级硕士生朱贞欣、北京理工大学二年级硕士生姜洲、北京理工大学四年级本科生叶柏均、中国科学院大学本科大三学生张逸飞、中国电信人工智能研究院多媒体认知学习实验室(EVOL Lab)负责人赵健、清华大学智能产业研究院(AIR)助理教授赵昊等。
机器之心
2024/05/22
4230
告别3D高斯Splatting算法,带神经补偿的频谱剪枝高斯场SUNDAE开源了
NeRFs和3D高斯溅射技术如何重塑SLAM:综述
文章:How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: a Survey
点云PCL博主
2024/06/21
1.7K0
NeRFs和3D高斯溅射技术如何重塑SLAM:综述
分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速
今年 4 月,Meta 发布「分割一切(SAM)」AI 模型,这项成果不仅成为很多 CV 研究者心中的年度论文,更是在 ICCV 2023 上斩获最佳论文提名 。
机器之心
2023/12/12
6160
分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速
CVPR 2024 | VastGaussian:用于大型场景重建的3D高斯
基于NeRF的方法在处理大型场景时,渲染时间长且渲染效果差。而现有基于3D高斯的方法由于训练内存大、优化时间长和外观变化剧烈,难以扩展到大型场景。
用户1324186
2024/04/12
1.6K0
CVPR 2024 | VastGaussian:用于大型场景重建的3D高斯
【源头活水】CityGaussian:VR/AR时代的城市重建新标杆
“问渠那得清如许,为有源头活水来”,通过前沿领域知识的学习,从其他研究领域得到启发,对研究问题的本质有更清晰的认识和理解,是自我提高的不竭源泉。为此,我们特别精选论文阅读笔记,开辟“源头活水”专栏,帮助你广泛而深入的阅读科研文献,敬请关注!
马上科普尚尚
2024/07/17
3710
【源头活水】CityGaussian:VR/AR时代的城市重建新标杆
滑铁卢大学使用谷歌地球图像和高斯溅射进行真实感3D城市场景重建和点云提取!
从2D图像中进行3D重建和建模近年来受到了极大的关注,这要归功于具有3D重建能力的真实感视图合成方法的最新进展。从技术角度来看,这是一个跨计算机视觉、计算机图形学和摄影测量学的交叉研究领域。
AIGC 先锋科技
2024/07/08
9370
滑铁卢大学使用谷歌地球图像和高斯溅射进行真实感3D城市场景重建和点云提取!
FSGS: 基于 Gaussian Splatting 的实时 Few-shot 视角合成
新视角合成是计算机视觉和图形学领域中一项长期存在并且富有挑战的任务。过去两年,NeRF及其衍生工作的提出将该任务提升到了新的高度。然而,基于NeRF的方法的训练和渲染需要大量的成本才能达到理想的效果,比如稠密的输入视角和耗时的训练与渲染。尽管后续的一些稀疏视角NeRF的工作以及InstantNGP的提出在一定程度上解决了部分缺陷,但NeRF方法始终没有做到实时和高质量的高分辨率渲染。
用户1324186
2024/04/12
9990
FSGS: 基于 Gaussian Splatting 的实时 Few-shot 视角合成
高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
机器之心
2024/06/17
2470
高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF
TCLC-GS:用于自动驾驶场景的紧耦合激光雷达-相机高斯溅射技术
文章:TCLC-GS: Tightly Coupled LiDAR-Camera Gaussian Splatting for Surrounding Autonomous Driving Scenes
点云PCL博主
2024/06/08
3520
TCLC-GS:用于自动驾驶场景的紧耦合激光雷达-相机高斯溅射技术
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架
在 3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程,如 3D 人体模型回归、绑定、蒙皮、纹理贴图和驱动等。为了自动化 3D 内容生成,此前的一些典型工作(比如 DreamFusion [1] )提出了分数蒸馏采样 (Score Distillation Sampling),通过优化 3D 场景的神经表达参数,使其在各个视角下渲染的 2D 图片符合大规模预训练的文生图模型分布。然而,尽管这一类方法在单个物体上取得了不错的效果,我们还是很难对具有复杂关节的细粒度人体进行精确建模。
机器之心
2023/12/12
6960
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架
孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控
神经辐射场(NeRF)及三维高斯泼溅(3D Gaussian Splatting,3DGS)虽能构建静态数字孪生,却无法模拟真实世界的动态,不仅限制了虚拟现实和混合现实的真实感,也是智能训练与Real2Sim2Real范式突破的关键瓶颈。
新智元
2025/04/10
1910
孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控
FlashSplat: 以最佳方式求解 2D 到 3D 高斯展开分割 !
本研究旨在解决准确分割3D高斯分水(3D-GS) FROM 2D Mask 的挑战。传统方法通常依靠迭代梯度下降为每个高斯分配唯一的标签,导致长久的优化和次优解。
未来先知
2024/12/30
2420
FlashSplat: 以最佳方式求解 2D 到 3D 高斯展开分割 !
CVPR 2024 | DNGaussian: 全局局部深度归一化优化的稀疏三维高斯辐射场
从稀疏输入合成新视图对于辐射场来说是一个挑战。神经辐射场(NeRF)的最新进展在仅使用少量输入视图就能重建出高度逼真的外观和准确的几何信息方面取得了卓越成果。然而,大部分基于稀疏视图的NeRF实现速度较慢,内存消耗也较大,导致时间和计算成本很高,限制了它们的实际应用。
用户1324186
2024/05/31
1.5K0
CVPR 2024 | DNGaussian: 全局局部深度归一化优化的稀疏三维高斯辐射场
纯RGB输入,解决户外场景SLAM!误差降低至9.8%,港科广开源 | ICRA 2025
在自主驾驶、机器人导航、AR/VR等前沿应用中,Simultaneous Localization and Mapping (SLAM) 是核心技术之一。
新智元
2025/03/27
680
纯RGB输入,解决户外场景SLAM!误差降低至9.8%,港科广开源 | ICRA 2025
Gamba:仅需0.05秒让一张图片生成高质量3D模型!(新加坡国立大学&天工AI开源)
Github:https://github.com/SkyworkAI/Gamba
AI进修生
2024/12/02
7430
Gamba:仅需0.05秒让一张图片生成高质量3D模型!(新加坡国立大学&天工AI开源)
HiFi4G: 通过紧凑高斯进行高保真人体性能渲染
HiFi4G 架构如图 1 所示,(a) 首先使用非刚性跟踪建立了一个粗变形图,并跟踪运动进行高斯优化。(b) HiFi4G 使用 NeuS2 初始化第一帧高斯,并构建细粒度高斯图以增强时间一致性。然后,我们利用 ED 图来扭曲 4D 高斯,对高斯图应用
用户1324186
2024/01/24
5630
HiFi4G: 通过紧凑高斯进行高保真人体性能渲染
VINGS-Mono:大规模场景中的视觉-惯性高斯溅射单目SLAM
文章:VINGS-Mono: Visual-Inertial Gaussian Splatting Monocular SLAM in Large Scenes
点云PCL博主
2025/02/19
3130
VINGS-Mono:大规模场景中的视觉-惯性高斯溅射单目SLAM
推荐阅读
北京大学 | 联合篡改定位和版权保护的多功能图像水印
4580
Nerf技术在三维重建中起到什么作用?
6240
ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
1830
告别3D高斯Splatting算法,带神经补偿的频谱剪枝高斯场SUNDAE开源了
4230
NeRFs和3D高斯溅射技术如何重塑SLAM:综述
1.7K0
分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速
6160
CVPR 2024 | VastGaussian:用于大型场景重建的3D高斯
1.6K0
【源头活水】CityGaussian:VR/AR时代的城市重建新标杆
3710
滑铁卢大学使用谷歌地球图像和高斯溅射进行真实感3D城市场景重建和点云提取!
9370
FSGS: 基于 Gaussian Splatting 的实时 Few-shot 视角合成
9990
高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF
2470
TCLC-GS:用于自动驾驶场景的紧耦合激光雷达-相机高斯溅射技术
3520
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架
6960
孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控
1910
FlashSplat: 以最佳方式求解 2D 到 3D 高斯展开分割 !
2420
CVPR 2024 | DNGaussian: 全局局部深度归一化优化的稀疏三维高斯辐射场
1.5K0
纯RGB输入,解决户外场景SLAM!误差降低至9.8%,港科广开源 | ICRA 2025
680
Gamba:仅需0.05秒让一张图片生成高质量3D模型!(新加坡国立大学&天工AI开源)
7430
HiFi4G: 通过紧凑高斯进行高保真人体性能渲染
5630
VINGS-Mono:大规模场景中的视觉-惯性高斯溅射单目SLAM
3130
相关推荐
北京大学 | 联合篡改定位和版权保护的多功能图像水印
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档