前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >NVIDIA AI 为混合现实任务提出了一种新颖的 AI 框架,例如逼真的虚拟对象插入

NVIDIA AI 为混合现实任务提出了一种新颖的 AI 框架,例如逼真的虚拟对象插入

作者头像
代码医生工作室
发布于 2021-10-19 06:38:07
发布于 2021-10-19 06:38:07
5630
举报
文章被收录于专栏:相约机器人相约机器人

从单个图像同时估计反照率、法线、深度和 3D 空间变化照明通常具有挑战性。现有方法的问题在于它们被表述为图像到图像的转换,而忽略了场景的 3D 属性。室内场景的 2D 表示不足以捕捉光线在 3D 空间中的移动方式,这并不奇怪。

来自 NVIDIA、多伦多大学和 Vector Institute 的研究人员提出了一种估计反射率、形状和 3D 空间变化照明的新方法,通过使用 3D 照明表示以端到端可训练的方式制定完整的渲染过程。他们提出了一种新颖的用于照明的体积球面高斯表示,一种用于场景表面的体素单元表示。

每个体素都分配有一组球形高斯参数,用于控制其光源的发射方向和锐度。这样,可以毫无问题地处理强定向照明。由于缺乏 HDR 照明的基本事实,研究团队设计了基于光线追踪的可微渲染器,以利用其照明表示。它可以用来制定一个节能的图像形成过程。渲染器用于在不牺牲准确性的情况下确保预测在物理上是正确的。

根据研究论文,研究团队提出的方法优于现有的最先进的逆渲染和光照估计方法。本研究中的研究人员引入了一个整体的单目逆渲染框架,可以联合估计反照率、法线、深度和 HDR 光场。提出的体积球面高斯表示非常适合在空间和角度上处理高频细节。尽管仅使用 LDR 图像进行过训练,但该模型能够正确预测 HDR 照明。这些结果证明了该模型在增强现实 (AR) 应用程序(例如虚拟对象插入)方面的巨大潜力。

论文:

https://arxiv.org/pdf/2109.06061.pdf

项目:

https://nv-tlabs.github.io/inverse-rendering-3d-lighting/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-10-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 相约机器人 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
街道场景的环境光源估计
本工作旨在解决从单目图像进户外环境光照估计的任务,尤其是街道场景。这是一个重要的任务,因为它支持虚拟对象插入,可以满足许多下游应用,例如虚拟建筑群中加入新的建筑,逼真地渲染游戏角色到周围环境中,或者作为一种数据增强方法来制作现实中很难采集的数据集,例如道路上的碎片和突然闯入动物,以训练更健壮和高性能的计算机视觉模型。
用户1324186
2022/11/07
1.7K0
街道场景的环境光源估计
速度提升24倍,30分钟完成室内大场景逆渲染,如视研究成果入选CVPR 2023
机器之心原创 编辑:杜伟 针对逆渲染技术的研究成果连续两年入选计算机视觉顶会 CVPR,并从处理单张图像跨越到覆盖整个室内大场景,如视在三维重建领域的视觉算法技术底蕴得到了淋漓尽致的展现。 三维重建是计算机视觉(CV)和计算机图形学(CG)的热点主题之一,它通过 CV 技术处理相机等传感器拍摄的真实物体和场景的二维图像,得到它们的三维模型。随着相关技术的不断成熟,三维重建越来越广泛地应用于智能家居、AR 旅游、自动驾驶与高精度地图、机器人、城市规划、文物重建、电影娱乐等多个不同领域。 典型的基于二维图像的
机器之心
2023/03/29
8020
速度提升24倍,30分钟完成室内大场景逆渲染,如视研究成果入选CVPR 2023
用于形状精确三维感知图像合成的着色引导生成隐式模型 | NeurIPS2021
编译 | 莓酊 编辑 | 青暮生成辐射场的发展推动了3D感知图像合成的发展。由于观察到3D对象从多个视点看起来十分逼真,这些方法引入了多视图约束作为正则化,以从2D图像学习有效的3D辐射场。尽管取得了进展,但由于形状-颜色的模糊性,它们往往无法捕获准确的3D形状,从而限制了在下游任务中的适用性。在这项研究工作中,来自马普所和港中文大学的学者通过提出一种新的着色引导生成隐式模型ShadeGAN来解决这种模糊性,它学习了一种改进的形状表示。 论文地址:https://arxiv.org/pdf/2110.15
AI科技评论
2022/03/03
7510
AI扣图 | 五一假期拍的照片再不用担心游客太多
来自谷歌的研究者提出了一种新的人像重照明和背景替换系统,可对图像背景进行替换,生成的肖像图的光照条件与新背景保持一致,还能有效地去除图片中的强光,细节恢复较好。
计算机视觉研究院
2021/05/08
6530
AI扣图 | 五一假期拍的照片再不用担心游客太多
不用绿幕也能做特效,谷歌「LED蛋」让你告别五毛特效,光线、影子都能调
「灯光」在影视作品、游戏和虚拟环境中的作用至关重要——有时候它是决定一个场景表演质量的关键,这个很容易理解。比如某些古装剧的某些场景会让人非常出戏,除了演员的演技太差之外,很有可能是因为光效不太自然,盯着电视机屏幕时,你甚至能想象出来演员头顶的摄影棚。
OpenCV学堂
2019/11/24
8620
单图秒变3D对象,还可交互实时编辑!Stability AI中科大校友新作
近日,Stability AI发布消息,公开3D重建新方法SPAR3D的设计原理、代码、模型权重等。
新智元
2025/02/15
1320
单图秒变3D对象,还可交互实时编辑!Stability AI中科大校友新作
虚拟在左,真实在右:德国学者用AI合成一亿像素逼真3D图像,可任意旋转
近日,来自德国埃尔兰根-纽伦堡大学的学者提出了一种新颖的神经网络方法,用于3D图像的场景细化和新视图合成。
AI科技评论
2021/10/21
7280
基础渲染系列(四)——光照(Unity)
这是关于渲染的系列教程的第四部分。上一部分是关于组合纹理的。这次,我们将研究如何计算光照。
放牛的星星
2020/07/10
2.8K0
基础渲染系列(四)——光照(Unity)
3D版DALL-E来了!谷歌发布文本3D生成模型DreamFusion,重点是zero-shot
---- 新智元报道   编辑:LRS 【新智元导读】给一个文本提示就能生成3D模型! 自从文本引导的图像生成模型火了以后,画家群体迅速扩张,不会用画笔的人也能发挥想象力进行艺术创作。 但目前的模型,如DALL-E 2, Imagen等仍然停留在二维创作(即图片),无法生成360度无死角的3D模型。 想要直接训练一个text-to-3D的模型非常困难,因为DALL-E 2等模型的训练需要吞噬数十亿个图像-文本对,但三维合成并不存在如此大规模的标注数据,也没有一个高效的模型架构对3D数据进行降噪。
新智元
2022/10/08
1.3K0
3D版DALL-E来了!谷歌发布文本3D生成模型DreamFusion,重点是zero-shot
每日学术速递1.4
1.NoPose-NeuS: Jointly Optimizing Camera Poses with Neural Implicit Surfaces for Multi-view Reconstruction
AiCharm
2024/01/04
1900
每日学术速递1.4
一种将虚拟物体插入到有透明物体的场景中的方法
在增强现实系统中,真实场景和虚拟物体之间的视觉一致性得到了广泛的研究,解决这个问题的关键在于估计真实场景中物体的光照和材质。现有的各种方法只关注在真实场景中只有不透明物体时插入虚拟物体,而没有考虑真实场景中透明物体对虚拟物体的影响。如下图所示,透明物体的不同折射率和粗糙度参数会给周围的物体带来不同的视觉效果。
用户1324186
2022/11/07
4.1K0
一种将虚拟物体插入到有透明物体的场景中的方法
每日学术速递4.9
作者:Alexia Jolicoeur-Martineau, Emy Gervais, Kilian Fatras, Yan Zhang, Simon Lacoste-Julien
AiCharm
2023/05/15
3150
每日学术速递4.9
3张图片生成一个手办3D模型!南加州大学华人博士提出新模型NeROIC,更真实!
---- 新智元报道   编辑:LRS 【新智元导读】通过几张二维照片还原为3D模型一直是一个图形学的一个难题,并且照片的不同光线、相机型号都会影响到最终的生成效果,也限制了模型的实际应用场景。最近南加州大学华人博士提出新模型NeROIC,不仅让模型的易用性大大提升,还显著提升了真实感! 随着深度学习的加入,计算机图形学又产生了很多新兴领域。神经渲染(Neural Rendering)技术就是利用各种深度神经网络进行图像合成,通过自动化的流程,能够节省大量从业人员的时间和精力。例如给定几张不同角度拍摄
新智元
2022/03/04
7350
NeurIPS 2022 | GeoD:用几何感知鉴别器改进三维感知图像合成
‍‍原文:Improving 3D-aware Image Synthesis with A Geometry-aware Discriminator
一点人工一点智能
2022/12/27
6700
NeurIPS 2022 | GeoD:用几何感知鉴别器改进三维感知图像合成
ICLR 惊现[10,10,10,10]满分论文,ControlNet 作者新作,Github 5.8k 颗星
虽说满分论文不是前无古人,后无来者,但放在平均分才 4.76 的 ICLR,怎么不算是相当炸裂的存在呢。
机器之心
2025/02/14
480
ICLR 惊现[10,10,10,10]满分论文,ControlNet 作者新作,Github  5.8k 颗星
这个面部3D重建模型,造出了6000多个名人的数字面具
论文展示地址:https://gvv.mpi-inf.mpg.de/projects/FML19/
机器之心
2019/04/30
1.6K0
这个面部3D重建模型,造出了6000多个名人的数字面具
ISUX译文 | The PBR Guide基于物理的渲染指引(下)
腾讯ISUX isux.tencent.com 社交用户体验设计 近日在研究3D-TO-H5工作流及学习PBR的过程中,发现Substance官方新版的《The PBR Guide》尚未有完整的中文翻译,所以把心一横,斗胆翻译了一波,希望能抛砖引玉,让大家更深入浅出地了解3D材质贴图及PBR技术。 PBR,Physically-Based Rendering,意为基于物理的渲染,是一种能对光在物体表面的真实物理反应提供精确渲染的方法,也是近年来极其生猛的3D工业趋势。 《The PBR Gu
腾讯ISUX
2020/03/23
1.5K0
每日学术速递5.13
作者:KunChang Li, Yinan He, Yi Wang, Yizhuo Li, Wenhai Wang, Ping Luo, Yali Wang, Limin Wang, Yu Qiao
AiCharm
2023/05/16
2100
每日学术速递5.13
通过AI重现真实环境下的照明和反射
在网上购买地毯或布料时,你希望能说出它在现实生活中的样子吗?感谢麻省理工学院计算机科学与人工智能实验室(CSAIL)和法国Inria Sophia Antipolis的研究人员,你距离能够体验到这一点只有一步之遥。
AiTechYun
2018/09/26
1.1K0
通过AI重现真实环境下的照明和反射
CVPR2020 best paper:对称可变形三维物体的无监督学习
项目地址:https://elliottwu.com/projects/unsup3d/
3D视觉工坊
2020/12/11
6720
推荐阅读
相关推荐
街道场景的环境光源估计
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档