首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

李飞飞团队新作:AI透视眼,穿越障碍看清你,渲染遮挡人体有新突破了

机器之心报道 编辑:大盘鸡、小舟 即使遮挡,也能渲染出高保真的 3D 人体。 AR/VR 、电影和医疗等领域都在广泛地应用视频渲染人类形象。...尽管只有一个摄像头视角,这些方法仍能从新的视角准确地渲染人体。 不过,大多数现有的方法在渲染人体时都是针对较为理想的实验场景进行设计的。...在这些场景中,障碍物几乎不存在,人的各个身体部分在每一帧中也都能全部展示出来。可这与现实场景大为不同。现实场景中常有多个障碍物,人体也会在移动过程中被障碍物遮挡。...最近,著名人工智能教授李飞飞在 X 上发布了有关 3D 人体渲染工作的新进展 —— 一种名为 Wild2Avatar 的新模型,该模型即使在有遮挡的情况下仍然能够完整、高保真地渲染人体。...Wild2Avatar 模型的整体架构如下图 2 所示: 具体来说,Wild2Avatar 将遮挡物、人体和背景建模为三个独立的神经场,无论遮挡物如何,都能对人体进行清晰的三维重建。

28410

Android图像处理系列:OpenGL深度测试的应用

深度测试是指检测从某个方向看过去时,两个点A和B谁在谁的前面,以便知道谁挡住了谁,被挡住的点一般不会进行绘制,以达到和真实世界一样的遮挡效果,OpenGL提供了深度测试的能力,开发者不用自己判断哪些被挡住然后不绘制...在OpenGL中绘制3D物体时,几乎不可避免地要用到深度测试,因为希望绘制的结果像真实世界中的效果那样,前面的物体会挡住后面的物体。...一个物体从另外一个物体中穿过,这时自己去算哪些点被遮挡,哪些不被遮挡,然后再自己拼接顶点来绘制?其中的复杂程度简直无法想像。另外,如果要绘制的物体很多呢?物体如果不规则呢?...不必焦虑,OpenGL自动为我们完成了这一切,而开发者只需要简单地开启深度测试即可。 注意,这里说的深度是从OpenGL摄像机所对着的方向而言的,如下图所示: ?...,比如画一个三角形,并不是画一部分就先显示到屏幕一部分,而是全都画好之后,一次性把画布更新到屏幕上,那么就需要一个Buffer来暂存这些中间的结果。

1.7K21
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    程序员笔记——通过OpenGL理解前端渲染原理(1)

    一、OpenGL OpenGL,是一套绘制3D图形的API,当然它也可以用来绘制2D的物体。OpenGL有一大套可以用来操作模型和图片的函数,通常编写OpenGL库的人是显卡的制造者。...我们买的显卡都支持特定版本的OpenGL。 下图是用OpenGL做的旋转的立方体。 ?...渲染管道可以分成两大部分:第一部分将3D坐标转换成2D坐标;第二部分把2D的坐标转换成实际的像素。 着色器 通常来说,渲染管道把一组3D坐标转换成屏幕上带有颜色的2D像素需要经过很多步。...其中的一些着色器是可以配置的,开发者可以根据需求配置自己的着色器去替代已经存在的那些,这就让我们能够更自由和细粒度地控制渲染的过程。...这个阶段会判断相应的深度,比如一个物体可能在另一个物体的后面,那它可能采用其他的颜色;或者如果该物体被遮挡,可能会被裁掉。

    1.3K30

    Python实现3D建模工具(上)

    OpenGL坐标系的转换 一个3d模型映射到屏幕上会经过5次空间变换,如下图漫画所示,左上角为起始点: 漫画右半部分的坐标系转换基本可以通过OpenGL自带的函数帮助我们处理,从摄像机坐标系到齐次裁减坐标系的矩阵转换由...也许你会奇怪为什么有的坐标使用的是三元组有的坐标使用的四元组,三元组还可以理解,四元祖是怎么回事呢?...这里我只能简短地说,物体要做平移变换必须使用四元组,四元组的第四个元素决定了该四元组究竟是一个向量还是空间中的一个点,想了解背后的数学知识可以看这篇博文:OpenGL学习脚印: 坐标和变换的数学基础(math-coordinates...这些类的共通点在于它们的渲染都可以使用短小的OpenGL代码完成,同时对这些元素进行组合就可以组合出复杂的模型来,因此我们抽象出了Primitive这个类。...函数就是简单地遍历调用子节点的render_self。

    15100

    清华大学提出三维重建的新方法:O²-Recon,用2D扩散模型补全残缺的3D物体

    机器之心专栏 机器之心编辑部 在计算机视觉中,物体级别的三维表面重建技术面临诸多挑战。...遮挡下的重建结果 清华大学刘永进教授团队提出物体三维重建的新方法 O²-Recon,利用已有的 2D 扩散模型补全物体图像中被遮挡的区域,继而用神经隐式表面场从补全后的图像中重建完整的三维物体。...旨在利用预训练的扩散模型来补全图像中物体被遮挡的区域。...在编辑之前,这些物体在原场景中的位置下: 多物体动图对比 在编辑之后,这些物体在新的位置下: 多物体动图对比 总结 本文提出了 O²-Recon 方法,来利用预训练的 2D 扩散模型重建场景中被遮挡物体的完整...为了防止 Mask 的不一致性,研究者采用了一种人机协同策略,通过少量人机交互生成高质量的多角度 Mask,有效地引导 2D 图像补全过程。

    67610

    视觉遮挡不再是难题:NVIDIA DeepStream单视图3D跟踪技术来帮忙

    为了解决这一问题,NVIDIA DeepStream 引入了一种先进的单视图3D追踪技术,以有效地缓解遮挡带来的影响。...这些变化使得我们很难从二维的画面中预测车接下来会移动到哪个位置。跟踪物体就是要不断地估计物体的状态,并识别它们。这通常涉及到建立物体移动的模型,并进行预测,以减少测量中的误差。...每个圆柱形模型的底部中心表示每个行人在 3D 世界地平面上的位置(用绿点标记) 这个功能的好处是,即使行人被其他东西挡住了一部分,它也能准确地找到行人的脚在哪里。这在现实应用中是一个很大的挑战。...上图显示,SV3DT 算法可以成功找到匹配的 3D 人体模型位置,即使人被严重遮挡。...下图显示了如何在合成数据集中稳健地跟踪每个行人的脚部位置,即使下半身的大部分被架子等大型物体遮挡也是如此 使用合成数据集对严重粒子遮挡进行SV3DT行人位置跟踪 尽管如此,便利店中人们的 2D 和 3D

    43110

    OpenGL ES编程指南(四)

    实现良好的性能需要仔细管理这些开销。 一个设计良好的应用程序可以减少对OpenGL ES的调用频率,使用适合硬件的数据格式来最大限度地降低翻译成本,并小心管理其本身和OpenGL ES之间的数据流。...使用管道作为模型来确定您的应用执行哪些工作来生成新框架。...通过优化现代GPU硬件中可用的并行架构的功能来转换反馈,可更有效地解决问题。 借助变换反馈,您可以设计渲染引擎以更有效地解决此问题。...我们的目标是创建任何可以保持应用运行时不变的对象(或甚至是应用生命周期的一部分,例如游戏中的关卡持续时间),交易增加的初始化时间以获得更好的呈现性能。...有效地使用glFlush 在某些桌面OpenGL实现中,定期调用glFlush函数以有效平衡CPU和GPU工作会很有用,但iOS中并非如此。

    2K20

    OpenGL ES 2.0 (iOS):坐标空间 与 OpenGL ES 2 3D空间

    物体(模型)坐标系 模型自身的坐标系,坐标原点在模型的某一点上,一般是几何中心位置为原点 模型坐标系是会跟随模型的运动而运动,因为它是模型本身的 “一部份” ; 模型内部的构件都是以模型坐标系为参考进而描述的...,总共就是四个变换过程:模型变换、视变换、投影变换、视口变换,经过这四个变换后,图形的点就可以正确并如愿地显示在用户屏幕上了; 侧面反应,要正确地渲染图形,就要掌握这四种变换; 2....; 第一次变换:模型变换,模型空间到世界空间 ( 1 -> 2 ) 请看《OpenGL ES 2.0 (iOS)[02]:修复三角形的显示》 这篇文章,专门讲模型变换的。...Camera Model 要完成摄像机正确地显示模型,要设置摄像机位置、摄像机的焦距: 设置摄像机的位置、方向 --> (视变换) gluLookAt (ES 没有这个函数),使要渲染的模型位于摄像机可视区域中...view frustum 当模型处于视景体外时会被剔除掉,如果模型有一部分在视景体内时,模型的点信息只会剩下在视景体内的,其它的点信息不渲染; /* Equivalent to glFrustum.

    1.8K20

    应对遮挡挑战,北航提出新型 YOLOv5 模型表现优异 !

    这种模型在较少的浮点运算(FLOPs)下,实现了更好的行人检测准确性,特别是对于被遮挡的目标。...WIOU_Loss 是一种基于注意力的框损失,可以更准确地度量预测框和真实框之间的相似度,尤其是在涉及多个物体部分时 [12]。...在某些场景中,作者的模型的平均精确度甚至高于YOLOv5x,而作者的模型只需要计算17倍于YOLOv5x的参数。...虽然作者的方法在某些情况下比原YOLOv5s取得更好的结果,但在某些情况下仍有所不足。例如,当行人出现在图像中非常奇怪的姿势时,作者的模型会将行人恢复为多个不同的整体框。...例如,当行人出现在图像中非常奇怪的姿势时,作者的模型会将行人恢复为多个不同的整体框。当每个整体框之间的IOU过小时,它会认为这是不同的人,导致虚拟检测。

    30110

    移动平台 Unity3D 应用性能优化(下)

    (在《移动平台Unity3D 应用性能优化(上)》中介绍了一部分内容,本文将补充接下来部分) 一、Unity3D应用性能优化之GPU 一般人说DC的优化占了unity3D软件优化的三分天下,那么GPU的优化也占了三分天下...1、优化基本几何体 3D软件都是从模型制作开始,在设计师建模的时候就要想到应该尽可能地减少顶点数,一些对于模型没有影响、或是肉眼非常难察觉到区别的顶点都要尽可能去掉。...目的是把那些不在视野内的顶点裁剪掉,并剔除某些三角形图元的面片。部分在视野内的图元需要做裁剪处理,在裁剪边缘产生新的顶点和三角形进行处理。...片元着色器是比较花时间的,因为它是最终颜色的计算者,在某些情况下,例如复杂灯光环境下,片元着色器会出现GPU流水线主要的拖后腿的存在。...和Android app的开发一样,就是同一个像素点绘制了多次,某些情况会造成计算力的浪费,增加耗电量。前面提到的遮挡剔除有减少overdraw非常有用。

    2.3K10

    告别灰白和朦胧,老照片也能玩转3D,新SOTA效果惊艳

    机器之心报道 机器之心编辑部 拿起以往的老照片,无一不是灰蒙蒙的。那么有没有一种方法将这些老照片重焕生机呢?...近日,弗吉尼亚理工等机构开发出了一种语境感知分层深度修复技术,它利用基于学习的修复模型来迭代地合成新的颜色和深度信息,并借助标准图形引擎将这些老照片渲染成3D照片。...,为遮挡区域迭代地合成局部新的颜色和深度信息。...该研究提出的方法以 RGB-D 图像作为输入,并生成分层深度图像(LDI),并修复输入图像中被遮挡区域的颜色和深度。...图 9:新方法与基于 MPI 的方法的视觉对比结果 从图中可以看到,该研究提出的新方法能够修复原始图像中被遮挡的区域,且结构和颜色都很合理。

    1K20

    OpenGL ES 3.0 简介

    转载请以链接形式标明出处: 本文出自:103style的博客 OpenGL ES 3.0学习汇总 OpenGL ES 3.0 学习记录汇总 简介 OpenGL ES (OpenGL for Emberdded...统一变量(uniform)一一顶点(或者片段)着色器使用的不变数据。 采样器一一代表顶点着色器使用纹理的特殊统一变量类型。 下图是顶点着色器的输入输出模型。...以下为顶点着色器示例: #version 300 es //提供着色语言的版本 必须出现在第一行 uniform mat4 u_mvpMatrix; # 统一变量 储存组合的模型视图和投影矩阵 in...被遮挡的像素则不属于OpenGL ES 的上下文,从而不显示这些像素。此过程在OpenGL ES 内部处理,不由开发人员控制。...剪裁测试—— 确定(Xw,Yw)是否位于OpenGL ES 状态的一部分的裁剪矩形范围内,抛弃范围之外的片段。

    1.4K20

    移动平台Unity3D 应用性能优化

    即使是在同一物理内存上 ,之前的openGL ES规范中CPU和GPU之间的内存是不能共享的,vertex和texture的buffer是需要拷贝的。...一个Draw Call命令会指向本次绘制需要渲染的信息,这些信息包括:顶点数据、纹理数据、shader参数(光照模型、法线方向、光照方向等)等,简单地说就 画什么,用什么画,怎么画。...1、优化基本几何体 3D软件都是从模型制作开始,在设计师建模的时候就要想到应该尽可能地减少顶点数,一些对于模型没有影响、或是肉眼非常难察觉到区别的顶点都要尽可能去掉。...目的是把那些不在视野内的顶点裁剪掉,并剔除某些三角形图元的面片。部分在视野内的图元需要做裁剪处理,在裁剪边缘产生新的顶点和三角形进行处理。...和Android app的开发一样,就是同一个像素点绘制了多次,某些情况会造成计算力的浪费,增加耗电量。前面提到的遮挡剔除有减少overdraw非常有用。

    94131

    Tracking Everything Everywhere | 随时随地,追踪每个像素,连遮挡都不怕

    CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 本文章仅用于学术分享,如有侵权请联系删除 作者丨机器之心编辑部 来源丨机器之心 编辑丨AiCharm...从该研究发布的 demo 看,运动追踪的效果非常好,例如追踪跳跃袋鼠的运动轨迹: 荡秋千的运动曲线: 还能交互式查看运动追踪情况: 即使物体被遮挡也能追踪运动轨迹,如狗在跑动的过程中被树遮挡:...消融实验与分析 研究者利用消融实验来验证他们设计决策的有效性,结果如表 2 所示。 在图 4 中,他们展示了由他们的模型生成的伪深度图,以展示学习到的深度排序。...需要注意的是,这些图并不对应于物理深度,然而,它们展示了仅使用光度和光流信号时,新方法能够有效地确定不同表面之间的相对顺序,这对于在遮挡中进行追踪至关重要。...2023-06-09 医学多模态大模型LLaVA-Med | 基于LLaVA的医学指令微调 2023-06-10 AAAI 2023 Oral | 字节提出非对称图像重采样模型,JPEG、WebP上抗压缩性能领先

    57720

    三维图形渲染显示的全过程

    --> 显存) 摄像机(位置、朝向、视锥体) 光源(位置、类型等参数信息) ② 裁剪和剔除 :视锥裁剪、背面剔除、遮挡剔除 (Occlusion Culling) ③ 计算模型视图矩阵 ④ 设置渲染状态...,甚至是非常低 投影:分为透视投影与正交投影;在眼空间将模型从三维空间投影到二维平面(D3D投影平面为z=1.0,OpenGL为z=-1.0;为了便于理解,可将其定义为视景体近裁截面) ?..., 1.0] OpenGL:[-1.0, 1.0])注:近裁截面为最小深度、远裁截面为最大深度; 裁剪:将那些不在摄像机视野内的顶点裁剪掉,并剔除某些三角图元面片 ?...// OpenGL单缓冲 glutInitDisplayMode(GLUT_SINGLE | GLUT_RGB); glFlush(); //单缓冲的刷新模式; // OpenGL双缓冲 glutInitDisplayMode...md3dPP; md3dPP.PresentationInterval = D3DPRESENT_INTERVAL_ONE; // 开启垂直同步 当开启了垂直同步,若游戏FPS高于显示器刷新频率时,显卡会将一部分时间浪费在等待上

    4.1K41

    OpenGL(六)-- 渲染技巧:正背面剔除、深度测试、多边形偏移OpenGL(六)-- 渲染技巧:正背面剔除、深度测试、多边形偏移

    //把摄像机矩阵压入模型矩阵中 modelViewMatix.PushMatrix(cameraFrame); //使用默认光源着色器 shaderManager.UseStockShader...放到OpenGL里虽然作为观察者已经移动到隐藏⾯了,但是OpenGL还是认为它还是隐藏⾯也就是背面,不需要绘制,这就造成了我们看到的一幕。这就是OpenGL中的隐藏⾯消除。...OpenGL中的正面、背面 上文中提到了一个概念背面。 正面 背面都是OpenGl人为定义的概念。 正面:点的绘制顺序是:逆时针 背面:点的绘制顺序是:顺时针 ?...首先我们通过生活经验来思考,如果出现2个正面重叠的情况时,应该显示的是距离我们更近的那一部分,因为远的那一部分被遮挡了,相当更远的那一部分成了“隐藏面”绘制时应该被放弃。...在3D模型中,距离观察者的距离表示为:深度。其实就是该像素点在3D世界中距离摄像机的距离,Z值。。 所以在绘制之前需要知道每个点距离观察者的距离,而存放计算结果的区域叫做:深度缓冲区。

    1.5K31

    Ubuntu Linux CPU GPU 性能测试

    这些对于得出可靠的结论,技术和数值比较,或者对于满足事物的工作原理非常重要。从技术上讲,Linux中所有可用的GPU基准测试工具当然只能在OpenGL渲染器下进行测试。...尽管GPU可能与某些版本的Direct3D兼容,但无法在Linux下测试此渲染器。 GLX-Gears GLX gears是一种流行的OpenGL测试,它是“ mesa-utils”软件包的一部分。...该工具非常老旧,非常基础,仅测试了当今OpenGL功能的一小部分。过去,它用于确定专有驱动程序是否已安装并正常运行,因为开放源代码驱动程序的性能足够好,以至于在此测试中完全可以通过。...这些基准测试工具拥有实时的环境光遮挡,来自不同光源的相互作用光,HDR渲染,逼真的水以及带有大气光散射的动态天空。用户还可以设置抗锯齿级别,纹理质量和过滤,各向异性和着色器质量。...除了点击“基准”按钮(将分十步全面测试硬件)之外,还可以自由地四处游荡,更改一天中的时间(这会改变世界的照明条件)并准确确定最“弯曲”硬件的条件。

    25.2K72

    机器学习可以预测实际年龄,有助于揭示与衰老相关的因素

    更好地了解衰老的生物过程,有助于解决老年人更常见的健康问题,如心脏病和痴呆症。...这是因为,与每隔几周或几个月完全更新的大多数细胞不同,这些细胞的一部分在整个生命中都与我们同在。 研究人员分析了从1到94岁的133名健康个体中取出的纤维母细胞。...实验室培养这些细胞进行增殖,然后使用一种叫做RNA测序(RNA-Seq)的方法来寻找随着年龄增长而发生变化的细胞中的生物标志物。RNA-Seq利用深度测序技术来确定哪些基因在某些细胞中被激活。...为了验证该算法,该团队还使用了来自10名早衰症患者的纤维母细胞,这是一种以加速衰老为特征的遗传疾病。基于对这些患者的分子特征的分析,该模型预测的年龄,比他们的实际年龄大10岁左右。...虽然这项研究揭示了与年龄相关的生物标志物,但研究人员强调,仅仅因为某些东西可预测衰老并不意味着它是衰老的原因。

    47820

    Let’s Make-It-3D!上交&微软最新开源2D转3D生成研究,Star超过1k星

    机器之心专栏 机器之心编辑部 给你几张照片,你可以猜到在三维世界中他们究竟长什么样子吗? 我们可以凭借丰富的视觉先验知识,仅凭一张照片轻松推断出其3D几何形态及在不同视角下的样貌。...在第二阶段,该方法根据第一阶段得到的几何模型,将参考图像的高质量纹理映射到 3D 空间中。然后着重于增强参考视角中被遮挡区域的纹理。...为了更好地实现这一过程,该方法将一阶段的隐式表示导出到显式表示形式 —— 点云。...与 Marching Cube 导出的噪声网格相比,点云可以提供更清晰的几何特征,同时也有利于划分遮挡区域和非遮挡区域。 随后,该方法聚焦于优化遮挡区域的纹理。...点云渲染采用了基于 UNet 结构的 Deferred-Renderer (延迟渲染器),并同样使用来自预训练扩散模型的先验信息优化产生遮挡区域的精细纹理。

    61220

    随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

    机器之心报道 机器之心编辑部 Tracking Everything Everywhere All at Once....前段时间,Meta 发布「分割一切(SAM)」AI 模型,可以为任何图像或视频中的任何物体生成 mask,让计算机视觉(CV)领域研究者惊呼:「CV 不存在了」。...从该研究发布的 demo 看,运动追踪的效果非常好,例如追踪跳跃袋鼠的运动轨迹: 荡秋千的运动曲线: 还能交互式查看运动追踪情况: 即使物体被遮挡也能追踪运动轨迹,如狗在跑动的过程中被树遮挡:...消融实验与分析 研究者利用消融实验来验证他们设计决策的有效性,结果如表 2 所示。 在图 4 中,他们展示了由他们的模型生成的伪深度图,以展示学习到的深度排序。...需要注意的是,这些图并不对应于物理深度,然而,它们展示了仅使用光度和光流信号时,新方法能够有效地确定不同表面之间的相对顺序,这对于在遮挡中进行追踪至关重要。

    32130
    领券