首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

CMU提出基于学习的动作捕捉模型,用自监督学习实现人类3D动作追踪

在本项研究中,我们提出了一个用于单摄像头输入的基于学习的动作捕捉模型。我们的模型没有直接优化网格和骨骼参数,而是通过优化神经网络权重来预测给定单目RGB视频的3D形状和骨骼构造。...事实上,注释2D身体关节比注释3D关节或3D网格更容易,而光流被证明可以很容易地从合成数据泛化到真实数据。...我们展示了最先进的2D关节、光流和2D人像分割模型是如何用于推理出自认环境下视频中密集的3D人体结构的,而这些工作是难以通过手动操作来完成。...类似地,在每一帧中,3D关键点都会被投影,并且他们与相应被检测到的2D关键点之间的距离将会被惩罚。...未来研究的一个明确方向是对网格参数的迭代加性反馈,以获得更高的3D重建精度,然后同样以自监督的方式,在参数SMPL模型的顶部学习残差自由形态变形(residual free formdeformation

2.3K100

每日学术速递2.10

实验验证:通过在RealEstate10K和MiraData数据集上的实验,验证了NutWorld在视频重建质量上的高保真度,并展示了其在多种下游任务中的应用潜力,包括视频对象分割、帧插值、视频编辑和新视角合成...现有作品通过结合 3D 骨架和 RGB 视频,解决了 ADL 特有的挑战,例如相似的外观、微妙的运动模式和多个视点。但是,这些方法没有与语言集成,从而限制了它们推广到看不见的动作类的能力。...SKI模型不需要在推理阶段使用骨架数据,增强了它们在现实世界应用中的鲁棒性。 论文如何解决这个问题?...注意力图可视化: 对比了ViFiCLIP和SKI-VLM在NTU数据集上的动作关注图,展示了SKI-VLM如何更精确地关注视频中的关键人体部位。...重新网格化(Remeshing): 在优化迭代中自动重新网格化,以解决因大变形导致的网格质量下降问题。 3.

6500
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Unreal 骨骼动画入门(一)

    网格体 mesh 分为静态网格体 static mesh 和骨骼网格体 skeletal mesh 两种,两者的区别在于 skeletal mesh 可以被动画化,因为它具有和骨骼的绑定关系,通过移动骨骼可以实现对它的变形...这里需要提到一个「蒙皮」概念,蒙皮是指把 mesh 的顶点绑定到骨骼上,并且每个顶点可以被多个骨骼按一定权重进行控制。...Animation Sequence 是可在骨架网格体上播放的单个动画资源,记录骨骼随时间的运动状态信息,也就是定义了动画。...Editor 中编辑 blend space: 图片 在 blend space 中,我们可以根据两个参数的值来确定动画的混合逻辑,在 editor 的下方可以看到一个二维的坐标系,两个参数分别对应两个坐标轴...,拖动绿点可以在上方查看混合的效果: 图片 这里坐标轴的对应的名字和其变化范围可以在左侧的「Asset Details」中设置,这里将 x 轴设为方向,取值为 -90~90,y 轴设为移动速度,取值为

    1.1K60

    gltfOverview中文翻译

    因此被附加的对象将会允许对移动物体或者相机飞行进行建模。 nodes也可以使用在顶点蒙皮中:节点的层次结构可以用来定义动画角色的骨架。然后node将会指向一个网格体或者蒙皮。...蒙皮将会包含更多的信息关于如何将网格体基于当前的骨架姿势进行改变。 meshes meshes包含多个网格体。...这些网格体指向需要渲染的几何体数据,每一个mesh primitive有一个渲染mode,他是一个常量用来确定被渲染的是POINTS(点),LINES(线)或者TRIANGLES(面)。...materials描述了一个对象如何基于物理的材质属性被渲染。这里允许使用Physically Based Rendering(PBR)技术来确保被渲染对象的外观具有一致性。...依靠顶点蒙皮,他可以使网格体的顶点受到骨架当前姿势的影响。这里不翻译了,暂时用不到。Computing the skinning matrix和animations由于暂时用不到,也跳过了。

    1.7K40

    three.js之初探骨骼动画

    由于每个顶点可以被 4 个 bones 营销,因而每个顶点的 skinWeights 就采用一个 Vector4 表示。skinWeight 矢量中每个元素的取值范围应该在 0 到 1 之间。...例如,当设置为 0,骨骼对该顶点的位置没有影响。当设置为 0.5, 则对顶点的影响为 50%。 当设置为 100% 则对顶点的影响是 100%。...上述值表明第一个顶点受到mesh.bones10骨骼的影响有 80%, 受到 skeleton.bones2 的影响是 20%,由于另外两个 skinWeight 的值是 0,因而他们对顶点没有任何影响...骨骼动画的原理 骨骼(Bone)其实就是一个Object3D对象,可以把骨架看成是人体骨架,假如脊柱的根节点,那么大腿就是下一级节点,小腿就是更下一级的节点,如果大腿转动,那么小腿在世界坐标系必然会动,...skeletonHelper.material.linewidth = 2; scene.add( skeletonHelper ); return mesh; }, 最后就是使用gui进行界面控制,这里只说一下蒙皮网格有一个

    2.6K50

    AAAI 2018 | 时空图卷积网络:港中文提出基于动态骨骼的行为识别新方案

    在 2D 或 3D 坐标形式下,动态骨骼模态可以自然地由人类关节位置的时间序列表示。然后,通过分析其动作模式可以做到人类行为识别。...帧间边(inter-frame)连接相邻帧之间的相同关节。ST-GCN 中输入的是联合坐标。 为了跨越上述限制,我们需要一种新方法自动捕捉关节的空间构型、时间动态中所嵌入的模式。...这不仅能获得更强的表达能力和更高的性能(如我们的实验所示),而且还使其易于在不同的环境中推广。在通用 GCN 公式化的基础上,我们还基于图像模型的灵感研究设计了图卷积核的新策略。...流程概览 基于骨骼的数据可以从运动捕捉设备或视频的姿态估计算法中获得。通常来说,数据是一系列的帧,每一帧都有一组联合坐标。给定 2D 或 3D 坐标系下的身体关节序列,我们就能构造一个时空图。...这可以被认为是一个基于图像的 CNN 模拟,其中输入由 2D 图像网格上的像素强度矢量形成。对输入数据应用多层的时空图卷积操作,可以生成更高级别的特征图。

    1.4K60

    【笔记】《Laplacian Surface Editing》的思路

    这篇04年的文章使用拉普拉斯坐标来对网格进行编辑(Mesh editing), 从而能在保留表面细节和结构的情况下对表面进行变形....PartC 网格编辑 知道了如何求解拉普拉斯坐标和如何将拉普拉斯坐标还原为普通坐标后, 后续的操作也就简单了起来....对于三维网格编辑, 我们所需的操作就是先选择感兴趣的变形区域ROI, 得到ROI边界的顶点, 这一方面是为了保证变形不要影响到整个网格区域造成不良的效果, 另一方面是为了减少需要计算的点从而加快计算的速度...最小化约束就可以还原出绝对坐标也就是重建出网格编辑后的新顶点, 将这些点应用到原网格上就完成了对网格的修改 在实际计算中, 我们会发现构建稀疏矩阵来得到线性方程组的过程运行速度很慢, 如果想要达到文章所说的交互式曲面变形的话我们需要对代码流程进行一些调整...有些特殊的迁移应用可能会需要和PartC的网格编辑一样要求某些点的坐标对应, 此时需要对参数化方法进行一些额外的调整 而由于参数化的原因, 有时候我们避免不了将大区域和小区域进行对齐, 此时对于中间没有被参数化到的点一般有两种处理方法

    4.2K91

    CGAL功能大纲

    另一方面,这个对象类在布尔集合操作下是不封闭的,很多例子都可以说明这一点,如上图所示,它可以使用多维数据集上的布尔集合操作生成。包围隧道的顶点,或连接"屋顶"与立方体的边缘是非流形情况。...二维轮廓2D Envelopes 这个包由一些函数组成,这些函数在二维中计算一组任意曲线的下(或上)包络线。...输出用包络图表示,即将x轴细分为区间,这样在每个区间上诱导包络线的曲线的恒等式就是唯一的。 三维轮廓3D Envelopes 这个包由计算一组任意曲面的三维上(或下)包络线的函数组成。...输出被表示为一个二维包络图,也就是一个平面细分,使得在每个图单元上对应包络线的表面的标识是唯一的。...网格变形Triangulated Surface Mesh Deformation 这个包提供了曲面网格变形算法,该算法在一些顶点的位置约束下为曲面网格的顶点提供新的位置,而不需要除了曲面网格本身之外的任何其他结构

    1.3K10

    动感光波发射!Unity AR开发之 3d 物体识别小记

    选取需要识别的物体 对于3d物体的识别,需要符合以下几点标准: 不透明的刚性物体,并且物体没有可移动的部位 表面特征较有对比度,不支持柔软的或者可以变形的物体 不规则的图案或者形状越多识别会越好 不能太光滑导致有反光效果...扫描时,必须注意在室内环境下,且没有集中的强光照射,其实就是避免不必要的物体反光和照射下产生的阴影导致识别不准确。将所有网格都填满时,识别就可以结束。这一步需要比较多的耐心。。。...但对于3d物体识别的跟踪,最大的支持数为2. Camera Direction 定义摄像头下世界空间的原点,在摄像头移动时,坐标系为世界坐标系的其它object的position将会跟随这个原点移动。...CAMERA 世界坐标是以摄像头为准的,所以场景里的其它物体不会跟随识别target移动。 DEVICE_TRACKING 这个场景下经过测试,场景里的其它物体不会跟随识别target移动。...还有一点,vuforia中的ARcamera是没有默认自动对焦的,需要自己在script中设置。

    6.5K21

    基于少量图像的三维重建综述

    作者:于航, 付彦伟, 姜柏言, 薛向阳 来源:智能科学与技术学报 编辑:郑欣欣@一点人工 一点智能 00 摘要 基于少量图像的三维重建被认为是第三代人工智能的经典应用之一。...2.1.3 视角信息 视角信息表示以相机(观察者)为中心建立坐标系,在相机坐标系下,物体的坐标即此时相机眼中它的位置。每次对物体进行位置调整后,需要重新设定相机的外部参数矩阵。...目前,隐函数作为人体表面边界点的有效约束,已经被越来越多地引入三维重建工作中。隐函数采样示意如图1 所示,在特定采样空间内对三维网格进行采样,可得到内部点云和外部点云。...进一步的实验表明,对于在单一图像、噪声点云和粗糙的离散体素网格中进行三维重建的挑战性任务,OccupancyNet在定量和定性结果上都具有竞争力。...作者将源人体网格的姿态迁移到目标人体网格的变形上,而源人体网格和目标人体网格可能来自不同的人物体型。以往的研究一方面需要成对的源人体网格和目标人体网格之间包含点对点的对应关系,可能需要大量的人工标注。

    1.2K40

    深度学习背景下的图像三维重建技术进展综述

    体素是三维空间中的正方体,相当于三维空间中的像素;网格是由多个三角形组成的多面体结构,可以表示复杂物体的表面形状;点云是坐标系中的点的集合,包含了三维坐标、颜色、分类值等信息。...Tang等人(2019)综合多种方法设计了骨架桥接网络,该网络分为三个阶段分别重建物体的骨架模型、体素模型和网格模型,使用MLP提取骨架点,根据图像特征和骨架点重建粗糙的体素模型,随后使用3D-CNN处理体素模型并将体素模型网格化...Kolotouros等人(2019)将输入图像编码为低维特征向量,附加到网格模型的三维坐标,随后使用图卷积神经网络对网格进行处理,回归网格模型顶点的三维坐标。...表1 总结了本文介绍的图像三维重建方法。 03  数据集与实验对比 在本节中,主要针对深度学习背景下的图像三维重建中的常用数据集以及不同方法在ShapeNet数据集上的实验对比进行相应的介绍。...Wang等人(2018)方法通过对椭球体进行变形来获取网格模型,网格模型可以完整地表示物体表面,因此在CD指标上的数值大于之前的方法在CD指标上的数值,但对物体的孔洞和细小部位的重建效果较差,在IoU指标上的性能较差

    6.4K02

    HumanNeRF:从单目视频中实现移动人物的自由视点渲染

    运动场被分解为骨骼刚性和非刚性运动,分别表示为离散网格和连续场。除此之外,还改进了使用现成的身体姿势估计器初始化的身体姿势,从而获得更好的对齐。..., T_{NR} 从骨架驱动的变形开始,并产生偏移∆x到它。...实际上, T_{skel} 提供了粗变形的影响,而 T_{NR} 提供了更非刚性的影响,例如衣服。...在图像上采样大小为H×H的G个patch,并在每个批次中渲染总共G×H×H射线。将渲染的patch与输入图像上位置相同的patch进行比较。在具体实施中,使用G=6和H=32。...图3 定量测试结果 HyperNeRF在实验中并没有为新视图合成产生有意义的输出,如图4所示,这可能是因为它依赖于多个视图(移动相机)来构建连贯的 3D 模型。

    59610

    行为识别综述

    局部表示方式包括时空兴趣点检测、局部网格表示两种方法。 时空兴趣点检测是在时空域内提取出兴趣点,该兴趣点是空域时域均变化显著的邻域点,如3D Harris。...常用的时空兴趣点有:STIP[1];Cuboid[2];MEI+MHI[3];HoG+HoF[4]。 局部网格表示类似于整体网格表示,只不过是将局部的patch放入了网格单元中。...相机运动估计:通过估计相机运动来消除背景上的光流以及轨迹;假设相邻的两帧图像之间的关系可以用一个投影变换矩阵来描述,即后一帧图像是前一帧图像通过投影变换得到的;为了准确估计投影变换,采用了SURF特征以及光流特征来获得匹配点对...2.4 two stream 2.4.1 方法一 在这项工作中,作者使用两种新的方法构建了two stream 架构,证明了在没有参数增加的情况下,性能有了较大的提升。...2.5.2 基于骨架方法二 ST-GCN 的层次性消除了手动划分部分或遍历规则的需要。这不仅能获得更强的表达能力和更高的性能,而且还使其易于在不同的环境中推广。

    2.3K21

    三维变形

    常见的变形类型有: 基于控制网格的变形 Laplacian网格编辑 空间分片刚性变形 ---- 基于控制网格的变形 这类变形的基本思想,是基于这么一个表示:模型 = 控制网格 * 基于控制网格的坐标 变形的基本方法有两步...在变形的时候,用户通过操作控制网格,来达到模型的相应变形。 控制网格是模型的一个简单近似,它比较容易编辑操作。常见的控制网格有三角形网格,四边形网格。...如下图所示,左图是原始模型,中间是GC的变形结果,右图是MVC的变形结果。明显可以看出,GC的结果在保持模型的刚性上具有一定的优势。...---- Laplacian网格编辑 网格微分坐标:如下图所示,它刻画网格的局部细节,也就是信号处理里的高频信号。网格在变形的过程中,尽量保持住局部的微分坐标不变,就能保持住网格的局部细节。...微分坐标可以应用于各种网格编辑操作,如细节转移: 细节混合: 网格移植: ---- 空间分片刚性变形 基于控制点的变形,原理是分片刚性变形。在点云中采样N个控制点,每个控制点附着一个刚性变换。

    1K30

    Unity Metaverse(五)、Avatar数字人换装系统的实现方案

    实现该系统涉及到的无非是老生常谈的几项内容: •Skinned Mesh Renderer - 蒙皮网格•Material - 材质球•Avatar Bone - 骨架 重要点,也是核心点,就是基于Avatar...数字人的同一套骨架,也就是讲当数字人进行换装时,切换的是Skinned Mesh Renderer中的Mesh网格及Material材质球,骨架是不会去改变的。...如何将RPM中编辑的Avatar导入到Unity 本专栏的第一篇内容中有介绍RPM的使用以及将Avatar导入Unity的过程,下面简要说明。...导出fbx 如何提取模型中的Mesh网格、Material材质、及Texture贴图 Mesh网格和Material材质的提取可以直接在Skinned Mesh Renderer组件中获取并通过实例化并调用...: •fbx导入到Unity后,在Import Settings导入设置中将Material Location类型改为Use External Materials(Legacy),应用后编辑器会在该fbx

    3.3K50

    Unity 水、流体、波纹基础系列(二)——方向流体(Directional Flow)

    本文重点: 对齐纹理和流体方向 把表面切割为瓦片 无缝混合瓦片 混淆视觉效果 这是流体材质的第二篇,继上一篇纹理变形之后,讲述如何对齐流体而不再是将它们进行扭曲。...(顺其自然的涟漪) 1 各向异性模式 让纹理变形以模拟流动时,它最终可能在任何方向上被拉伸或挤压。这意味着无论如何变形,看起来效果都还不错。但这仅在各向同性模式下才有可能。...在我们的着色器中使用此函数可获得最终流体的UV坐标。我们将为其提供float(0,1)作为流向量- [0,1]代表默认方向-切片属性,以及由速度调制的时间。然后,我们使用结果对模式进行采样。 ?...(滑动波纹模式) 2.2 纹理旋转 要旋转UV坐标,我们需要一个2D旋转矩阵,如“渲染1,矩阵”教程中所述。如果流向量 [x, y]具有单位长度,则它表示单位圆上的一个点。...通常,在没有偏移的情况下,我们必须平移一半的图块,反之亦然。我们可以方便地在FlowCell中执行此操作,方法是将未缩放的偏移量减去1并将其减半。

    4.5K50

    Nature|仅根据靶点结构设计蛋白质的结合蛋白

    摘要 在不使用其他信息的情况下,设计与靶点蛋白表面特定位点结合的蛋白质是一个突出的挑战。我们首先对蛋白质表面选定区域的可能结合模式的巨大空间进行了广泛探索,然后在最有希望的结合模式附近加强搜索。...然而,对于许多靶点蛋白来说,在蛋白表面没有明显的口袋或裂缝,可以用来将少量的侧链放入其中。以上方法由少量的热点残基引导,因此仅限于一小部分可能的相互作用模式。...我们首先将氨基酸与靶点蛋白对接,并将通常有数十亿个氨基酸进行有利的氢键或非极性相互作用的骨架坐标和靶点结合能存储在一个6维空间哈希表中,以便快速查找(图1a;见方法)。...这些基序被用来指导另一轮对接和设计:将库中的支架叠加在基序上,将有利的互动基序残基转移到骨架上,并对骨架序列的其余部分进行优化,以便与靶点产生进一步的相互作用,通过骨架扭转角最小化来增加骨架的灵活性,以提高与靶点的形状互补性...设计成功的决定因素 为了使我们的从头设计策略获得成功,我们必须在所设计的约60个残基序列中编码关于折叠的单体结构和靶点结合界面的信息:没有折叠到正确的结构,或者折叠到预定的结构但没有与靶点结合的设计将失败

    2.1K20

    ECCV | Pixel2Mesh:单目彩色相机重建三维模型

    与现有的方法不同,本文的网络在基于图卷积神经网络中表示三维网格,并利用从输入图像中提取的感知特征,通过逐步变形椭球面来生成正确的几何形状。...我们采用由粗到精的策略使整个变形过程稳定,并定义各种网格相关的损耗来捕获不同层次的属性,以保证视觉上的吸引力和物理上准确的3D几何。...此时我们很好奇,如何将二维(图像卷积)和三维(Mesh)联系在一起的呢?大家是否注意到图中的由上到下的淡蓝色箭头没有?...我们也连接三个顶点,如果它们被添加到同一个三角形(虚线)图 4a。 ? 2.loss损失 本文定义了四种损失来约束输出形状的性质和变形过程,以获得满意的结果。...在第一个变形块中,由于该变形块的输入为处处光滑的椭球体,故其表现为表面光滑项;从第二个块开始,它可以防止3D网格模型变形太多,因此只向网格模型添加细粒度的细节。

    2.1K10

    技术解码 | Web端AR美颜特效技术实现

    笔者总结了在Web端实现此功能的几个技术要点,跟大家一起探讨一下。...技术实现 抽象整体的实现思路如下,使用AI检测模型检测输入帧数据,获得人脸的关键点,根据关键点进行面部的建模,然后进行美颜算法和美妆纹理的渲染。...人脸建模 在获取到人脸点位后,针对业务需求对点位进行预处理,按照2D展示的要求进行网格的整合。 为了支持更多类型的面罩,实际需要的网格要比模型返回的网格外扩一圈,通过拟合算法,在面部轮廓进行扩展。...对于定位的算法,有以下几点要求: 定位准确。制作时定位在鼻尖部位的素材在渲染时也需要跟随到人脸的鼻尖部位。 覆盖全面。可以定位到人脸的任何一个位置,而不是只能定位在模型返回的有限的关键点上。...,计算出定位点的坐标值 美妆合成 与头饰贴纸不一样的是,美妆是贴着面部轮廓,根据五官分布采样渲染到网格上的。

    2.5K30

    基于深度学习的单目人体姿态估计方法综述(一)

    近年来,随着深度学习在图像分类、目标检测、语义分割等许多计算机版本任务中表现出良好的性能,人体姿态估计也通过采用深度学习技术获得了快速的发展。...它具有表示简单、灵活的优点,但也存在着缺乏纹理信息,即没有人体的宽度和轮廓信息等缺点。...基于体积的现代模型以网格形式表示,通常通过3D扫描捕获。广泛使用的基于体积的模型包括人的形状完成和动画,蒙皮多人线性模型和统一的变形模型。 三、三维人体姿态估计 ? ?...现有的数据集大多是在有限的可推广的受限环境下获得的。对于单人姿势估计,通常提供图像中的人的边界框,因此不需要结合人检测过程。在本节中,我们将三维单人姿势估计方法分为无模型和基于模型两类。...Mehta等人提出了一种自下而上的方法,通过使用2D姿势和部分相似性字段来推断人物实例。提出了一种遮挡鲁棒姿态映射(ORPM)算法,该算法可以在不受人数影响的情况下提供多种类型的遮挡信息。

    1.1K20
    领券