Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >无限想象空间,用Python玩转3D人体姿态估计

无限想象空间,用Python玩转3D人体姿态估计

作者头像
AI科技大本营
发布于 2020-10-27 02:38:31
发布于 2020-10-27 02:38:31
1.4K00
代码可运行
举报
运行总次数:0
代码可运行

前言

姿态估计,一直是近几年的研究热点

它就是根据画面,捕捉人体的运动姿态,比如 2D 姿态估计:

再比如 3D 姿态估计:

看着好玩,那这玩应有啥用呢

自动驾驶,大家应该都不陌生,很多公司研究这个方向。

自动驾驶里,就用到了人体行为识别

通过摄像头捕捉追踪人体的动作变化,根据肢体动作或变化角度判断人体动作行为,可用于无人车、机器人、视频监控等行为分析需求场景。

而这些的基础,就是人体的姿态估计。

再比如,虚拟形象

通过真人驱动,让虚拟形象具备类比真人的肢体动作,并支持与3D人脸特效、手势识别等功能结合应用,让虚拟形象更加灵活生动,可用于虚拟IP驱动、肢体驱动类游戏、远程授课或播报等场景。

姿态估计,无疑有着巨大的应用价值

但今天,咱们说的这个算法,比上文提到的,还要酷炫一些!

它就是 FrankMocap。

FrankMocap

FrankMocap 是港中文联合 Facebook AI 研究院提出的3D 人体姿态和形状估计算法

不仅仅是估计人体的运动姿态,甚至连身体的形状手部的动作都可以一起计算出来。

算法很强大,能够从单目视频同时估计出 3D 人体和手部运动,在一块 GeForce RTX 2080 GPU 上能够达到 9.5 FPS。

缺点就是,速度有点慢,计算量较大,达到实时性有一定难度。

不过随着硬件的快速发展,这都不是问题,「老黄刀法」很给力。

FrankMocap 算法就在这几天,刚刚开源,有 Python深度学习基础的朋友,不容错过。

项目地址:

https://github.com/facebookresearch/frankmocap

算法使用 SMPL-X 人体模型。

给定一张彩色图片,通过两个网络模块分别预测手部姿态和人体姿态。

然后再通过整合模块将手和身体组合在一起,得到最终的3D全身模型,整个流程如下图所示:

在具体的各个模块的实现,那就涉及具体的数学公式了。

本文就不多做扩展了,感兴趣的小伙伴,可以直接看论文。

论文地址:

https://arxiv.org/pdf/2008.08324.pdf

论文对每个模块的公式,记录的很详细。

FrankMocap 算法怎么玩?

这里有详细的安装教程:

https://github.com/facebookresearch/frankmocap/blob/master/docs/INSTALL.md

除了常规的第三方库,还需要 Detectron2 用于手部动作捕捉,以及 Pytorch3D 做姿态渲染。

推荐使用 Anaconda 配置,环境配置完毕,就可以开始体验了。

使用方法很简单:

如果只做身体姿态捕捉,可以运行如下命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# using a machine with a monitor to show output on screen
python -m demo.demo_bodymocap --input_path ./sample_data/han_short.mp4 --out_dir ./mocap_output

# screenless mode (e.g., a remote server)
xvfb-run -a python -m demo.demo_bodymocap --input_path ./sample_data/han_short.mp4 --out_dir ./mocap_output

运行效果:

如果只做手部姿态捕捉,可以运行如下命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# using a machine with a monitor to show outputs on screen
python -m demo.demo_handmocap --input_path ./sample_data/han_hand_short.mp4 --out_dir ./mocap_output

# screenless mode  (e.g., a remote server)
xvfb-run -a python -m demo.demo_handmocap --input_path ./sample_data/han_hand_short.mp4 --out_dir ./mocap_output

运行效果:

全身的姿态估计,使用如下指令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# using a machine with a monitor to show outputs on screen
python -m demo.demo_frankmocap --input_path ./sample_data/han_short.mp4 --out_dir ./mocap_output

# screenless mode  (e.g., a remote server)
python -m demo.demo_frankmocap --input_path ./sample_data/han_short.mp4 --out_dir ./mocap_output

运行效果:

总结

3D 人体全身运动姿态捕捉,可以做很多有意思的事情。

看到这项技术,你最先想到的,是能做个什么好玩的应用呢?

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
更多精彩推荐打通语言理论和统计NLP,Transformers/GNNs架构能做到吗?
自拍卡通化,拯救动画师,StyleGAN再次玩出新花样
干货!高频手撕算法合集来了
放弃 Windows 后 ,开源操作系统能成为主流桌面系统吗?
起底 ARM:留给中国队的时间不多了
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-10-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Python+OpenCV+OpenPose实现人体姿态估计(人体关键点检测)
人体姿态估计(Human Posture Estimation),是通过将图片中已检测到的人体关键点正确的联系起来,从而估计人体姿态。
不脱发的程序猿
2021/01/20
11.3K0
科学怪物!3D人体全身运动捕捉系统,港中文联合Facebook出品
3D人体姿态和形状估计在最近几年是一个重要的研究热点,但大部分工作仅仅关注人体部分,忽略了手部动作,港中文联合Facebook AI研究院提出了一种从单张图片同时估计人体姿态和手部动作的新方法,展示效果好似科学怪物。
AI科技评论
2020/09/14
1.2K0
科学怪物!3D人体全身运动捕捉系统,港中文联合Facebook出品
3D模型学会了「唱、跳、Rap、篮球」,GitHub网友也沉迷「鸡你太美」
这段「看到停不下来」的 demo 来自一位用户名为「zh-plus」的 GitHub 网友。他用 CVPR 2019 接收论文中的一项技术实现了这种效果。
机器之心
2019/12/12
1.1K0
3D模型学会了「唱、跳、Rap、篮球」,GitHub网友也沉迷「鸡你太美」
CVPR 2020 论文大盘点-人体姿态估计与动作捕捉篇
本文盘点CVPR 2020 所有人体姿态估计(Human Pose Estimation)、手势识别(Gesture Recognition)、人体形状与姿态估计(Human Shape and Pose Estimation)、人体运动捕捉(Human Motion Capture)相关论文,总计27篇,对文献进行了分类汇总,希望对大家有帮助。
CV君
2020/06/28
3.6K0
CVPR 2020 论文大盘点-人体姿态估计与动作捕捉篇
3D 人体姿态估计简述
3D Human Pose Estimation(以下简称 3D HPE )的目标是在三维空间中估计人体关键点的位置。3D HPE 的应用非常广泛,包括人机交互、运动分析、康复训练等,它也可以为其他计算机视觉任务(例如行为识别)提供 skeleton 等方面的信息。关于人体的表示一般有两种方式:第一种以骨架的形式表示人体姿态,由一系列的人体关键点和关键点之间的连线构成;另一种是参数化的人体模型(如 SMPL [2]),以 mesh 形式表示人体姿态和体型。
OpenMMLab 官方账号
2022/02/15
3.4K0
3D 人体姿态估计简述
博客 | Github开源人体姿态识别项目OpenPose中文文档
人体姿态识别与估计的应用场景:抖音尬舞机、体育动作教学、3D健身教练、3D试衣、绘画辅助、游戏人物动作采集。
AI研习社
2018/12/18
10.6K1
博客 | Github开源人体姿态识别项目OpenPose中文文档
3D人体姿态估计
Coarse-to-Fine Volumetric Prediction for Single-Image 3D Human Pose
用户1148525
2019/05/26
2K0
基于深度学习的单目人体姿态估计方法综述(一)
原文:Monocular Human Pose Estimation: A Survey of Deep Learning-based Methods
计算机视觉
2021/03/16
1.8K0
斯坦福和Adobe联合提出人体姿态估计SOTA新方法
人类建立AI系统,大部分用来处理我们周围的环境,因此人体姿态估计成为一个很流行的计算机视觉研究领域就不足为奇了。在最近的论文《Contact and Human Dynamics from Monocular Video》中,一个来自斯坦福大学和 Adobe 的研究团队提出了一种新方法,通过轨迹优化(trajectory optimization)将学习姿态估计和物理推理(physical reasoning)结合起来,从单目(monocular)视频中动态提取有效的全身运动。研究人员说,这种方法产生的动作在视觉和物理上比state-of-the-art方法更可信。
McGL
2020/09/03
8270
快速单目三维人手和身体的运动捕捉回归与整合
人体动作的本质细微差别往往是通过肢体动作和手势的结合来传达的,但现有的单目动作捕捉方法大多侧重于身体动作捕捉而忽略手的部分,或者只关注手的动作捕捉而不考虑身体动作。在本文中提出了FrankMocap运动捕捉系统,可以估计三维人手和身体运动。
AIWalker
2020/12/17
1.7K0
快速单目三维人手和身体的运动捕捉回归与整合
SIGGRAPH | 6个惯性传感器和1个手机实现人体动作捕捉、定位与环境重建
机器之心专栏 机器之心编辑部 近年来,基于惯性的人体动作捕捉技术迅速发展。它们通过在人体上穿戴惯性传感器,实时测量人体的运动信息。然而,这就好比一个人在蒙着眼睛走路——我们可以感受到身体的运动,但随着时间的累积,我们越来越难以确定自己的位置。 本文则试图打开惯性动作捕捉的「眼睛」。通过额外佩戴一个手机相机,我们的算法便有了「视觉」。它可以在捕获人体运动的同时感知环境信息,进而实现对人体的精确定位。该项研究来自清华大学徐枫团队,已被计算机图形学领域国际顶级会议SIGGRAPH2023接收。 论文地址:htt
机器之心
2023/05/16
5040
SIGGRAPH | 6个惯性传感器和1个手机实现人体动作捕捉、定位与环境重建
用于单目3D人体姿态估计的局部连接网络,克服图卷积网络限制
本文是被人工智能领域的顶级期刊 IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI)于2020年8月接收的论文《用于单目3D人体姿态估计的局部连接网络(Locally Connected Network for Monocular 3D Human Pose Estimation)》的解读。
AI科技评论
2020/10/27
1.1K0
用于单目3D人体姿态估计的局部连接网络,克服图卷积网络限制
CVPR2021:单目实时全身动作捕捉(清华大学)
Monocular Real-time Full Body Capture with Inter-part Correlations
计算机视觉
2021/05/20
9580
动态多尺度图表达3D人体骨架运动,实现精准预测效果超SOTA
现有的基于3D人体骨架的运动预测方法往往不考虑身体不同部位之间的关联关系,或是仅考虑单一尺度的关节点关系。
小白学视觉
2022/04/06
1.3K0
动态多尺度图表达3D人体骨架运动,实现精准预测效果超SOTA
PoseFormer:首个纯基于Transformer的 3D 人体姿态估计网络,性能达到 SOTA
本文分享一篇的论文『3D Human Pose Estimation with Spatial and Temporal Transformers』。文中提出首个纯粹基于Transformer 的架构,在不涉及卷积的情况下在视频中实现3D人体姿态估计。算法在Human3.6M和MPI-INF-3DHP数据集上均达到SOTA performance,并在 in the wild 视频中有着不错的表现。
AI算法与图像处理
2021/04/21
2.4K0
PoseFormer:首个纯基于Transformer的 3D 人体姿态估计网络,性能达到 SOTA
单张图像重建3D人手、人脸和人体
为了便于分析人类的行为、互动和情绪,本文从单目图像中计算出人体姿态、手姿态和面部表情的三维模型。为了实现这一点,本文使用数千个3D扫描来训练统一的人体3D模型,SMPL-X,它通过完全铰接的手和富有表情的脸来扩展SMPL。没有成对图像和标签,直接回归SMPL-X的参数是非常具有挑战性。因此,本文采用SMPLify方法,估计二维特征,然后优化模型参数来拟合特征。本文在以下几个重要方面对SMPLify进行了改进:
AIWalker
2021/01/05
2.5K0
CVPR2022|谷歌 实时3D人体关键点检测&姿态估计,已加入mediapipe!论文速递2022.9.14!
CVPR2022论文和代码整理:https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo
AI算法与图像处理
2022/12/11
1.9K0
ST-GCN 实现人体姿态行为分类
作者 | 李秋键 出品 | AI科技大本营(ID:rgznai100) 引用 人体行为识别是计算机视觉及机器学习方面的热门研究领域。它在对视频中的人类行为进行运动分析、行为识别乃至延伸至人机交互领域都有着非常广泛的应用。研究初期,人体行为识别主要是以基于静态图像为研究对象。通过提取静态图像中的人体动作特征并对动作进行分类。然而仅基于静态图像来进行识别人体行为的局限性在于人体行为是连续、动态的,单凭一张静态图像无法进行判断识别。而基于视频为研究对象,可以将视频看作连续静态图像的时间序列。近两年,很多基于视频为
AI科技大本营
2023/04/14
1.3K0
ST-GCN 实现人体姿态行为分类
ECCV 2022 | 普通VR设备实现全身运动捕捉,ETH&Meta为虚拟人物形象添加了下半身
近日,Meta Connect 大会上「有腿」的虚拟世界人物形象引起机器学习和VR社区的高度关注。人们意识到,在构建元宇宙的美好愿景中,虚拟形象的生动逼真是非常重要的。
机器之心
2022/12/15
6480
ECCV 2022 | 普通VR设备实现全身运动捕捉,ETH&Meta为虚拟人物形象添加了下半身
任你旋转跳跃不停歇,也能完美呈现3D姿态估计 | 代码开源
让AI通过预测,捕捉你「左手画龙,右手画彩虹」的动作,对于AI理解人类行为至关重要。
量子位
2020/03/10
1.1K0
任你旋转跳跃不停歇,也能完美呈现3D姿态估计 | 代码开源
推荐阅读
相关推荐
Python+OpenCV+OpenPose实现人体姿态估计(人体关键点检测)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验