整理:AI算法与图像处理
CVPR2022论文和代码整理:https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo
ECCV2022论文和代码整理:https://github.com/DWCTOD/ECCV2022-Papers-with-Code-Demo
论文: https://arxiv.org/abs/2206.11678
代码:https://mediapipe.dev/
摘要: 我们展示了 BlazePose GHUM Holistic,这是一种用于 3D 人体地标和姿势估计的轻量级神经网络管道,专为实时设备上推理而定制。BlazePose GHUM Holistic 支持从单个 RGB 图像进行动作捕捉,包括头像控制、健身追踪和 AR/VR 效果。我们的主要贡献包括 i) 一种新的 3D 地面实况数据采集方法,ii) 更新的 3D 身体跟踪与额外的手部标志和 iii) 从单目图像估计全身姿势。
MUST-VQA: MUltilingual Scene-text VQA
Out-of-Vocabulary Challenge Report
DevNet: Self-supervised Monocular Depth Learning via Density Volume Construction