前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >什么是体积视频?

什么是体积视频?

作者头像
用户1324186
发布于 2022-04-11 11:29:58
发布于 2022-04-11 11:29:58
5.2K0
举报
文章被收录于专栏:媒矿工厂媒矿工厂

来源:YouTube 主讲:Kooboto - Creative VTuber Researcher 内容整理:周凯 本文介绍了体积视频(Volumetric Video)的解释,创建体积视频所需的设备,并给出了具体的用例。

目录

  • 体积视频释义
  • 用例
    • Unity Metacast
    • Chelmico Easy Breezy
    • Filmmaking / Demonic
    • Google Immersive Light Field Video
  • 总结

体积视频释义

体积视频在三维空间中捕捉实时画面,并且将其转换为 3D 模型,该模型可以放置在任何 3D 环境中,如虚拟现实环境,元宇宙或者增强现实等。在消费级别,捕获体积视频可以只包括一个深度相机,在生产级别,这可能包括大量的相机,几十台或上百台相机指向目标场景,并且有相同数量的深度相机用于捕捉深度信息,进一步生成点云。将所有的数据进行融合,从而可以得到体积视频。

深度传感器类似激光雷达,通过测量红外激光反射回来所需要的时间,计算点在 3D 空间中的位置,从而生成点云,这在一些设备上是非常容易的。例如某些 iPhone 型号上的前置摄像头就配备了红外深度相机,它使用与激光雷达不同的网格方法构建 3D 模型,一些 vtuber 使用苹果 AR 套件可实现更准确的面部跟踪。雷达已经出现了接近 50 年,并应用于科学和政府方面,但随着时间的推移,深度传感技术已经成为了创新媒体体验的工具。2008 年,radiohead 发布了仅使用点云可视化的纸牌屋音乐视频,自 2010 年以来,开源社区黑客和开发人员帮助开放了微软的硬件设备驱动,使得微软的设备可以用于各种实验,以创建自己的体积内容。

用例

体积视频仍然处于起步阶段,用例围绕特定需求展开。一个例子是营销和广告,当涉及到复杂的摄像机移动时,这些项目通常需要专门的设备,精心策划的镜头和重新拍摄的空间。体积视频的另一种用途可能是用于培训和教育,例如医疗保健,它可以为医生与患者远程互动开辟新途径。在医疗领域,体积视频和表演短片也已经显示出其增长和潜力。

Unity Metacast

2021 年 10 月,Unity 推出了一个 3D 引擎 metacast,用于提供实时体育内容。观众,教练员或裁判员可以选择从任何角度甚至从运动员自己的角度观察整个赛事。然而,体积视频的优势不仅仅在于 3D 捕捉,它还引入了操纵最终模型的能力,一旦将所有数据拼接在一起,就可以添加骨架,调整网格,重新定位四肢,头部,面部等,并对用户的交互做出反应。

Chelmico Easy Breezy

Chelmico 的音乐视频演示了体积视频如何将现场人类舞蹈编排与风格化的 3D 编辑巧妙地混合在一起,并且可以不受限制地重新调整单个表演的用途。虽然音乐视频的体积捕捉是由 4D views 和 crescents 4D 工作室完成的,但他们的现场直播表演是在佳能的川崎体积视频工作室捕捉的,而且世界各地都有体积捕捉工作室,这可以带来一些有趣的创意合作。

Filmmaking / Demonic

体积视频也可以成为电影制作整个场景的有力工具,可以用于拍摄,然后在后期制作中决定取景相机的运动和光照条件。在 Neil blumkamp 的 2021 年电影恶魔中,他使用了体积视频作为一种直观的表示来模拟世界,使用了超过 300 台 4K 相机,纯粹依靠视频进行体积捕捉,推断 3D 信息的过程仅来自视觉数据,这带来了挑战。目前,体积捕捉的质量与电影或高清视频的质量不能相提并论。只要技术不断进步和发展,人类总会找到新的和创造性的方式将现实世界带入数字世界。最终,虚拟将变得与现实无法区分。

Google Immersive Light Field Video

Google 的沉浸式光场视频技术引入了一种交互方式,可以自由查看超过 180 度的体积视频。它还可以让你改变视角,看到物体背后的峰顶,或在反射中看到不同的角度。这种沉浸式为视频内容增加了一个新的深度和视差水平。

总结

在一个充满 3D 引擎虚拟制作的世界中,体积视频真正意味着什么?它的真正含义是保持真实感。想象一下能够以全 3D 的形式记录您所爱之人的确切举止和微妙的面部表情;想象在虚拟现实中探索童年的家,看着回忆在面前上演;想象体验一场真正的音乐会,从任何角度来看舞台;想象下一代实时流媒体,其中聊天可以选择任何角度观看。虽然体积视频只是冰山一角,但看到这种思维方式将如何影响未来的视频内容以及随之而来的内容,将是令人兴奋的创造精神。

最后附上演讲视频:

http://mpvideo.qpic.cn/0b2e64aaeaaazianoscgefrfb56dal3qaaqa.f10002.mp4?dis_k=d641874f19f94b0aa3fc20390d9141cd&dis_t=1649676561&vid=wxv_2335673789227040769&format_id=10002&support_redirect=0&mmversion=false

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 媒矿工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
使用体积视频创建数字人
如图所示是微软混合现实(由 metastage 运营)创建数字人的方法,使用 53 个 RGB 相机和 IR 相机动态捕捉人物动作,然后拼接成点云,进一步生成包含纹理的 mesh,最终变成可传输的 mp4。
用户1324186
2022/04/11
1.2K0
使用体积视频创建数字人
Arcturus on Volumetric Videos
Arcturus 所创建的 HoloSuite 平台是世界上第一个对体积视频进行编辑和分发的后处理平台。这项工作目前正处于沉浸式媒体下一阶段变革的前沿。该平台综合了体积视频的编辑和像用户传输流两项主要功能。Arcturus 不仅因这项工作而受益,而且也推动着体积视频能够落地于实际生产中。
用户1324186
2022/04/11
6740
Arcturus on Volumetric Videos
数字人深度报告!元宇宙下的爆火概念,技术和应用一文看懂
虚拟数字人指存在于非物理世界中,由计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、交互能力等)的综合产物。虚拟数字人可按人格象征和图形维度划分,亦可根据人物图形维度划分。人物形象、语音生成模块、动画生成模块、音视频合成显示模块、交互模块构成虚拟数字人通用系统框架。
科技旋涡
2022/03/30
1.6K0
数字人深度报告!元宇宙下的爆火概念,技术和应用一文看懂
多视角、体素、XR等新型视频服务技术(IBC2019)
本文是来自 IBC 2019 五篇技术文章的阅读总结,涉及多视角、体素和VR/AR等新型视频技术,翻译整理:郭帅。
用户1324186
2019/10/10
1.5K0
多视角、体素、XR等新型视频服务技术(IBC2019)
什么是LIDAR(激光雷达),如何标注激光点云数据?
自动驾驶汽车严重依赖输入的训练数据来做出驾驶决策,从逻辑上来说,数据越详细,车辆做出决策就越好,最重要的是更安全。虽然现代相机可以捕捉到非常详细的真实世界特征,但输出结果仍然是2D的,效果并不够理想,因为它限制了我们可以提供给自动驾驶汽车神经网络的信息,这意味着汽车必须学会对3D世界做出猜测。与此同时,相机捕捉信息的能力有限,比如在下雨的时候,相机捕捉到的图像几乎无法辨别,而激光雷达仍然可以捕捉信息。因此,2D相机无法在所有环境下工作,由于自动驾驶汽车是神经网络一个高危应用场景,我们必须确保构建的网络尽可能完美,这一切要从数据说起。理想情况下,我们希望我们的网络将3D数据作为输入,因为它需要对3D世界进行预测,这就是激光雷达的用武之地。
用户8699681
2022/06/27
1.9K0
《探索视频数字人:开启未来视界的钥匙》
在当今科技飞速发展的时代,视频数字人技术如一颗璀璨的新星,正逐渐成为各领域瞩目的焦点。它的出现,犹如一场科技风暴,彻底改变了传统的视频制作方式,为各个行业带来了前所未有的机遇与挑战。
正在走向自律
2024/12/18
1770
《探索视频数字人:开启未来视界的钥匙》
视觉+惯导+轮速融合的里程计方案(开源)
VIW Fusion是一种基于优化的视觉+惯导+轮速的里程计方案,感谢由港科大空中机器人小组在VINS Fusion方面所做的杰出工作,VIW融合是在VINS融合的基础上发展起来的。主要特征有:
点云PCL博主
2022/01/20
2.3K0
基于约束捆集调整的多相机运动结构恢复方法
文章:CONSTRAINED BUNDLE ADJUSTMENT FOR STRUCTURE FROM MOTION USING UNCALIBRATED MULTI-CAMERA SYSTEMS
点云PCL博主
2023/08/21
5020
基于约束捆集调整的多相机运动结构恢复方法
在 HEVC 比特流中简化 MPEG 沉浸式视频传输
沉浸式媒体在今天得到了广泛的关注,学术界已经做出了巨大的努力来探索和解决其技术挑战。ISO/IEC MPEG 牵头的沉浸式音频、图像和视频信号编码表示的标准化工作已经得到了非常积极的发展。MPEG Immersive Video(MIV)旨在压缩由多相机捕获的3D场景表示。MIV标准通过播放摄像机拍摄的3D场景,实现高保真的身临其境体验,为观众观看的位置和方向提供六个自由度(6DoF)。随着MIV标准在2021年7月实现技术层面的完成,越来越多的工作希望探索实时沉浸式视频播放和流媒体的能力。
用户1324186
2021/12/27
2.7K0
在 HEVC 比特流中简化 MPEG 沉浸式视频传输
用于 6-DoF 视听内容捕获和制作的工具
虽然该灵活的制片过程主要针对XR应用,因为捕获的6自由度素材可以在给定的运动范围内,并且从任何角度查看。但与此同时,它也可以被用于传统的常规制片流程,只需要在虚拟视角下对所捕获的内容进行框选即可。
用户1324186
2022/04/11
9440
用于 6-DoF 视听内容捕获和制作的工具
干货 | 平面图像的感知已经基本解决了,那三维数据的呢?
想象一下你正在打造一辆可探测周围环境的自动驾驶车。你要如何让你的车感知行人、骑自行车的人以及其他车辆,以安全行驶呢?你可以给它装上相机,但效果并不是特别好:你面对的是整个 3D 环境,相机拍摄到的只是把它拍扁之后的 2D 图像,然后再尝试从这个 2D 图像中复原你真正需要用到的 3D 信息(比如与车前面的行人、汽车间的距离)。然而,一旦将 3D 环境挤压成 2D 图像,很多对你来说最重要的信息就会丢失,并且将这些信息重新拼凑起来十分困难——即使使用最先进的算法,也容易出错。
AI科技评论
2019/10/31
8710
干货 | 平面图像的感知已经基本解决了,那三维数据的呢?
丰田研究院:自监督单目图像深度估计,数据和代码已开源
计算机视觉是人工智能的一个领域,它使计算机能够表示视觉世界。由于神经网络可以从数据中学习如何做出准确的预测,深度学习已经彻底改变了这个领域。最近的进展有望使汽车更加安全,通过自动驾驶车辆增加自由时间,以及为残疾人和我们迅速老龄化的全球人口提供机器人援助。
McGL
2021/05/28
1.7K0
丰田研究院:自监督单目图像深度估计,数据和代码已开源
自动驾驶中的三维目标检测综述
文章:3D Object Detection for Autonomous Driving: A Survey
点云PCL博主
2022/02/10
1.7K0
自动驾驶中的三维目标检测综述
元宇宙里「虚拟老婆」会嘟嘴卖萌!Unity豪掷16亿美元收购阿凡达幕后特效公司Weta
这些精彩的画面,总是让人非常好奇:如此叹为观止的震撼的视觉特效,究竟是出自谁之手呢?
新智元
2021/11/15
1.2K0
元宇宙里「虚拟老婆」会嘟嘴卖萌!Unity豪掷16亿美元收购阿凡达幕后特效公司Weta
做自动驾驶涉及哪些技术?超全总结上线
自2004/05年DARPA的“大挑战”(rural)和2007年的“城市挑战”以来,自动驾驶一直是人工智能应用中最活跃的领域。
博文视点Broadview
2023/09/09
1.3K0
做自动驾驶涉及哪些技术?超全总结上线
面向自动驾驶的三维目标检测研究综述
文章:3D Object Detection for Autonomous Driving: A Survey
点云PCL博主
2022/02/10
1.5K0
面向自动驾驶的三维目标检测研究综述
OpenAnnotate3D:一个目标取代人类的标注工具
文章:OpenAnnotate3D: Open-Vocabulary Auto-Labeling System for Multi-modal 3D Data
点云PCL博主
2023/11/03
1.3K0
OpenAnnotate3D:一个目标取代人类的标注工具
[IDEA Session 2] Future of Mobile Mixed Reality
本文来自IDEA(Immersive Digital Experience Alliance,沉浸式数字体验联盟)官网视频的Session-2,演讲人为Bhaskar Banerjee,是GridRaster公司的联合创始人兼CTO。他主要对GridRaster提出的无线混合现实(Mixed Reality, MR)技术进行了阐述。
用户1324186
2021/03/10
5490
[IDEA Session 2] Future of Mobile Mixed Reality
英特尔中国研究院分享了未来自主系统相关的关键技术
本文介绍了英特尔中国研究院在人工智能、机器人、5G、虚拟现实等前沿技术领域的研究和探索,包括最新成果展示、前沿技术探索以及未来研究方向。
人工智能的秘密
2017/12/27
9350
Colmap-PCD:一种用于图像到点云配准的开源工具
文章:Colmap-PCD: An Open-source Tool for Fine Image-to-point cloud Registration
点云PCL博主
2023/11/22
2.1K0
Colmap-PCD:一种用于图像到点云配准的开源工具
推荐阅读
相关推荐
使用体积视频创建数字人
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档