开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >专栏 >10. 图像处理的应用-基于相位的视频处理

10. 图像处理的应用-基于相位的视频处理

作者头像

HawkWang

发布于 2020-04-17 07:28:55

发布于 2020-04-17 07:28:55

1.1K0

举报

文章被收录于专栏：计算摄影学计算摄影学

前面已经给大家讲了动作放大算法中的一种：欧式视频放大。看起来这种技术非常炫酷，然而它并非毫无缺点。

今天这篇文章首先会给大家讲讲这个算法的缺点，然后简要介绍一种改进的动作放大算法：基于相位的动作处理。最后，再给大家介绍下作者的进一步研究内容。这里面有一些研究方向会让普通人瞠目结舌，至少我当时看到时是这样的，希望你喜欢今天的内容。

一、欧式视频放大算法的缺点

欧式视频放大算法的核心假设是像素的空间运动和像素值的变化直接是线性的关系，如下图所示

欧式视频放大算法的核心假设是像素的空间运动和像素值的变化直接是线性的关系，如下图所示

这个假设有很强的限制性，当运动过于剧烈时，假设就不再成立了，如下图所示：

另外，如果视频中的噪声比较强烈的话，这种线性的假设会使得噪声也被相应的放大了。

信号噪声被放大

正因为这些缺点，因此人们又在想新的办法来进行动作放大，这就引入了下一节所说的基于相位的动作处理，相关文章来自于：

Phase-Based Video Motion Processing (SIGGRAPH 2013) With Neal Wadhwa, Fredo Durand, Bill Freeman

二、基于相位的动作处理

在更多原理性内容之前，我们先来看看这种基于相位的动作处理算法与欧式视频放大算法之间的结果比较：

改进点1：支持更大的放大倍率：

支持更大的放大倍率

改进点2：不会像欧式视频放大算法那样代入过多噪声

不会代入过多噪声

比较一下几个结果视频，大家会有更直观的理解：

现在来看看两种方法的原理比较：

下面的视频展示了我们可以将一个一维的信号分解为多个正弦信号的加权和：

如果对分解后的正弦信号进行移相并重建，就可以改变信号的值，造成动作的改变：

当然，上述展示的是一个一维信号，通过移相仅仅能对信号中进行全局的处理。但通常视频中有很多局部动作，而且我们感兴趣的也是这些局部的动作。为了处理这个问题，作者采用了一种复变方向金字塔（好吧，我这个翻译可能不准确，原文叫做Complex Steerable Pyramid)，它利用局部傅里叶变换将每一帧图像分解为不同尺度，不同方向的空间结构图像。

观察一下这样一来局部信号的组成：

局部移相对应局部动作

总而言之，相比欧式视频放大，基于相位的视频处理方法自然是要更复杂更先进一些。这两者的流程可以用下图来展示：

因为这个系列文章还有很多精彩的内容需要写，我就暂时不再深入进行原理探讨了，感兴趣的读者可以参考原论文

三、相关领域的应用和研究方向

视频放大有很多应用。例如：

医疗健康领域的非接触式探测
科学分析中的地表卫星地图变化分析
工程领域的结构物完整性检验

这里再给大家看一些朋友制作的例子：

最让我惊奇的是用这个技术来重建声音，实现远程的“偷听”远程谈话的应用（突然想到了很多谍战片），我们看看下面的信息：

一个男人张大了嘴，发出元音”啊“

通过我们文章介绍的技术，可以放大他的喉结运动：‍

这里面会有各种各样频率的震动产生的图像变化，但如果我们对特定的频率进行放大，就能捕捉到真正的信息：

利用这个技术，甚至可以远程恢复出奥巴马和其副总统拜登的谈话：

‍

研究者在场景中摆上塑料薄膜，并播放上述录音，然后通过摄像头观察薄膜的震动，并成功的尝试恢复出了部分的对话声音

四、总结

今天这篇文章是图像放大系列的完结篇。我首先介绍了欧式视频放大的缺点，然后简要介绍了基于相位的动作处理算法。最后还给大家看了更多关于视频放大技术的应用，如果你喜欢请给我点赞?。

参考资料

这一篇文章的绝大部分素材来自于：

Michael Rubinstein: Thesis Defense for Analysis and Visualization of Temporal Variations in Video

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2019-12-02，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自计算摄影学微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

暂无评论

编辑精选文章

换一批

万字详解高可用架构设计

Go 开发者必备：Protocol Buffers 入门指南

10分钟带你彻底搞懂分布式链路跟踪

多租户的 4 种常用方案

亿级月活的社交 APP，陌陌如何做到 3 分钟定位故障？

60页PPT全解：DeepSeek系列论文技术要点整理

8. 图像处理的应用 - 动作放大

上一次我给大家提到了延时摄影作品中通常会有随机的短期抖动，我介绍了一种算法可以分离短期和长期的运动，并通过滤除短期抖动、增强长期运动来获取到平滑的视频。而很多时候，我们会对视频中的非常隐晦的时域变化感兴趣。所以这一次我会介绍一个计算摄影技术构成的"动作放大器"，它能够高效的将视频中的难以用肉眼察觉的变化分离出来，并在重新渲染过程中进行放大，生成新的视频。我初次接触这个应用方向时大吃一惊，我希望也能够带给你这种感觉。

HawkWang

2020/04/17

1.2K0

8. 图像处理的应用 - 动作放大

9. 图像处理的应用 - 欧式视频放大的实现

github git 开源编程算法

上一次我介绍了一个计算摄影技术构成的"动作放大器"，它能够高效的将视频中的难以用肉眼察觉的变化分离出来，并在重新渲染过程中进行放大，生成新的视频。这里面的典型代表是欧式视频动作放大。

HawkWang

2020/04/17

1.6K1

9. 图像处理的应用 - 欧式视频放大的实现

浅谈安防监控中视频图像处理技术

随着计算机软件、硬件技术的日新月异的发展和普及，人类已经进入一个高速发展的信息化时代，人类大概有80%的信息来自图像，科学研究、技术应用中图像处理技术越来越成为不可缺少的手段。安防行业已经进入一个崭新的时代，高清、智能与大数据和云技术的广泛结合应用，成为时代新的话题。随着而来的是，视频图像处理技术也逐渐成熟起来，只有这样才能切合行业技术发展，为此，对于视频图像处理技术的研究成为安防行业值得重视的领域。

全栈程序员站长

2022/09/07

8650

化秋毫为波澜:运动放大算法(深度学习版)

运动放大(Motion Magnification)，将视频中对应位置的运动进行放大，简单理解的话，就是找到时间段内的运动矢量，进行放大，然后权值叠加回去。

SIGAI学习与实践平台

2018/10/17

2.1K0

化秋毫为波澜:运动放大算法(深度学习版)

化秋毫为波澜:运动放大算法(深度学习版)

运动放大(Motion Magnification)，将视频中对应位置的运动进行放大，简单理解的话，就是找到时间段内的运动矢量，进行放大，然后权值叠加回去。

SIGAI学习与实践平台

2018/11/07

1.5K0

5. 数码相机内的图像处理-图像采样与金字塔

你有没有见过下面这张图像上那种神秘的彩色纹路？我们知道这件灰色衬衣本身应该是光滑的，为什么拍出来的照片上会有这样的纹路呢？

HawkWang

2020/04/17

1.2K0

5. 数码相机内的图像处理-图像采样与金字塔

什么是图像噪声？是如何产生的？图像去噪技术都有哪些？

实时音视频视频处理通用视频解决方案视频分析视频理解

在一些图像中，像素值会在原始场景理想均匀的区域内变化，其原因要么是光子或其他信号的有限计数统计、在芯片内的电子偏移中引入的损耗；要么是放大器或电缆中出现了电子噪声。任何情况下，这种变化通常称为噪声，而由图像到噪声电平表示的场景中出现的差别引起的对比度比值，称为信噪比。

微帧Visionular

2024/11/05

7040

什么是图像噪声？是如何产生的？图像去噪技术都有哪些？

7. 图像处理的应用-运动滤波

在前面的章节中，我讲了很多图像变换中的基本操作：图像滤波，包括空域滤波和频域的滤波。今天来给大家分享一个非常有意思的图像滤波的应用：运动滤波。这里我们会看到计算摄影中图像的像素操作的新奇的应用，而且由于今天所讲述的操作对象是视频，因此我还会学习到图像的时域操作。我相信随着5G时代的到来，视频处理会越来越重要，这一篇文章能够给大家带来一些视频处理的灵感。

HawkWang

2020/04/17

9950

7. 图像处理的应用-运动滤波

机器视觉工业缺陷检测(光源，相机，镜头，算法)

视觉工业检测大体分为工件尺寸测量与定位，和表面缺陷检测，及各种Logo标识的检测与识别等。

机器学习AI算法工程

2021/10/14

18.3K0

机器视觉工业缺陷检测(光源，相机，镜头，算法)

3. 数码相机内的图像处理-基本图像滤波

filter filtering gaussian image jupyter

在第一篇文章里面，我提到计算摄影学是计算机图形学，计算机视觉，光学和传感器等领域的交叉学科，在这个领域我们可以用强大的图像算法，对传感器所获取的信息做任意的处理，得到丰富多彩的效果。

HawkWang

2020/04/17

1.1K0

3. 数码相机内的图像处理-基本图像滤波

图像视频降噪的现在与未来——从经典方法到深度学习

深度学习编程算法视频处理图像处理

大家好，我是来自腾讯多媒体实验室的李松南，本次分享将为大家介绍传统降噪和深度学习降噪方法，以及降噪技术未来的发展趋势。腾讯多媒体实验室专注于多媒体技术领域的前沿技术探索、研发、应用和落地，在长期积累中精心打造出三大核心能力，分别是：音视频编解码、网络传输和实时通信；多媒体内容处理、分析、理解和质量评估；沉浸式媒体系统设计和端到端解决方案。本次分享中的内容就属于多媒体内容处理的一部分。

LiveVideoStack

2020/01/02

3.6K1

图像视频降噪的现在与未来——从经典方法到深度学习

干货 | 清华大学冯建江：指纹识别现状与研究进展

人工智能自动化图像处理

AI 科技评论按：2018 年 4 月 14 日-15 日，中国图象图形学学会围绕「生物特征识别」这一主题，在中科院自动化所举办第四期「CSIG 图像图形学科前沿讲习班」。

AI科技评论

2018/07/26

5.2K0

干货 | 清华大学冯建江：指纹识别现状与研究进展

一拖一拽，玫瑰复活了！谷歌提出生成图像动力学，从此万物皆有灵

渲染编码动画模型视频

https://generative-dynamics.github.io/static/pdfs/GenerativeImageDynamics.pdf

新智元

2023/09/19

4060

一拖一拽，玫瑰复活了！谷歌提出生成图像动力学，从此万物皆有灵

【计算摄影】图像与视频超分辨，深度学习核心技术与展望

神经网络机器学习人工智能深度学习

图像超分，就是要将低分辨率的图像恢复为高分辨率的图像，它在日常的图像和视频存储与浏览中都有广泛的应用，本次我们介绍基于深度学习的图像超分辨核心技术。

用户1508658

2021/05/10

1.1K0

【计算摄影】图像与视频超分辨，深度学习核心技术与展望

光流法原理概述「建议收藏」

光流的概念是Gibson在1950年首先提出来的。它是空间运动物体在观察成像平面上的像素运动的瞬时速度，是利用图像序列中像素在时间域上的变化以及相邻帧之间的相关性来找到上一帧跟当前帧之间存在的对应关系，从而计算出相邻帧之间物体的运动信息的一种方法。一般而言，光流是由于场景中前景目标本身的移动、相机的运动，或者两者的共同运动所产生的。

全栈程序员站长

2022/09/15

3.1K0

图像超分辨率及相关知识简介

图像分辨率指图像中存储的信息量，是每英寸图像内有多少个像素点，分辨率的单位为PPI(Pixels Per Inch)，通常叫做像素每英寸。一般情况下，图像分辨率越高，图像中包含的细节就越多，信息量也越大。图像分辨率分为空间分辨率和时间分辨率。通常，分辨率被表示成每一个方向上的像素数量，例如64*64的二维图像。但分辨率的高低其实并不等同于像素数量的多少，例如一个通过插值放大了5倍的图像并不表示它包含的细节增加了多少。图像超分辨率重建关注的是恢复图像中丢失的细节，即高频信息。在大量的电子图像应用领域，人们经常期望得到高分辨率（简称HR）图像。但由于设备、传感器等原因，我们得到的图像往往是低分辨率图像（LR）。增加空间分辨率最直接的解决方法就是通过传感器制造技术减少像素尺寸（例如增加每单元面积的像素数量）；另外一个增加空间分辨率的方法是增加芯片的尺寸，从而增加图像的容量。因为很难提高大容量的偶合转换率，所以这种方法一般不认为是有效的，因此，引出了图像超分辨率技术。

Natalia_ljq

2020/06/03

1.4K0

图像处理——Canny算子

（1）爱鱼 https://www.cnblogs.com/mightycode/p/6394810.html

全栈程序员站长

2022/09/02

1.4K0

VP9编码器客观及主观质量优化

大家好，我是韩敬宁，来自WebM Codec团队。今天非常高兴有机会能向大家介绍一下我们近期的关于VP9编码器优化的工作。VP9是在2013年release，从2013年底开始逐渐被包括YouTube在内的多家video service provider采纳成为编码内核。从2013年到2016年前后，我们的团队一直在做的就是不断优化VP9编码器。优化的目标主要是：首先，提高其核心压缩性能也就是在PSNR和SSIM这些客观Metric条件下的编码。还有一个方向是在同样的压缩性能条件下，我们会降低编码器的复杂度，让编码器跑得更快。

LiveVideoStack

2020/09/22

9490

VP9编码器客观及主观质量优化

什么是傅里叶变换？傅里叶变换处理图像的原理是什么？

图像分析视频理解视频处理图像处理视频分析

傅里叶变换，最牛的算法之一，广泛应用于物理学、信号处理、概率、统计、密码学、声学、光学等领域。

微帧Visionular

2024/11/08

5030

什么是傅里叶变换？傅里叶变换处理图像的原理是什么？

数字图像处理学习笔记（十三）——傅里叶变换

空间域抽样间隔和频域间隔之间的关系

荣仔_最靓的仔

2021/02/02

7.7K0

数字图像处理学习笔记（十三）——傅里叶变换

相关推荐

8. 图像处理的应用 - 动作放大

更多 >

LV.0

这个人很懒，什么都没有留下～

作者相关精选

换一批

目录

一、欧式视频放大算法的缺点

三、相关领域的应用和研究方向

四、总结

参考资料

加入讨论

的问答专区 >

穿过生命散发芬芳0

相关课程

一站式学习中心 >

AI驱动的TDSQL-Cserverless实战营

云原生数据库 TDSQL-C

数字化IT从业者知识体系