Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >空间-角度信息交互用于光场图像超分辨重构,性能达到最新SOTA | ECCV 2020

空间-角度信息交互用于光场图像超分辨重构,性能达到最新SOTA | ECCV 2020

作者头像
AI科技大本营
发布于 2020-07-15 09:36:45
发布于 2020-07-15 09:36:45
7350
举报

作者 | Yingqian Wang, Longguang Wang等

译者 | 刘畅

光场(LF)相机不仅会记录光线的强度,也会记录光线的方向,并且会从多个视点捕获场景。而每个视点内的信息(即空间信息)以及不同视点之间的信息(即角度信息)都有利于图像超分辨率(SR)。

在本文中,作者提出了一种用于LF图像SR的空间角度交互网络(即LF-InterNet)。在本方法中,作者使用两个专门设计的卷积分别从输入的光场图中提取空间和角度特征。然后,将这些提取的特征重复地交互以合并空间和角度信息。最后,将交互的空间和角度特征融合在一起,去超分辨每个子孔径的图像。

作者在6个公共的LF测试数据集上做了实验,证明了本文方法的优越性。与现有的LF图像和单张图像超分辨方法相比,本文的方法可以恢复更多的细节,并且在PSNR和SSIM两个指标上比现有技术有显著提升。

论文链接:https://arxiv.org/abs/1912.07849

代码地址:https://github.com/YingqianWang/LF-InterNet

引言

光场相机可以提供场景的多个视图,因此可在许多方面都有应用,例如深度估计,显著性检测、去遮挡等。然而,LF相机面临着空间分辨率和角度分辨率之间的权衡。也就是说,它要么可以提供低图像分辨率的密集角度采样,要么提供高分辨图像的稀疏角度采样。因此,研究者们已经做了许多努力,通过LF重构来提升角度分辨率,或者通过LF图像超分辨率(SR)来提升空间分辨率。在本文中,作者主要关注LF图像的SR问题,即从其相应的低分辨率(LR)子孔径图像(sub-aperture image, SAI)重建高分辨率(HR)的 SAI。

图像超分辨重构是计算机视觉中一个长期存在的问题。为了获得较高的重建效果,SR方法需要从LR输入中吸收尽可能多的有用信息。在单张图像SR领域,可以通过充分利用图像中的邻域上下文(即空间信息)来取得较好的效果。相比之下,LF相机可从多个视图捕获场景。而不同视图之间的角度信息,则可以用于进一步提升LF图像的SR效果。

但是,由于LF复杂的4D结构,在LF中合并空间和角度信息是非常有挑战性的。现有的LF图像超分辨方法无法充分利用角度信息和空间信息,从而导致SR性能有限。具体地,有研究人员使用单个图像SR方法分别对SAI进行超分辨,然后将其微调在一起以合并角度信息。也有研究者仅使用部分SAI来超分辨一个视图,并且未合并另外废弃视图中的角度信息。

相反,有另外的研究人员提出了一种基于图的方法来考虑优化过程中的所有角度视图。但是,该方法无法充分利用空间信息,并且不如基于深度学习的SR方法。值得注意的是,即使所有视图都被送到一个深层神经网络,要实现卓越的性能仍然十分具有挑战。

由于空间信息和角度信息在LF图像中高度耦合,并采用不同的方式对LF图像超分辨做出贡献。因此,网络难以直接使用这些耦合信息。为了有效地合并空间和角度信息,本文提出了用于LF图像超分辨的空间角度信息交互网络(即LF-InterNet)。

首先,作者专门设计了两个卷积,以将空间和角度特征与输入的LF分离。然后,作者提出了LF-InterNet以重复交互并合并空间和角度信息。最后,作者做了多个消融实验验证了本文的设计。并将本文方法与最新的单一图像和LF图像SR方法,在6个公开LF数据集上进行了比较。结果显示,本文的LF-InterNet显著提升了PSNR和SSIM性能。

方法

空间-角度特征解耦

光场图像按照上图左边的方式进行排列可以组成阵列的SAI,将每幅阵列SAI相同空间位置的像素按照视角顺序进行排列,则可以构成宏像素的图像(macro-pixel image,MacPI)。本文所提出的空间信息特征提取(SFE)与角度信息特征提取(AFE)均以MacPI作为输入,如下图所示。

作者对光场宏像素图进行了简化示例,其中光场的空间分辨率与角度分辨率均为3*3。图中涂有不同底色的3*3区域表示不同的宏像素,每个宏像素内的3*3标有不同的符号(十字、箭头等),表示其属于不同的视角。然后作者分别对两种特征提取器进行了定义。AFE是kernel size=A*A,stride=A的卷积;SFE是kernel size=3*3,stride=1,dilation=A的卷积。注意,将AFE应用于MacPI时,只有单个MacPI内的像素参与卷积运算,而不同像素之间信息不互通。同理,将SFE应用于MacPI时,只有属于相同视角的像素参与卷积运算,而属于不同视角的像素不互通。因此,AFE和SFE可以分别提取光场的角度信息和空间信息,实现信息的解耦。

网络设计

上图是作者构建的LF-InterNet网络,该网络主要分为三个部分,特征提取、空间角度特征交互、特征融合重构。

特征提取:将上述的AFE与SFE两种特征提取器应用于输入的光场MacPI时,可以分别提取光场的角度特征与空间特征。

空间角度特征交互:用于实现空间角度特征交互的基本单元为交互块(Inter-Block)。该文将4个交互块级联构成了一个交互组(Inter-Group),再将4个交互组级联构成网络的交互部分。如图4(b)所示,在每个交互块中,输入的空间特征与角度特征进行一次信息交互。交互上是相互的,一方面角度特征上采样A倍后与空间特征进行级联,而后通过一个SFE与ReLU实现角度信息引导的空间特征融合;另一方面,空间特征通过AFE卷积提取新一轮的角度特征,并与输入的角度特征进行级联,而后通过一个1*1卷积与ReLU进行角度特征的更新。空间特征分支与角度特征分支均采用局部残差连接。

特征融合构建:网络的每个交互组输出的空间特征与角度特征分别进行级联,而后通过bottleneck模块进行全局特征融合。如图4(c)所示,在bottleneck模块中,角度特征首先通过1*1卷积与ReLU进行通道压缩,而后通过上采样与空间特征进行级联。融合得到的特征通过SFE进行通道扩增,而后通过光场结构reshape为阵列的SAI形式,最后通过pixel-shuffle层与1*1卷积层输出高分辨率光场SAI。

实验

作者首先介绍了数据集和实现的细节,然后进行了消融实验。最后,将LF-InterNet与最新的LF图像SR和单图像SR方法进行比较。

数据集和细节

该文采用下表所示的6个公开数据集进行训练与测试。训练时,会把每张SAI分割成64*64的大小,生成一个LR patches。网络训练采用L1 loss,数据增强采用了翻转和旋转。评价指标采用PSNR和SSIM。算法是使用pyTorch实现,已开源。针对2倍和4倍的超分辨,输入光场的角度分辨率为5*5,LF-InterNet的通道数设为64。

消融实验

空间信息和角度信息

通过表格2可以看出,空间信息和角度信息对于超分辨的提升均有帮助。且不能仅单独使用角度信息,空间信息对于超分辨性能的提升更有益。而本文提出的SFE和AFE对于信息的解耦可以进一步提升SR性能。

特征交互组的数量

可以看出,如果没有特征交互,效果较差。而随着特征交互组数量的增多,效果变得越来越好。

角度-空间上采样方式 & 角度分辨率

表格4可以看出,nearest、bilinear相较于pixel shuffling的采样方式,均不够好。表格5可以看出,2倍和4倍的超分辨重构效果均随着角度分辨率的增加而提升。

算法对比

本文在6个公开数据集上将LF-InterNet与单图超分辨算法VDSR、EDSR、RCAN、SAN、SRGAN、ESRGAN以及光场图像超分辨算法LFBM5D,GB,LFSSR,resLF,以及LF-ATO进行了比较,结果如下表格所示,本文算法是目前的SOTA。

视觉上的效果以及性能对比

通过视觉上的对比,本文算法可以更好的保持纹理和细节信息。且从模型参数量和FLOPs数上,性能是明显优于LF-ATO算法。

结论

本文提出了空间-角度信息交互的光场图像超分辨网络(LF-InterNet),首先设计了空间特征提取器与角度特征提取器分别提取光场图像的空间与角度特征,而后构建LF-InterNet对两类特征进行渐进式交互融合。实验验证了该文算法的有效性,达到了目前的SOTA。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-07-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
ECCV 2020 | 空间-角度信息交互的光场图像超分辨,性能优异代码已开源
光场相机可以记录当前场景不同视角的图像,每个视角图像的上下文信息(空间信息)与不同视角之间的互补信息(角度信息)都有助于提升图像超分辨的性能。
CV君
2020/07/09
9640
ECCV 2020 | 空间-角度信息交互的光场图像超分辨,性能优异代码已开源
TPAMI 2022 | 国防科大等高校提出光场解耦机制,在超分辨与视差估计任务上取得优异性能
光场相机可以通过记录光线的强度与方向信息将3维场景编码至4维光场图像。近年来,卷积神经网络被广泛应用于各项光场图像处理任务。然而,由于光场的空间信息与角度信息随空变的视差高度耦合,现有的卷积网络难以有效处理高维的光场数据。
CV君
2022/03/30
7760
TPAMI 2022 | 国防科大等高校提出光场解耦机制,在超分辨与视差估计任务上取得优异性能
ICCV 2023 | SPIN:轻量级图像超分辨率与超像素令牌交互
基于transformer的方法在单图像超分辨率(SISR)任务中显示了令人印象深刻的结果。然而,当应用于整个图像时,自注意机制的计算成本很高。
JOYCE_Leo16
2024/03/19
4970
ICCV 2023 | SPIN:轻量级图像超分辨率与超像素令牌交互
超分辨率新突破!HAAT混合注意力聚合Transformer,跨通道建模性能飙升登顶SOTA !
单图像超分辨率(SISR)旨在从低分辨率图像中重构高质量图像。随着其广泛应用,高效超分辨率算法的研发成为计算机视觉领域的一个关键研究领域。最近的研究将自注意力机制集成到计算机视觉挑战中 [1, 2]。
未来先知
2025/02/20
3730
超分辨率新突破!HAAT混合注意力聚合Transformer,跨通道建模性能飙升登顶SOTA !
最新综述丨视频超分辨率研究方法
本文是第一个也是唯一一个视频超分方向的综述,回顾了基于深度学习的视频超分技术的研究进展,提出了一种基于深度学习的视频超分分类方法,并总结了SOTA方法在一些公共基准数据集上的性能。 >>加入极市CV技术交流群,走在计算机视觉的最前沿
AIWalker
2021/01/18
3.4K0
最新综述丨视频超分辨率研究方法
超分辨率 | 综述!使用深度学习来实现图像超分辨率
今天给大家介绍一篇图像超分辨率邻域的综述,这篇综述总结了图像超分辨率领域的几方面:problem settings、数据集、performance metrics、SR方法、特定领域应用以结构组件形式,同时,总结超分方法的优点与限制。讨论了存在的问题和挑战,以及未来的趋势和发展方向。
AI算法修炼营
2020/05/26
7.2K0
超分辨率 | 综述!使用深度学习来实现图像超分辨率
今日 Paper | Social-STGCNN;说话人脸视频生成;食材图像合成;光场角度超分辨率等
论文名称:Social-STGCNN: A Social Spatio-Temporal Graph Convolutional Neural Network for Human Trajectory Prediction
AI科技评论
2020/03/10
6360
今日 Paper | Social-STGCNN;说话人脸视频生成;食材图像合成;光场角度超分辨率等
黄浴:基于深度学习的超分辨率图像技术发展轨迹一览
我们一般可以将现有的 SR 技术研究大致分为三大类:监督 SR ,无监督 SR 和特定领域 SR (人脸)。
AI科技大本营
2019/08/20
1.3K0
黄浴:基于深度学习的超分辨率图像技术发展轨迹一览
IEEE TMM 2020:细化超分辨网络,解决上采样引起的振荡
图像成像设备在拍照图像时常遭受到天气、硬件和环境等影响,导致拍摄出图像出现严重的失真,这严重限制后续高水平计算机视觉任务进行。现已有深度学习方法为了保证效率,一些方法都是通过在网络末端利用上采样操作来放大分辨率来获得高清图像,但这样操作会使训练过程发生振荡,从而使SR模型稳定性下降,这是真实相机设备无法容忍的。
CV君
2020/07/13
1.1K0
信息增强的图像超分辨率重建
单图像超分辨率(SISR)的任务是旨在从其低分辨率版本重建出高质量的图像。基于CNN的网络在性能方面取得了显著的成功。然而,CNN的归纳偏置限制了SISR模型捕获长距离依赖性的能力。它们的固有局限性源于参数依赖的感受野扩展和不同层中卷积算子的核大小,这可能会忽略图像中的非局部空间信息。
Srlua
2025/01/02
2290
信息增强的图像超分辨率重建
深度学习的图像超分技术综述-输入单张图像(SISR)和输入多张图像的基于参考的图像(RefSR)
SISR方法输入一张低分辨率图像,利用深度神经网络学习LR-HR图像对之间的映射关系,最终将 LR图像重建为一张高分辨率图像。
JOYCE_Leo16
2024/03/19
7830
深度学习的图像超分技术综述-输入单张图像(SISR)和输入多张图像的基于参考的图像(RefSR)
ETH联合Meta和鲁汶大学 提出视频恢复算法VRT,在视频超分辨率、去模糊和去噪性能达到SOTA
该论文为将Swin Transformer应用于单图超分中的SwinIR的视频扩展版本,在视频复原的各领域中都有很大的提升,本文将从视频超分方向来解读VRT。
CV君
2022/03/30
1.1K0
ETH联合Meta和鲁汶大学 提出视频恢复算法VRT,在视频超分辨率、去模糊和去噪性能达到SOTA
【深度学习】基于深度学习的超分辨率图像技术一览
SR取得了显著进步。一般可以将现有的SR技术研究大致分为三大类:监督SR,无监督SR和特定领域SR(人脸)。
Twcat_tree
2023/11/25
5140
【深度学习】基于深度学习的超分辨率图像技术一览
轻量图像超分辨率残差网络:Attention与ResNet融合
本文提出了一种名为RNET(Residual Network with Efficient Transformer)的网络,该网络结合了三种有效的设计元素:
是Dream呀
2025/03/15
4130
轻量图像超分辨率残差网络:Attention与ResNet融合
只需1080ti,即可在遥感图像中对目标进行像素级定位!代码数据集已开源!
这篇论文介绍了一项新的任务 —— 指向性遥感图像分割(RRSIS),以及一种新的方法 —— 旋转多尺度交互网络(RMSIN)。RRSIS 旨在根据文本描述实现遥感图像中目标对象的像素级定位。为了解决现有数据集规模和范围的限制,本文构建了一个新的大规模 RRSIS 数据集(RRSIS-D),其中涵盖了多种空间分辨率的图像和具有尺度和角度多样性的分割目标(已公开!)。
CV君
2024/01/11
3940
只需1080ti,即可在遥感图像中对目标进行像素级定位!代码数据集已开源!
ECCV2020 | 即插即用,涨点明显!FPT:特征金字塔Transformer
代码地址:https://github.com/ZHANGDONG-NJUST/FPT
AI算法修炼营
2020/08/10
2.2K0
基于深度学习的图像超分辨率方法 总结
懒得总结,就从一篇综述中选取了一部分基于深度学习的图像超分辨率方法。 原文:基于深度学习的图像超分辨率复原研究进展 作者:孙旭 李晓光 李嘉锋 卓力 北京工业大学信号与信息处理研究室 来源:中国知网
Natalia_ljq
2020/06/03
1.6K0
SFT-GAN、CSRCNN、CSNLN、HAN+、Config (f)…你都掌握了吗?一文总结超分辨率分析必备经典模型(三)
 机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 16 个在超分辨率任务上曾取得 SOTA 的经典模型。 第 1 期:SRCNN、DRCN、FSRCNN、ESPCN、SRGAN、RED
机器之心
2023/05/01
8790
SFT-GAN、CSRCNN、CSNLN、HAN+、Config (f)…你都掌握了吗?一文总结超分辨率分析必备经典模型(三)
一种用于360度全景视频超分的单帧多帧联合网络
论文、代码地址:在公众号「3D视觉工坊」,后台回复「全景视频超分」,即可直接下载。
3D视觉工坊
2020/12/03
1.2K0
一种用于360度全景视频超分的单帧多帧联合网络
【扩散模型的应用】用于红外小目标检测的基于Diffusion的连续特征表示
题目:Diffusion-Based Continuous Feature Representation for Infrared Small-Dim Target Detection
小白学视觉
2024/12/06
4700
【扩散模型的应用】用于红外小目标检测的基于Diffusion的连续特征表示
推荐阅读
ECCV 2020 | 空间-角度信息交互的光场图像超分辨,性能优异代码已开源
9640
TPAMI 2022 | 国防科大等高校提出光场解耦机制,在超分辨与视差估计任务上取得优异性能
7760
ICCV 2023 | SPIN:轻量级图像超分辨率与超像素令牌交互
4970
超分辨率新突破!HAAT混合注意力聚合Transformer,跨通道建模性能飙升登顶SOTA !
3730
最新综述丨视频超分辨率研究方法
3.4K0
超分辨率 | 综述!使用深度学习来实现图像超分辨率
7.2K0
今日 Paper | Social-STGCNN;说话人脸视频生成;食材图像合成;光场角度超分辨率等
6360
黄浴:基于深度学习的超分辨率图像技术发展轨迹一览
1.3K0
IEEE TMM 2020:细化超分辨网络,解决上采样引起的振荡
1.1K0
信息增强的图像超分辨率重建
2290
深度学习的图像超分技术综述-输入单张图像(SISR)和输入多张图像的基于参考的图像(RefSR)
7830
ETH联合Meta和鲁汶大学 提出视频恢复算法VRT,在视频超分辨率、去模糊和去噪性能达到SOTA
1.1K0
【深度学习】基于深度学习的超分辨率图像技术一览
5140
轻量图像超分辨率残差网络:Attention与ResNet融合
4130
只需1080ti,即可在遥感图像中对目标进行像素级定位!代码数据集已开源!
3940
ECCV2020 | 即插即用,涨点明显!FPT:特征金字塔Transformer
2.2K0
基于深度学习的图像超分辨率方法 总结
1.6K0
SFT-GAN、CSRCNN、CSNLN、HAN+、Config (f)…你都掌握了吗?一文总结超分辨率分析必备经典模型(三)
8790
一种用于360度全景视频超分的单帧多帧联合网络
1.2K0
【扩散模型的应用】用于红外小目标检测的基于Diffusion的连续特征表示
4700
相关推荐
ECCV 2020 | 空间-角度信息交互的光场图像超分辨,性能优异代码已开源
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档