Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >基于 VMAF 和 GREED 的高帧率全参考视频质量评价方法

基于 VMAF 和 GREED 的高帧率全参考视频质量评价方法

作者头像
用户1324186
发布于 2021-11-04 10:20:22
发布于 2021-11-04 10:20:22
1.9K0
举报
文章被收录于专栏:媒矿工厂媒矿工厂

来源:PCS 2021 演讲者:Pavan C Madhusudana 内容整理:贾荣立 本文基于 VMAF 和 GREED 提出了针对不同帧率视频的全参考质量评价方法,并对多个数据集有较好的泛化能力。

目录

  • 引言
  • 方法介绍
    • VMAF
    • GREED
  • 实验
  • 性能分析
    • 与其他方法和模型的性能对比
    • 对于特定帧率的视频质量评价
    • 在其他数据集下的表现
  • 结论

引言

在进行全参考视频质量评价的时候,常常会遇到无失真参考视频和失真视频帧率不同的情况,而帧率的改变也影响了视频的体验质量。因此,如何捕捉由于帧率改变和压缩损伤而带来的视频质量下降的因素,成为了视频质量评价这一研究领域中的一个重要主题。

参考视频和失真视频的帧率不同

现有的 VQA 模型很少深入关注与时间相关的因素,以最著名的模型 VMAF 为例,它只关注了连续视频帧之间的差异。但是在实际应用中,帧率的变化往往会导致时间伪影的产生,如频闪,抖动等,还有一些失真会和压缩损伤一同发生,因此仅仅使用先前的 VQA 模型进行评价是不准确的。

VMAF 方法在不同帧率的视频下表现不佳,而 GREED 模型在相同帧率的视频之间进行评价性能不好,基于此,作者提出了融合 VMAF 和 GREED 的特征,结合 VMAF 和 GREED 的优势,通过特征融合,更加强调时间伪影对于视频质量的影响,达到提高对不同帧率的参考和失真视频评价性能的目的。

方法介绍

VMAF

VMAF 结合了多个质量指标,包括:

  • 细节级别度量(DLM)用于捕获细节损失,
  • 视觉信息保真度(VIF)——基于自然场景统计(NSS)的图像保真度度量
  • 时间信息(TI)——连续视频帧之间的绝对亮度差异

将质量评价指标利用 SVR 进行融合,得到 VMAF 模型。

GREED

GREED 模型基于视频帧率不同而带来的带通系数分布之间观察到的统计偏差。

当参考视频

R

和失真视频

D

的帧率不同时,给先前的全参考质量评价技术的应用带来了一定的困难。为了克服这一问题,对参考视频

R

进行时间降采样,得到和失真视频

D

帧率相同的新的序列,将这个新的序列称为伪参考

PR

。给定这些信号,时域 GREED 被定义为:

\operatorname{TGREED}_{k t}=\frac{1}{P} \sum_{p=1}^{P}\left|\left(1+\left|\epsilon_{k p t}^{D}-\epsilon_{k p t}^{P R}\right|\right) \frac{\epsilon_{k p t}^{R}+1}{\epsilon_{k p t}^{P R}+1}-1\right|

TGREED 可以解释为加权熵差,其中依赖于

R

D

的帧率的比值项作为加权因子。不同帧率之间的熵分离依赖于内容,这使得比率项对内容很敏感。绝对差分项捕获压缩伪影,因为序列

PR

是相同帧率下

D

的无损版本。

除此之外,为了捕获空域失真,空域 GREED 被定义为:

\mathrm{SGREED}_{t}=\frac{1}{P} \sum_{p=1}^{P}\left|\theta_{p t}^{D}-\theta_{p t}^{R}\right|

实验

根据上述分析,使用 GREED 特征去替换 VMAF 中的 TI 特征,如图所示:

使用 GREED 特征替换 VMAF 中 TI 特征

将 LIVE-YT-HFR 数据集随机分为 70% 训练集,15% 验证集和 15% 测试集,子集之间没有重叠的内容,并利用其训练 SVR 模型。

此外,我们还确保了子集之间没有内容的重叠。为了避免对训练集选择的性能偏差,实验重复进行了 200 次,并且取中位数作为最后的结果。由于在 GREED-VMAF 中只使用了 VMAF 的空间特征,并且 VMAF 框架要求比较视频具有相同的帧率,因此我们通过时间子采样来匹配帧率,从而更好的捕捉空间伪影。

性能分析

与其他方法和模型的性能对比

对于现有的全参考质量评价模型,需要参考视频和失真视频有相同的帧序列,因此对于有不同帧数的视频对,需要首先采用帧补全的处理,再进行评价。我们提出的方法与其他评价方法和模型的性能对比如下表所示:

与其他方法或模型的性能对比

对于特定帧率的视频质量评价

将数据集按照不同的帧率分开,对不同帧率的视频分别进行评价,得到的性能比对如下表所示:

不同帧率的视频的性能

从表中我们可以看出,GREED-VMAF 在低帧率时有着更好的表现,而在较高帧率情况下性能表现不如 GREED。

在其他数据集下的表现

为了评判该模型对于非高帧率数据的泛化能力,采用了其他三个 VQA 数据集:LIVE-VQA、CSIQ-VQA 和 LIVE-mobile 进行评价,这些数据集的参考视频和失真视频具有相同的帧率。评价结果如下表所示,我们可以看出 GREED-VMAF 相比于 VMAF 和 GREED 具有更好的泛化能力。

泛化能力测试结果

结论

本文基于 VMAF 和 GREED,提出了更加针对时间伪影的 GREED-VMAF 模型,对参考视频和失真视频帧率不同的问题提出了解决思路;除此之外,该模型在其他 VQA 数据集上也展现了不错的评价性能,相比于 VMAF 和 GREED 有着更好的泛化能力。

附上演讲视频:

http://mpvideo.qpic.cn/0bc3ouaayaaazqabp4ebbbqva5odbr2qadaa.f10002.mp4?dis_k=049e7be05d6a5e4141d2fe7a9abafc55&dis_t=1636021005&vid=wxv_2118273210247938057&format_id=10002&support_redirect=0&mmversion=false

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-11-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 媒矿工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
回归VMAF分数的视频质量评价模块
VMAF是目前比较好用的质量评价模型。但是在图像/视频压缩,视频增强等领域,可能需要一定的质量评价模块作为损失函数指导网络的训练。VMAF作为不可微的质量评价模型,无法直接作为损失函数,在这样的前提下,Darren等人提出使用神经网络去模拟VMAF的分数,使得该质量评价模块可以直接应用于其他网络的训练过程当中。
用户1324186
2021/10/22
1.6K0
对话声网视频算法工程师郑林儒:视频质量评价方法的最优解
在我们每天的日常生活中充斥着大量的视频内容,而用户对于视频画质在不同场景下又有着不同要求。对此,我们很荣幸地邀请到了来自声网的视频算法工程师郑林儒老师,来和我们聊一聊为了满足用户需求,针对不同场景选取哪种视频质量评价方法才是最优解。 郑林儒 声网 视频算法工程师 郑林儒,声网视频算法工程师。上海大学工学硕士,现于声网视频算法部门担任算法工程师。主要负责图像、视频质量与视频QoE评估,模型压缩以及视频编解码等研究,推动相关模型在移动端的应用。 LiveVideoStack:郑老师好,欢迎您接受LiveVi
LiveVideoStack
2023/04/04
3600
对话声网视频算法工程师郑林儒:视频质量评价方法的最优解
UGC 视频质量评价
简单来说,UGC 视频就是由普通用户拍摄、剪辑并上传到视频平台的视频内容,大多数上传到 YouTube 和其他视频共享平台的视频都是 UGC。以 YouTube 为例,每分钟有500小时的视频被分享,每天有二十亿个活跃用户,分布在 100 多个国家,使用 80 多种不同语言。
用户1324186
2022/04/11
2K0
UGC 视频质量评价
小白学CV:图像/视频质量评价
来源:Coggle数据科学本文约1200字,建议阅读5分钟本文中我们介绍了小白学习CV的基本方法。 I/VQA 介绍 在视频监控中,通过图像/视频质量评价(image/video quality assessment,I/VQA)可以预测设备状态,以及时对存在问题的设备进行维修或更换;在网络直播中,通过I/VQA可以分析视频质量,以改善终端用户体验。 I/VQA方法分为主观和客观两类。主观方法通过人为打分的方式获得平均主观得分(mean opinion score,MOS)或平均主观得分差异(differe
数据派THU
2022/09/02
7260
小白学CV:图像/视频质量评价
基于三维卷积神经网络的全参考视频质量评估算法
在腾讯,我们有多个视频业务线,点播视频有腾讯视频,企鹅影视;短视频有微视,K歌;直播类有Now直播,企鹅电竞;实时传输类有QQ和微信的音视频通话,无线投屏和腾讯会议等。
今日份的嘤嘤怪
2019/12/13
2.3K0
基于三维卷积神经网络的全参考视频质量评估算法
视频压缩世界中的挑战
本次演讲来自PCS2021,演讲者是来自Netflix视频编码算法团队的的Kyle Swanson和Mariana Afonso,主要将谈论Netflix是如何处理视频压缩以及存在的一些挑战。
用户1324186
2021/07/29
8950
再夺全球顶级竞赛CVPR NTIRE冠军,打造更好用户体验,淘宝拥有哪些内容技术?
不知不觉间,内容电商似乎已经成为人们生活中不可或缺的存在:在闲暇时间,我们已经习惯于拿出手机,从电商平台的直播间随手下单自己心仪的商品。
机器之心
2023/08/07
2500
再夺全球顶级竞赛CVPR NTIRE冠军,打造更好用户体验,淘宝拥有哪些内容技术?
Netflix视频质量感知评价模型之路
在Netflix公司,我们很关注视频质量,同时也关注如何规模化地精确评价视频质量。我们提出了视频多方法评估融合(VMAF)评价模型——试图反映观众对我们流媒体质量的感受。目前,我们正在将这个工具开源,并邀请研究界就这个重要课题与我们进行合作。
LiveVideoStack
2021/09/02
1.6K0
Netflix视频质量感知评价模型之路
自由视视频的主观和客观质量评价
随着新型媒体的发展,观众渐渐不再只满足于传统的 2D、3D 视频,对于其他新形势视频的需求也在不断发展,其中自由视视频(FVV)就是近些年来消费者关注的热点之一。如下图所示,相比于传统的 2D、3D和全景视频,自由视视频包含了一部分虚拟视角,用以填补真实相机之间的空缺,从而给观众以视角连续的观看体验。
用户1324186
2022/11/07
1.1K0
自由视视频的主观和客观质量评价
视频质量评价——从裁判到教练
大家好,我是来自上海交通大学的宋利,接下来我将从以下三个方面为大家分享有关视频质量评价的内容。
LiveVideoStack
2021/09/01
2.9K0
视频质量评价基础与实践
 点击上方“LiveVideoStack”关注我们 ▲扫描图中二维码或点击阅读原文▲ 了解音视频技术大会更多信息 编者按:视频质量评价作为近些年学6领域比较热门的基础研究,已经逐渐在各种业务场景上落地。本次公开课我们邀请到了SSIMWAVE联合创始人与首席研究员,曾凯老师,为大家详细介绍视频质量评价的基础概念和相关算法,并以端到端的视频质量监控系统为例,讲解了质量评价解决方案在实际落地中的应用和收益。 文/曾凯 整理/LiveVideoStack 大家好,我是曾凯,2020年曾经跟大家分享了一些关于质量评
LiveVideoStack
2023/02/23
8370
视频质量评价基础与实践
谷歌YouTube算法团队:视频质量评价的集成池化方法
随着移动互联网的发展,视频成为信息消费越来越重要的形式(这从国内外的YouTube、抖音的发展可见一斑),而其中用户贡献内容(UGC)往往占很大比例。
CV君
2020/02/27
1.5K0
YouTube 的感知视频质量测量模型——UVQ
YouTube 等在线视频共享平台需要了解感知视频质量(即用户对视频质量的主观感知),以便更好地优化和改善用户体验。视频质量评估(VQA)试图通过使用客观的数学模型来模拟用户的主观意见,建立视频信号和感知质量之间的联系。传统的视频质量指标,例如峰值信噪比 (PSNR) 和视频多方法评估融合 (VMAF),都是基于参考的,重点关注的是目标视频和参考视频之间的相对差异。这些指标很适合专业生成的内容(PGC),例如电影等。它们假设参考视频具有原始质量,并从相对差异中推断出目标视频的绝对质量。
用户1324186
2023/09/09
1K0
YouTube 的感知视频质量测量模型——UVQ
如何选择和使用视频质量客观评价指标
无论您是否知道,您观看的许多视频其实都是使用视频质量评价指标来优化的。哦,您不同意?那您最近看过Netflix吗?在过去两年多的时间里,Netflix的编码阶梯已经由公司的视频多方法评估融合(VMAF)的体系来驱动,然而在此之前使用的是峰值信噪比(PSNR)。您不是Netflix的客户?那么,YouTube呢? YouTube使用基于恒定码率因子(CRF)编码的神经网络,该编码本身也是由其内部的视频质量评价指标来驱动的。
LiveVideoStack
2021/09/02
1.9K0
如何选择和使用视频质量客观评价指标
视频质量评估算法 DVQA 正式开源
DVQA是腾讯多媒体实验室设计的基于深度学习的全参考视频质量评估算法。在整个视频链路中,我们可以量化大部分模块,如采集,上传,预处理,转码,分发。我们最未知的却恰恰是最关键的部分,即用户的视频观看体验。DVQA适用于在源参考视频可用的场景下,精确衡量视频内容的人眼感知质量。 DVQA包含多个质量评估算法模型,本次开源的算法为C3DVQA。本项目使用Python开发,深度学习模块使用PyTorch。代码使用模块化设计,方便集成较新的深度学习技术,灵活的自定义模型,训练和测试新的数据集。 算法设计 C3DVQ
腾讯开源
2020/03/09
2.7K1
细粒度视觉质量评价:回顾和思考
编者按:面向人眼感知的质量评价在许多视频图像处理算法和系统中发挥十分重要的作用。近年来学术界已经提出了许多质量评价方法,在已有数据集上取得了很高的性能,但是他们在实际应用中的表现仍然无法让用户满意,以至于无法得到广泛应用。LiveVideoStackCon 2022上海站大会我们邀请到了中国科学院大学副教授 张新峰老师,为我们详细分享了视觉质量评价的背景与问题以及细粒度视觉质量评价方法的发展与挑战。
LiveVideoStack
2023/01/10
1.2K0
细粒度视觉质量评价:回顾和思考
在线教育音视频质量评价与感知系统
大家好我是来自VIPKID的张武峰,今天我与大家分享的是在线教育音视频质量评价与感知系统。
LiveVideoStack
2019/11/04
3.3K1
在线教育音视频质量评价与感知系统
微帧科技:综合多项指标评价视频质量,才能更接近主观感受
视频流量在整个互联网流量的占比每年都在高速增长,为降低视频存储成本和数据传输通道的负载,视频压缩标准及算法在不断积极开发和改进。视频质量的评估在其中也起着至关重要的作用,尽管已经发展出了大量视频质量评估方法,但普遍接受度最高、最知名的评价方法还是经典的PSNR、SSIM以及VMAF。
微帧Visionular
2024/10/30
2870
微帧科技:综合多项指标评价视频质量,才能更接近主观感受
无参考质量评估在视频增强的进展与应用
大家可能对有参考质量评估有一定了解,某些有参考评价在应用上会有所限制,甚至在视频增强领域会存在不适应性,因此在第一阶段内容里会提到腾讯在无参考质量评估方面投入的原因以及想要去解决的一些问题,同时也会为大家列举几个在业界常用的有参考/无参考、传统学习/ 深度学习的质量评估方案。第二阶段会为大家介绍目前腾讯在使用的无参考质量评价,运用Rank Learning基于深度学习解决视频清晰度的打分方案。最后会对未来技术发展可能性和可能会遇到的挑战做一些总结。
LiveVideoStack
2019/08/01
3K0
无参考质量评估在视频增强的进展与应用
NTIRE2021 压缩视频增强竞赛各大方案简介
NTIRE的各大竞赛已经落下帷幕,冠亚军排名也相继确定,笔者近期会逐步将相关领域的竞赛结果进行一下简单总结,同时也将对这其中的冠军军及优秀方案进行一番解读,感兴趣的朋友可以关注一波...
AIWalker
2021/05/24
1.4K0
NTIRE2021 压缩视频增强竞赛各大方案简介
推荐阅读
相关推荐
回归VMAF分数的视频质量评价模块
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档