我正在读一篇关于制作/合成视频的研究论文:
为了评估所生成的视频,他们使用了一个名为“平均内容距离”的指标。我在谷歌上找不到任何与此相关的资料。有人能解释一下平均内容距离是什么意思吗?
这是报纸上的片段
我们首先计算每个帧中生成的形状的平均颜色。然后用一个三维向量来表示每个帧.然后,由每帧平均颜色向量的平均成对L2距离给出ACD。
我对此的理解如下:
对于每个帧,将rgb转换为灰色(颜色平均值)。然后对于连续帧,计算l2距离。
这给了ACD。我正确理解了吗?
此外,这个度量如何表示视频的质量?如何用它来比较不同制作的视频的质量呢?你也可以指给我一些参考资料。
谢谢!
发布于 2019-05-26 11:40:37
这篇文章给出了实现ACD度量的两种方法。你谈论的是ACD(使用文章的符号)。据我所知,
ACD是以同样的方式获得的,但是您使用的是从图像(帧)中提取的具有“编码类”网络的特征向量。在处理面部表情时,OpenFace可能是一个不错的选择。
你的公式可能与作者的意图不同。想象一下黑屏上的白点。从一个框架到另一个框架,这个点正逐渐从一边移动到另一边。您的度量显示此视频中的内容正在发生变化。光点移动得越快,就会发生更大的变化(好的,如果一个点和一个黑屏以一定的速度到达饱和点,您的度量将停止改变在一个框架中,光斑移动的距离等于其直径。,但这是另一回事)。然而,事实上,内容并没有改变。你还有黑点和黑屏。这就是为什么你需要平均(而不是求和‘变化’,并使它独立于图像大小-这是你的公式所做的)
这里您可以看到ACD度量(S)的实现。我不能保证那是100%正确的。所以,如果有任何不确定因素,请告诉我。
https://datascience.stackexchange.com/questions/46508
复制