整理:AI算法与图像处理
CVPR2022论文和代码整理:https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo
ECCV2022论文和代码整理:https://github.com/DWCTOD/ECCV2022-Papers-with-Code-Demo
摘要:
我们解决了从一般标记(例如电影海报)到捕获此类标记的图像的对应关系估计问题。传统上,这个问题是通过拟合基于稀疏特征匹配的单应性模型来解决的。以处理类似平面的标记并且稀疏特征没有充分利用外观信息。在本文中,我们提出了一种新的框架 NeuralMarker,在各种具有挑战性的条件下训练神经网络来估计密集的标记对应,例如标记变形、强光等。对应学习的性能曾经提供了足够的训练数据。但是,为训练标记对应注释像素级密集对应太昂贵了。我们观察到标记对应估计的挑战来自两个单独的方面:几何变化和外观变化。在 NeuralMarker 中解决这两个挑战。首先,我们创建了一个合成数据集 FlyingMarkers,其中包含具有地面实况密集对应的标记图像对。通过使用 FlyingMarkers 进行训练,鼓励神经网络捕捉各种标记运动。其次,我们提出了新颖的对称对极距离 (SED) 损失,这使得能够从姿势图像中学习密集对应。通过 SED 损失和由运动结构 (SfM) 收集的交叉照明姿势图像进行学习,NeuralMarker 在恶劣的照明环境中非常稳健,并避免了合成此外,我们还提出了一种新的标记对应评估方法,围绕真实标记-图像对的注释,并创建了一个新的基准。我们表明,NeuralMarker 显着优于以前的方法,并支持新的有趣应用,包括增强现实 (AR) 和视频编辑。
SEMICON: A Learning-to-hash Solution for Large-scale Fine-grained Image Retrieval
Towards Regression-Free Neural Networks for Diverse Compute Platforms
Mixed-domain Training Improves Multi-Mission Terrain Segmentation
Racial Bias in the Beautyverse
Rethinking Clustering-Based Pseudo-Labeling for Unsupervised Meta-Learning
Spatial Pruned Sparse Convolution for Efficient 3D Object Detection
TVLT: Textless Vision-Language Transformer
Leveraging machine learning for less developed languages: Progress on Urdu text detection
Obj2Seq: Formatting Objects as Sequences with Class Prompt for Visual Tasks
Multi-Sample Training for Neural Image Compression
An Embarrassingly Simple Approach to Semi-Supervised Few-Shot Learning