首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >这个算法太牛啦!可用于视频编辑和AR!代码即将开源!NeuralMarker!论文速递2022.9.29!

这个算法太牛啦!可用于视频编辑和AR!代码即将开源!NeuralMarker!论文速递2022.9.29!

作者头像
AI算法与图像处理
发布2022-12-11 12:44:22
发布2022-12-11 12:44:22
6930
举报

整理:AI算法与图像处理

CVPR2022论文和代码整理:https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo

ECCV2022论文和代码整理:https://github.com/DWCTOD/ECCV2022-Papers-with-Code-Demo

最新成果demo展示:

标题:NeuralMarker: A Framework for Learning General Marker Correspondence 代码:https://github.com/drinkingcoder/NeuralMarker

摘要:

我们解决了从一般标记(例如电影海报)到捕获此类标记的图像的对应关系估计问题。传统上,这个问题是通过拟合基于稀疏特征匹配的单应性模型来解决的。以处理类似平面的标记并且稀疏特征没有充分利用外观信息。在本文中,我们提出了一种新的框架 NeuralMarker,在各种具有挑战性的条件下训练神经网络来估计密集的标记对应,例如标记变形、强光等。对应学习的性能曾经提供了足够的训练数据。但是,为训练标记对应注释像素级密集对应太昂贵了。我们观察到标记对应估计的挑战来自两个单独的方面:几何变化和外观变化。在 NeuralMarker 中解决这两个挑战。首先,我们创建了一个合成数据集 FlyingMarkers,其中包含具有地面实况密集对应的标记图像对。通过使用 FlyingMarkers 进行训练,鼓励神经网络捕捉各种标记运动。其次,我们提出了新颖的对称对极距离 (SED) 损失,这使得能够从姿势图像中学习密集对应。通过 SED 损失和由运动结构 (SfM) 收集的交叉照明姿势图像进行学习,NeuralMarker 在恶劣的照明环境中非常稳健,并避免了合成此外,我们还提出了一种新的标记对应评估方法,围绕真实标记-图像对的注释,并创建了一个新的基准。我们表明,NeuralMarker 显着优于以前的方法,并支持新的有趣应用,包括增强现实 (AR) 和视频编辑。


最新论文整理

ECCV2022

Updated on : 29 Sep 2022
total number : 5

SEMICON: A Learning-to-hash Solution for Large-scale Fine-grained Image Retrieval

  • 论文/Paper: http://arxiv.org/pdf/2209.13833
  • 代码/Code: https://github.com/njust-vipgroup/semicon

Towards Regression-Free Neural Networks for Diverse Compute Platforms

  • 论文/Paper: http://arxiv.org/pdf/2209.13740
  • 代码/Code: None

Mixed-domain Training Improves Multi-Mission Terrain Segmentation

  • 论文/Paper: http://arxiv.org/pdf/2209.13674
  • 代码/Code: None

Racial Bias in the Beautyverse

  • 论文/Paper: http://arxiv.org/pdf/2209.13939
  • 代码/Code: None

Rethinking Clustering-Based Pseudo-Labeling for Unsupervised Meta-Learning

  • 论文/Paper: http://arxiv.org/pdf/2209.13635
  • 代码/Code: https://github.com/xingpingdong/pl-cfe

CVPR2022

NeurIPS

Updated on : 29 Sep 2022
total number : 6

Spatial Pruned Sparse Convolution for Efficient 3D Object Detection

  • 论文/Paper: http://arxiv.org/pdf/2209.14201
  • 代码/Code: None

TVLT: Textless Vision-Language Transformer

  • 论文/Paper: http://arxiv.org/pdf/2209.14156
  • 代码/Code: https://github.com/zinengtang/tvlt

Leveraging machine learning for less developed languages: Progress on Urdu text detection

  • 论文/Paper: http://arxiv.org/pdf/2209.14022
  • 代码/Code: None

Obj2Seq: Formatting Objects as Sequences with Class Prompt for Visual Tasks

  • 论文/Paper: http://arxiv.org/pdf/2209.13948
  • 代码/Code: https://github.com/casia-iva-lab/obj2seq

Multi-Sample Training for Neural Image Compression

  • 论文/Paper: http://arxiv.org/pdf/2209.13834
  • 代码/Code: None

An Embarrassingly Simple Approach to Semi-Supervised Few-Shot Learning

  • 论文/Paper: http://arxiv.org/pdf/2209.13777
  • 代码/Code: None
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-09-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI算法与图像处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 最新成果demo展示:
    • 标题:NeuralMarker: A Framework for Learning General Marker Correspondence 代码:https://github.com/drinkingcoder/NeuralMarker
  • 最新论文整理
  • ECCV2022
    • Updated on : 29 Sep 2022
    • total number : 5
  • CVPR2022
  • NeurIPS
    • Updated on : 29 Sep 2022
    • total number : 6
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档