整理:AI算法与图像处理
CVPR2022论文和代码整理:https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo
ECCV2022论文和代码整理:https://github.com/DWCTOD/ECCV2022-Papers-with-Code-Demo
标题:DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model
主页:https://datid-3d.github.io/
论文:https://arxiv.org/abs/2211.16374
代码:https://github.com/gwang-kim/DATID-3D(未开源)
摘要:
在这里,我们提出 DATID-3D,这是一种新的文本引导域适应管道的3D 生成模型,使用文本到图像的扩散模型可以根据文本提示合成不同的图像,而无需为目标域收集额外的图像和相机信息。与先前文本引导域自适应方法的 3D 扩展不同,我们的新管道能够微调源域的SOTA的 3D 生成器,以在文本引导目标中合成高分辨率、多视图一致的图像没有额外数据的域,在多样性和文本图像对应方面优于现有的文本引导域自适应方法。此外,我们提出并演示了多种 3D 图像操作,例如一次性实例选择自适应和单视图操作 3D 重建,以充分享受文本的多样性。
INGeo: Accelerating Instant Neural Scene Reconstruction with Noisy Geometry Priors
MaRF: Representing Mars as Neural Radiance Fields
Solving the Weather4cast Challenge via Visual Transformers for 3D Images
Audio-Driven Co-Speech Gesture Video Generation
3D-LatentMapper: View Agnostic Single-View Reconstruction of 3D Shapes
Region-Conditioned Orthogonal 3D U-Net for Weather4Cast Competition
CoupAlign: Coupling Word-Pixel with Sentence-Mask Alignments for Referring Image Segmentation