首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    CVPR2022丨无缝连接视觉-语言,北京通用人工智能研究院提出新模型超越基准

    理解具有语言描述的复杂视觉场景图像是人工智能的一项基本任务。先前的研究工作已经通过分别为视觉场景(如场景图)和自然语言(如依存树)构建层次结构,展示了令人信服的理解结果。然而,如何建立一个联合视觉和语言(VL)的图结构、建模多模态的依存关系长期缺乏关注。 在今天要介绍的这篇论文研究工作中,来自北京通用人工智能研究院的研究人员提出了一项新任务,旨在以无监督的方式学习联合结构。目前这篇论文已被计算机视觉顶级学术会议CVPR 2022接收。 具体来说,本论文研究的目标是无缝连接视觉场景图和语言依存树。由于缺乏视

    01
    领券