旷视开源了一套图像检索和 ReID 的 PyTorch 库,论文“PyRetri: A PyTorch-based Library for Unsupervised Image Retrieval by Deep Convolutional Neural Networks”介绍了其主要内容。
01
架构
深度学习图像检索无监督方法的架构:
02
方法
该库目前支持的方法:
1、前处理方法:
2、特征表示方法:
3、后处理方法:
特别值得一提的是,为了降低用户选择不同算法和超参数配置的难度,PyRetri提供了自动化的配置搜索工具,可根据用户定义的搜索空间和搜索脚本,自动选择最优的算法流程。
03
结果
作者在基于内容的图像检索(CBIR)和行人重识别(ReID)常用数据集 Oxford5k、CUB-200-2011、Indoor、Caltech101、Market-1501上进行了实验。
上表列出了通过搜索配置得到的前三个算法配置和每个数据集上的baseline方案结果的比较,可见使用官方推荐的配置工具,大大提高了检索mAP!
使用 PyRetri 检索时各阶段用时比较:
可见每幅图像平均时间还不到 8ms。
以下是在ReID问题上的实验结果:
可见,PyRetri 较好的复现了经典论文的结果,而且如果使用自动搜索配置的方法,能大幅提高精度!超过原方案10个百分点之多!
论文地址:
https://arxiv.org/abs/2005.02154
代码地址:
https://github.com/PyRetri/PyRetri
模型下载:
官方不仅开源了代码,也提供了在ImageNet、Places365、Market-1501、DukeMTMC-reID数据集上的预训练模型,可惜国内无法下载。