前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >是时候展示一波花里胡哨了——以图搜图

是时候展示一波花里胡哨了——以图搜图

作者头像
AI算法与图像处理
发布于 2019-05-22 10:43:03
发布于 2019-05-22 10:43:03
1.9K00
代码可运行
举报
运行总次数:0
代码可运行

导读

前段时间分享一个小视频,今天来详细讲解一波如何实现以图搜图,这篇写了好几天,自身能力有限可能没办法写的非常完美,也没有办法把所有点都讲的非常的仔细,但是我都会附上详细的链接,大家有什么不懂的都可以去查一哈,我觉得这个项目还是挺有趣的,最后我还附上了一个视频操作,第一次录视频意外多多,不足之处请大家见谅,如果尝试过后觉得不错的可以帮忙点一波“在看”或者分享朋友圈和群,小编会万分感谢的!!!

全文共 3600 字,16幅图表截屏

预计阅读时间 9分钟。

一、什么是以图搜图

广义上,图像搜索的分类可以分为两种,

(1)基于上下文本的图片搜索

例如:百度,在搜索框中输入“搜索文字”,点击“图片搜索”,即可获得图片搜索结果;

(2)基于图片内容的搜索

基于图片中特征进行搜索

详细内容可以查看:

《当SIFT邂逅CNN:图像检索任务跨越十年的探索历程》https://www.jianshu.com/p/80159860d4e0

图像搜索在现在应用的非常普遍,是一个非常有趣和实用的工具。相对于关键字搜索,以图搜图的方式更加的方便,特别对于特征难以用文字描述的,这个时候图像搜索就能展示出它的强大了。

当然还有很多应用场景: 例如,

你需要的图片有水印,想要找到无水印的版本。 你需要的图片分辨率太低,想要找到高清的图片。 你需要的图片只是一部分,想要找到完整的版本。 逛论坛时发现了一个美女,你想要知道她的资料。 图片是某个电影里的截图,你想要知道它的出处。 你想知道你的原创图片是否被他人转载或者盗用。 你看到一个帅哥或美女穿着十分亮眼,想要买同款。 有一个长得很漂亮的美女主动加你微信,说头像是本人。 朋友送了你一个不知道什么的国外品牌,你好奇到底是什么。 。。。

二、常见的以图搜图的网站

百度识图:https://www.baidu.com/

拍立淘:http://www.pailitao.com/

360图片:http://image.so.com/

更多的可以查考:https://www.runningcheese.com/cbir

例如百度的以图搜图步骤如下:

(1)打开百度(www.baidu.com)

(2)基于文本的图片搜索:

(3)基于图片内容的图片搜索:

1、点击“相机”图标

2、拖拽图片

3、自动显示结果

三、基于内容的图像搜索原理

这里以淘宝的产品拍立淘为例,

拍立淘的原理:

参考:https://www.sohu.com/a/164506831_468650

实际上,拍立淘图像搜索的过程分为两步,

第一步:识别物品种类

第二部:相似度匹配

-------------------------------------------

(1)识别物品种类(目标检测):当你拿起手机拍照的时候,手机淘宝会对图片中的所有物品进行识别,然后提示让你选择你所需要的找的相似物品类别是什么,这个过程实际上就是一个目标检测(如下图所示);

对于上面的图中,含有衣服以及书包,此时软件会让你根据需求进行选择相应的类别,在对应类别的库中搜索相似的商品并输出结果;

(2)相似度匹配:第一步的目的找到对应的类别,而找到了对应的类别还不能满足我们的需求,比如找到了书包,但实际上书包的款式多种多样,还是无法满足我们的需求,对于上图中,如果我们用语言去描述这个书包,很难准确的描述并找到目标商品,这时就体现了以图搜图的价值了,通过对目标商品进行特征提取并在图片库中进行对比,找到最相似的结果并输出。

由于淘宝的应用场景复杂,种类繁多,而这里我们只想演示一下而已,所以做了一个简单的展示,截取重点的部分进行代码演示:

原理:

具体步骤:

(1)图片获取——通过关键字,爬取百度上面的图片

(2)对获取的图片提取特征,建立特征索引库

(3)对测试图片进行特征提取,并在索引库中比较,按相似度排序并输出

四、代码实现

所采用的工具python3.6,keras2.2.4

1)图片获取——通过关键字,爬取百度上面的图片

这里不详细说明爬取百度图片的原理和细节,因为我毕竟不是非常懂,重点讲解一下如何使用,具体的原理和代码可以查看下面的链接https://blog.csdn.net/qq_40774175/article/details/81273198

详细操作:

1、新建一个名字为name.txt的文档,并输入需要的关键字(支持多个关键自)

备注:我在name.txt中输入 dasima(换行) wuwukai

这里关键词不要用中文的,不然会对后面的操作会报错

2、运行代码pachong.py,输入每个对应关键字所需要下载的图片数量

此时程序会从网上爬取到图片并保存到对应的文件夹中(以关键词命名的文件夹),获取完毕后新建一个文件夹img,当做图片库的存储,并将爬取的图片都放进去;

-----------------------获取图片完毕-----------------------

(2)对获取的图片提取特征,建立特征索引库

这里参考《python计算机视觉》的作者之一,袁勇github上面的代码

https://github.com/willard-yuan/flask-keras-cnn-image-retrieval

主要的代码为三个,其中index.py用于提取图片的特征和建立索引,query_online.py用于库内搜索

其基本原理是利用VGG16的预训练模型提取图片库的特征(extract_cnn_vgg16_keras.py),同时会将最终输出的特征向量进行归一化,并建立一个索引库

使用方法:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 建立索引库# python3 index.py -database <path-to-dataset> -index <name-for-output-index>index.py -database <path-to-dataset> -index <name-for-output-index># 对database文件夹内图片进行特征提取,建立索引文件featureCNN.h5python3 index.py -database database -index featureCNN.h5

(3)对测试图片进行特征提取,并在索引库中比较,按相似度排序并输出

这里采用的相似度实际上是利用测试图片的特征向量(VGG16提取)归一化后与索引库相乘,就是由于特征向量都进行了归一化,当测试图片的特征向量如果与索引库中的某一列的乘积等于1,即说明他们是完全相同的。

其他情况,结果由向量积计算结果可知其相似度的值。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 在线测试# python query_online.py -query <path-to-query-image> -index <path-to-index-flie> -result <path-to-images-for-retrieval># 使用database文件夹内001_accordion_image_0001.jpg作为测试图片,在database内以featureCNN.h5进行近似图片查找,并显示最近似的3张图片python3 query_online.py -query database/001_accordion_image_0001.jpg -index featureCNN.h5 -result database

注意:这里有个地方可能会报错,当然作者也给出了解决方案

这里,我斗胆进行了一点点的修改,

(1)增加了一个异常处理操作,主要是为了方便,即使手误输错也能继续运行,这个在之前的文章中有讲解过;

学会这招再也不怕手误让代码崩掉

(2)作者最终显示的结果只能一张一张的展示,没有对比图,因此我稍微修改了一下,让可视化的效果更加的美观一些,有兴趣的可以参考我的代码;

(3)我对参数输入也进行了修改,将模型名字和图片库的路径都固定了,这样子测试的时候比较方便,大家在使用的时候请注意下,如果修改了名字要对应起来。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#操作汇总# (1)打开终端执行index.py代码python3 index.py -database img -index lol.h5# 此时已经将图片库转成索引库并保存和输出lol.h5模型# (2)继续运行代码 query_online.pypython3 query_online.py# 按照提示,如果要退出输入 exit 查询直接enter# 输入测试图片 名字即可(如果测试图片额代码不在同一路径下需要增加路径——这里 设置EI相对路径)

代码:https://github.com/DWCTOD/flask-keras-cnn-image-retrieval-master

可以的话,也可以点一下下star,感谢

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-05-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI算法与图像处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
以图搜图技术演进和架构优化【优质文章】
当你看到一株未曾见过的植物,你可以打开百度APP,拍照搜索,找到相关信息;当你看到朋友穿了一件你特别喜欢的衣服,你也想买一件,你可以通过淘宝APP的拍立淘功能,找到商品;当你到达一个陌生的地方,你可以通过微信APP对着当地的街区或者建筑物拍一张照片,来定位你的详细位置。这背后都是强大的以图搜图技术。
AI算法与图像处理
2019/05/22
1.6K0
以图搜图技术演进和架构优化【优质文章】
Milvus开源向量搜索引擎,轻松搭建以图搜图系统
当您听到“以图搜图”时,是否首先想到了百度、Google 等搜索引擎的以图搜图功能呢?事实上,您完全可以搭建一个属于自己的以图搜图系统:自己建立图片库;自己选择一张图片到库中进行搜索,并得到与其相似的若干图片。 Milvus 作为一款针对海量特征向量的相似性检索引擎,旨在助力分析日益庞大的非结构化数据,挖掘其背后蕴含的巨大价值。为了让 Milvus 能够应用于相似图片检索的场景,我们基于 Milvus 和图片特征提取模型 VGG 设计了一个以图搜图系统。 正文分为数据准备、系统概览、 VGG 模型、API 介绍、镜像构建、系统部署、界面展示七个部分。数据准备章节介绍以图搜图系统的数据支持情况。系统概览章节展示系统的整体架构。 VGG 模型章节介绍了 VGG 的结构、特点、块结构以及权重参数。 API 介绍章节介绍系统的五个基础功能 API 的工作原理。镜像构建章节介绍如何通过源代码构建客户端和服务器端的 docker 镜像。系统部署章节展示如何三步搭建系统。界面展示章节会展示系统的搜索界面。
Zilliz RDS
2020/03/26
5.2K0
Milvus开源向量搜索引擎,轻松搭建以图搜图系统
利用深度学习手把手教你实现一个「以图搜图」
在上一篇文章《图像检索系列——利用 Python 检测图像相似度》中,我们介绍了一个在图像检索领域非常常用的算法——感知哈希算法。这是一个很简单且快速的算法,其原理在于针对每一张图片都生成一个特定的“指纹”,然后采取一种相似度的度量方式得出两张图片的近似程度。
出其东门
2019/09/03
2.9K0
利用深度学习手把手教你实现一个「以图搜图」
实战 | 多种方法实现以图搜图
作者:Anson Wong 编译:AI算法与图像处理 代码链接:https://github.com/ankonzoid/artificio/tree/master/image_retrieval 以图搜图技术是日常生活中常用的功能,当你看到某张图片某件衣服甚至是某个明星,可能都无须舔着脸问你身边的小伙伴了,因为目前的搜图技术能基本满足你的日常需求。那么这么有趣又实用的技术,到底如何去实现它呢?之前有分享过两篇相关的文章《是时候展示一波花里胡哨了——以图搜图》 《以图搜图技术演进和架构优化【优质文章】》 预期目标
AI算法与图像处理
2019/09/25
2.7K0
实战 | 多种方法实现以图搜图
Milvus 到底有多少种玩法?这份攻略合集请收好!
Milvus 是一款开源的向量相似度搜索引擎,支持使用多种 AI 模型将非结构化数据向量化,并为向量数据提供搜索服务。Milvus 集成了 Faiss、Annoy 等广泛应用的向量索引库,开发者可以针对不同场景选择不同的索引类型。使用 Milvus 就可以以相当低的成本研发出最简可行产品。
Zilliz RDS
2021/03/22
3.3K0
Milvus 到底有多少种玩法?这份攻略合集请收好!
偷窥了阿里的图像搜索架构,干货分享给你!
👆关注“博文视点Broadview”,获取文末赠书 进入21世纪以来,伴随着互联网的高速发展,通过图像和视频来进行需求表达越来越成为大家的习惯。 图像搜索与识别算法使得图像视频内容得以结构化和数字化,以便可以在各种检索和分析引擎中被最大限度地挖掘和利用。 阿里巴巴研发出的移动端以图搜图应用——拍立淘,使用户可以通过拍摄照片,在手机淘宝上迅速找到同款及相似商品,是图像搜索与识别领域极具代表性的落地产品。 因为拍立淘,我们可以在不知道商品品牌、名字等信息的情况下搜索到想要的同类品。 那么,拍立淘的架构设计是
博文视点Broadview
2023/05/19
5660
偷窥了阿里的图像搜索架构,干货分享给你!
【腾讯云云上实验室】《手把手带你 5 分钟构建以图搜图系统》
向量在数学中是一个可以表示多个维度或特性的对象。在我们日常生活中,也可以用来描述一个物体的多个属性。
码农学习联盟
2023/11/24
7820
【腾讯云云上实验室】《手把手带你 5 分钟构建以图搜图系统》
图像搜索|高维空间最近邻逼近搜索算法
上一次介绍图像搜索的基本原理,现在记录下使用的数据包的问题。 查询图片先进行特征提取,使用一个向量来表示,之后使用该向量与数据库中所有的商品向量进行计算相似度指标,比如cos距离,欧式距离,汉明距离。 具体的取决于向量的形式,有的先用cnn提取特征向量,可以计算其cos距离,有的提取之后对其进行哈希编码,先用汉明距离进行粗排,之后按照欧式距离进行重排。 这里就面临这样的一个问题:
用户3578099
2019/08/15
1.6K0
大厂技术实现 | 图像检索及其在淘宝的应用 @计算机视觉系列
图像检索任务指的是,给定查询图像,从图像数据库中找到包含相同或相似实例的图像。典型应用之一就是电商商品检索,如淘宝拍立淘,只需要用户随手拍照即可精准检索,提高了电商购物的体验。本篇我们来看看淘宝拍立淘背后的实现方案和依托的计算机视觉技术。
ShowMeAI
2021/11/24
2.9K0
大厂技术实现 | 图像检索及其在淘宝的应用 @计算机视觉系列
以图搜图系统工程实践
•提取图像特征向量(用特征向量去表示一幅图像)•特征向量的相似度计算(寻找内容相似的图像)
凌虚
2020/07/17
7990
微信AI从识物到通用图像搜索的探索揭秘
作者:lincolnlin,腾讯 WXG 专家研究员 微信识物是一款主打物品识别的 AI 产品,通过相机拍摄物品,更高效、更智能地获取信息。2020 年,微信识物拓展了更多识别场景,上线了微信版的图片搜索。本篇文章将与大家分享微信识物从识物拓展到通用图像搜索领域的发展过程。 微信识物 以上小视频简单介绍了识物的产品形态,它对微信扫一扫的扫封面能力进行了升级。打开微信扫一扫,左滑切换到“识物”功能,对准想要了解的物品正面,可以获取对应的物品信息,包括物品百科、相关资讯、相关商品。在微信识物发布不久,也
腾讯技术工程官方号
2020/12/07
3.7K0
视觉搜索是移动搜索的未来?
罗超为虎嗅网、钛媒体、TECH2IPO、DONEWS、爱科技和新浪科技撰稿。 愚人节当天发布消息很容易会让人产生联想。比如苹果的道歉,再比关于百度的两则消息:一是百度宣布与知名娱乐商达成合作,通过“机器评委系统”进行海选,以机器方式替代人工面试筛选,网友只需拍摄或上传照片就能参与。在选秀节目和评委满天飞的情况下,机器也来凑热闹?还有就是:百度宣布内测成功"Baidu Eye",这是类似于Google Glass的设备,据称将配备超小液晶显示、语音操控、图像识别、骨传导技术,并且和百度语音、百度云、百度地图等
罗超频道
2018/04/25
1.8K0
TiDB Vector 抢先体验之用 TiDB 实现以图搜图
最早知道 TiDB 要支持向量化的消息应该是在23年10月份左右,到第一次见到 TiDB Vector 的样子是在今年1月初,当时 dongxu 在朋友圈发了一张图:
HOHO
2024/04/24
1940
TiDB Vector 抢先体验之用 TiDB 实现以图搜图
Elasticsearch 8.X “图搜图”实战
"图搜图"指的是通过图像搜索的一种方法,用户可以通过上传一张图片,搜索引擎会返回类似或者相关的图片结果。这种搜索方式不需要用户输入文字,而是通过比较图片的视觉信息来找到相似或相关的图片。这项技术在许多不同的应用中都很有用,如找到相同或相似的图片,寻找图片的来源,或者识别图片中的物体等等。
铭毅天下
2023/08/18
8990
Elasticsearch 8.X “图搜图”实战
基于 Milvus 的以图搜图系统 2.0
Milvus 以图搜图 1.0 版本自发布以来便受到广大用户的欢迎。近日,Zilliz 推出了 Milvus 以图搜图系统 2.0 版。本文将介绍 Milvus 以图搜图系统 2.0 版的主要更新内容。
Zilliz RDS
2021/04/26
3.3K0
手把手教你使用CLIP和VectorDB构建一个以图搜图的工具
在传统的图像搜索引擎中,您通常使用文本查询来查找图像,搜索引擎根据与这些图像关联的关键字返回结果。另一方面,在图像到图像搜索中,您从图像作为查询开始,系统会检索在视觉上类似于查询图像的图像。
Color Space
2024/02/01
7310
手把手教你使用CLIP和VectorDB构建一个以图搜图的工具
基于内容的图像检索技术综述-传统经典方法
今天我们来介绍一下图片检索技术,图片检索就是拿一张待识别图片,去从海量的图片库中找到和待识别图片最相近的图片。这种操作在以前依靠图片名搜图的时代是难以想象的,直到出现了CBIR(Content-based image retrieval)技术,依靠图片的内容去搜图。比较常见的图搜平台有百度、谷歌、拍立淘等,有些图搜技术已经能达到非常不错的效果。接下来我们做个测试,给出一个柯基宝宝的图片,分别用三家搜索引擎进行搜索:
SIGAI学习与实践平台
2018/08/07
5240
基于内容的图像检索技术综述-传统经典方法
精品连载|“深度学习与计算机视觉”学习笔记——应用篇
图像分类,这个是计算机视觉的基础任务,主要包含通用图像分类和细粒度图像分类,其中细粒度分类,需进一步从大类中进行细分类,比如识别狗是哪个品种。
灯塔大数据
2020/07/14
6380
图形商标近似检索-知擎者的 Milvus 实践
知擎者是一个商标大数据智能应用平台,以商标数据为核心,结合企业大数据、法律大数据、营销大数据等,提供基础业务处理、商标预警监测、案件智能挖掘、数据情报分析等服务,为知产服务者提效赋能。知擎者不断协助知产服务者改变传统业务处理模式,创建智慧服务新体系,拓展更多业务机会,以达到知产服务者快速盈利和品牌建设的目标。
Zilliz RDS
2021/02/03
1K0
图形商标近似检索-知擎者的 Milvus 实践
使用 Python 构建图片搜索引擎
我们经常使用搜索引擎。当我们需要查询时,我们可以使用像 Google 这样的搜索引擎来检索最相关的答案。
AI算法与图像处理
2021/01/20
1.1K0
使用 Python 构建图片搜索引擎
推荐阅读
相关推荐
以图搜图技术演进和架构优化【优质文章】
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验