仅在社交网络上,每天就有超过20亿张图片被分享。研究表明,一个人要花十年的时间才能看完Snapchat(色拉布)上所有的照片。这是一项相当乏味的任务,而且远远超过了人类的能力。媒体购买者和提供者在安排相关内容时遇到困难,分析图像/视频的组成部分,并以有效的方式生成内容定义投资回报。快速、准确、自动地获取多媒体的洞察力(也就是元数据、组成、类别、颜色)一直是一个挑战。NVIDIA有许多客户和生态系统合作伙伴解决这个问题,使用NVIDIA DGX作为深度学习(DL)驱动图像识别的首选平台。Imagga是该生态系统中有名气的品牌之一,它是提供深度学习驱动的图像识别和图像处理解决方案的先驱,该解决方案构建于世界上第一台个人人工智能超级计算机NVIDIA DGX Station。
与图像识别相关的重要术语
机器学习(Machine learning,ML)是一种人工智能的手动实现方法,允许使用近似智能的算法和我们每天都能听到的常用语。ML使用算法来分析数据,从中学习并帮助预测结果。
深度学习(Deep learning,DL)是ML的一个子集,或者说是一种实现ML的技术,随着开发人员利用神经网络的能力来发现洞察力,正在迅速取代工业,在没有人工手动编码功能的情况下自动检测模式是新的圣杯。
计算机视觉(Computer vision,CV)通过使用传感器和图像处理器来匹配人眼的能力,使计算机能够识别图像,ML和CV之间略有重叠。随着CV有助于处理每天产生数量惊人的视觉图像变得很重要。
图像处理(Image processing)是对图像执行某些操作(增强或压缩)以提取有用信息的一种方法。ML可用于计算机视觉和图像处理。
图像识别(Image recognition)是另一个术语,用于描述识别和检测图像或视频中的对象或特征的过程。有些人认为计算机视觉与图像识别相同,但计算机视觉更广泛,包括对象识别、字符识别和文本/情感分析。将图像识别与面部检测联系在一起是很常见的,但它还有更多的含义。
Imagga主要功能
分类/场景分类:自动将图片进行分类。例如,将照片按照山,海滩,宠物等进行分类。Imagga更强大的功能之一,是为特定用例和垂直方向训练特定分类器,从个人照片到植物识别到垃圾分类。
识别主要对象:识别图像中的主要对象。
自动标签照片:用不同的关键词来标注多个对象来帮助照片的排序、获取进行统计。
提取颜色:识别图像中的代表色,包括对所需要的前景和背景颜色进行单独识别。
分析构图:自动检测照片中最具视觉趣味性的区域,并最终实现对这些感兴趣区域的智能裁剪。
面部识别人脸:识别人脸并将其聚集到虚拟人物中,便于组织机构更好的对个人照片和社交媒体进行监控。
视觉相似性搜索:在一个集合中提取图像的特征,在一个集合中提取图像的特征,并允许其基于视觉、语义相似度进行搜索,以及类似的照片/产品建议。
领取专属 10元无门槛券
私享最新 技术干货