首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

大规模食品图像识别:T-PAMI 2023论文解读

1 引言 视觉智能部与中科院计算所于2020-2021年度展开了《细粒度菜品图像识别和检索》科研课题合作,本文系双方联合在IEEE T-PAMI2023发布论文《Large Scale Visual...本论文相关数据集、代码和模型可从网站下载:http://123.57.42.89/FoodProject.html。...虽然也有一些食品图像识别方法(如PAR-Net[13])在中小规模食品数据集上取得了较好性能,但它们在Food2K大规模食品图像识别数据集上也并不能获得更好性能。...(2)食品图像识别的人类视觉评价:与人类视觉对一般物体识别的研究相比,对食品图像识别进行评价可能更加困难。例如,食品具有较强地域和文化特征,因此来自不同地区的人对食品图像识别会有不同偏见。...在技术沉淀层面,我们围绕此食品计算技术不断推陈出新,目前申请专利20项,发表CCF-A类会议或期刊论文4篇(如AAAI、TIP、ACM MM等);我们还参加了2019年和2022年CVPR FGVC细粒度识别比赛

99930

NFNETS论文解读:不使用BN高性能大规模图像识别

简介与概述 因此,本文重点是在不是使用BN来构建图像识别的卷积残差神经网络。...但是如果没有BN,这些网络通常无法很好地运行或无法扩展到更大批处理大小,但是本篇论文构建网络可以使用大批次进行伦联,并且比以前最新方法(例如LambdaNets)更有效 。...论文贡献 作者提出了自适应梯度裁剪(AGC),该方法基于梯度范数与参数范数单位比例来裁剪梯度,他们证明了AGC允许我们训练具有更大批处理量和更强大数据增强功能无规范化网络。...AGC所做是,它可以缩放渐变,不仅可以将渐变缩放到其自己范数,还可以将渐变裁剪为比率(渐变大小/渐变所作用权重是多少)。乍一看可能会有些困惑,详细请看论文第4页,以更清晰地理解AGC。...最后本篇论文地址: https://arxiv.org/pdf/2102.06171.pdf High-Performance Large-Scale Image Recognition Without

61920
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    大会 | AAAI论文:基于强化学习循环查找受关注区域多标签图像识别

    AI 科技评论按:近日,中山大学-商汤科技联合发表 AAAI2018 论文 「Recurrent Attentional Reinforcement Learning for Multi-label Image...相比于目前存在其他方法,该方法在识别精度和效率上都取得极大提升。本文将详细介绍论文中提出方法。 多标签图像识别 多标签图像识别是计算机视觉领域一个非常重要且比较难任务。...2)本文利用记忆网络直接对不同局部区域关联进行建模,这可以有效利用标签共存情况,进一步提升多标签图像识别性能。 RARL框架 RARL 框架如下图所示。...LSTM 根据前一次迭代隐层状态特征 ht-1 以及当前迭代提取区域特征,预测这些区域标签分布以及搜索用于下一次迭代最优位置。...最后,RARL 聚合所有区域预测标签分布,得到最后分类结果。

    1.4K60

    图像识别

    我们大脑使视觉看起来很容易。人类不会分解一只狮子和一只美洲虎,看一个标志,或认出一个人脸。但这些实际上是用计算机解决难题:他们看起来很容易,因为我们大脑非常好地理解图像。...通过验证其对ImageNet工作,研究人员已经证明了计算机视觉稳步进展,这是计算机视觉 学术基准。...Google内部和外部研究人员发表了描述所有这些模型论文,但结果仍难以重现。我们现在正在采取下一步,发布在最新型号Inception-v3上运行图像识别的代码。...该模型希望获得299x299RGB图像,所以这些是input_width和input_height标志。我们还需要将从0到255之间整数像素值缩放到图形运算浮点值。...最后,如果你想加快在这方面的研究速度,你可以阅读本教程中引用所有论文最新作品。

    19.5K80

    重磅 | 谷歌发布Graph Learning平台,解密图像识别核心技术(附论文

    很多你日常使用谷歌产品及功能背后,都有基于图机器学习,这是一种强大工具,能够用于收件箱提醒、Allo 智能信息回复等功能,基于图机器学习和深度神经网络一起,为 Google Photos 最新图像识别系统提供动力...基于图半监督学习方法重要优势在于,系统在学习时候同时吸收带有标签和不带标签数据,这样有助于改善数据底层结构,此外,多种不同信号能很轻松地混合在一起(比如带有原始特征知识图谱相关信息),用单一图表示...比如,在研究团队最近发表论文中,研究者开发了一个收件箱智能回复功能,邮件信息就被表示为节点,而颜色则代表着用户回复语义类型,(比如 对,太好了,很有趣)。...为了解决这一挑战,在去年发表论文“ Large Scale Distributed Semi-Supervised Learning Using Streaming Approximation”(使用流近似的大规模分布式半监督学习...论文介绍了一种流算法( streaming algorithm),以分布式方法,处理相邻节点中传播信息,这使得在大规模图中进行工作成为可能。

    1.1K70

    算法集锦(14)|图像识别| 图像识别算法罗夏测试

    随着对基于深度学习图像识别算法大量研究与应用,我们倾向于将各种各样算法组合起来快速进行图片识别和标注。...优化后算法在内存使用和模型训练上表现越来越好,但当这些算法应用于模糊、意义不确定图像时,它们表现又会如何呢?...方法很简单:设定我预测,明确我对每一个预测理解,这样我就可以用正确工具来完成接下来工作。...除了内存使用和可训练参数,每个参数实现细节都有很大不同。与其挖掘每个结构特殊性,不如让看看它们是如何处理这些模糊、意义不明数据。...测试结果 总的来说,我们目标是对预测和预测背后机理有一个快速认识。因此点,我们将预测分值靠前分为一组,并将它们得分相加。

    5.1K20

    基于OpenCV棋盘图像识别

    最终应用程序会保存整个图像并可视化表现出来,同时输出棋盘2D图像以查看结果。 (左)实时摄像机进给帧和棋盘(右)二维图像 01....数据 我们对该项目的数据集有很高要求,因为它最终会影响我们实验结果。我们在网上能找到国际象棋数据集是使用不同国际象棋集、不同摄影机拍摄得到,这导致我们创建了自己数据集。...使用低级和中级计算机视觉技术来查找棋盘特征,然后将这些特征转换为外边界和64个独立正方形坐标。该过程以Canny边缘检测和Hough变换生成相交水平线、垂直线交点为中心。...3.在冻结层顶部添加了新可训练层。...测试数据混淆矩阵 05. 应用 该应用程序目标是使用CNN模型并可视化每个步骤性能。

    7.4K20

    Airtest图像识别

    Airtest是一款网易出品基于图像识别面向手游UI测试工具,也支持原生Android App基于元素识别的UI自动化测试。...图示为AirtestIDE中脚本运行范例 本文重点是针对Airtest中图像识别进行代码走读,加深对图像识别原理理解(公众号贴出代码显示不全仅供参考,详细代码可以在github查看)。...这里可以看到,Airtest也没有自研一套很牛图像识别算法,直接用OpenCV模板匹配方法。 四、接着看另外一个方法 aircv.find_sift 定义在sift.py里面: ? ?...OpenCV图像识别算法。...六、总结 1、图像识别,对不能用ui控件定位地方,使用图像识别来定位,对一些自定义控件、H5、小程序、游戏,都可以支持; 2、支持多个终端,使用图像识别的话可以一套代码兼容android和ios哦,

    12.4K21

    基于转移学习图像识别

    当然小伙伴们可以训练自己卷积神经网络来对这张图片进行分类,但是通常情况下我们既没有GPU计算能力,也没有时间去训练自己神经网络。...这两层目的是简化寻找特征过程,并减少过度拟合数量。典型CNN架构如下所示: ? 03.训练自己CNN模型 如果我们要使用预训练模型,那么知道什么是卷积层和池化层有什么意义呢?...总结一下,我们需要做包括: 1.选择一个有很多狗狗数据库 2.找到预先训练过模型对狗进行分类(例如VGG16和Resnet50) 3.添加我们自己自定义图层以对狗品种进行分类 用于转移学习自定义层...方法1:具有损失完全连接层 通过完全连接层,所有先前节点(或感知)都连接到该层中所有节点。这种类型体系结构用于典型神经网络体系结构(而不是CNN)。...最重要是,我们花费了很少时间来构建CNN架构,并且使用GPU功能也很少。 使用预先训练模型大大节省我们时间。在此过程中,改进了识别狗狗分类模型。但是,该模型仍然有过拟合趋势。

    1.6K20

    MicroNet通过极低FLOPs实现图像识别(文末获取论文)

    MicroNet基于2个设计原则来处理极低FLOPs: 1、通过降低节点连接性来避免网络宽度减小; 2、通过在每层引入更复杂非线性来补偿网络深度减小。...这里将连接性定义为每个输出节点连接数。因此,连接数量等于输出通道数量和连接乘积。当计算成本固定时,通道数便与连接数发生冲突。...式中, 是 矩阵; shape为 ,channel压缩率为R; shape为 ,扩展返回到C作为输出通道数量。 注意,Group数量不是固定,它与通道数C和减少比R相适应: ?...将得到卷积矩阵W在数学上划分为 块,每个块秩为1。 2)、Micro-Factorized Depthwise卷积 ? 如图所示,将一个 深度卷积核分解成一个 核和一个 核。...请注意,信道数量是通过深度上微分解卷积来扩展,而通过组自适应卷积来压缩

    1.9K20

    基于TensorFlow和Keras图像识别

    简介 TensorFlow和Keras最常见用途之一是图像识别/分类。通过本文,您将了解如何使用Keras达到这一目的。 定义 如果您不了解图像识别的基本概念,将很难完全理解本文内容。...其设计原则旨在用户友好和模块化,尽可能地简化TensorFlow强大功能,在Python下使用无需过多修改和配置 图像识别(分类) 图像识别是指将图像作为输入传入神经网络并输出该图像某类标签。...图像分类子集是对象检测,对象特定实例被识别为某个类如动物,车辆或者人类等。 特征提取 为了实现图像识别/分类,神经网络必须进行特征提取。特征作为数据元素将通过网络进行反馈。...在图像识别的特定场景下,特征是某个对象一组像素,如边缘和角点,网络将通过分析它们来进行模式识别。 特征识别(或特征提取)是从输入图像中拉取相关特征以便分析过程。...许多图像包含相应注解和元数据,有助于神经网络获取相关特征。 神经网络如何学习识别图像 直观地了解神经网络如何识别图像将有助于实现神经网络模型,因此在接下来几节中将简要介绍图像识别过程。

    2.8K20

    图像识别——MNIST

    “深度学习是一个基于赋予大型神经网络多层隐含机器学习领域,以学习具有较强预测能力特征。...尽管深度学习技术是早期神经网络后代,但它们利用无监督和半监督学习,结合复杂优化技术,实现了最新精确度。”...自动编码器通过使用与训练实例和目标标签相同未标记输入来训练。去噪自动编码器是通过随机破坏自编码器输入矩阵来训练。...本文使用NEURAL程序来介绍一下在SAS里如何实现图像识别。例子所用数据集是MNIST数据集,从http://yann.lecun.com/exdb/mnist/可以获取。...训练集 (training set) 由来自 250 个不同人手写0-9数字构成,正确地识别这些手写数字是机器学习研究中一个经典问题。

    5.2K40

    图像识别解释方法视觉演变

    正文字数:4270 阅读时长:7分钟 图像识别(即 对图像中所显示对象进行分类)是计算机视觉中一项核心任务,因为它可以支持各种下游应用程序(自动为照片加标签,为视障人士提供帮助等),并已成为机器学习...他发表过几篇学术论文,并为许多开源项目做出了贡献。你可以在推特上搜索@si3luwa找到他。 在过去十年中,深度学习(DL)算法已成为最具竞争力图像识别算法。...在本文中,我们概述了一些为图像识别而发明解释方法,讨论了它们之间权衡,并提供了一些示例和代码,您可以自己使用Gradio来尝试这些方法。...and Saliency Maps [2013]论文中找到。...集成梯度 integrated gradients [2017] 与此前论文不同,Axiomatic Attribution for Deep Networks [2017]作者从解释理论基础开始

    1.1K30

    图像识别在测试中应用

    但是在实际应用中,无论是web端还是移动端,仍有很多时候需要根据页面内容、页面中图像进行定位及判定,是这些手段所达不到,这里我们来介绍一下关于图像识别在测试中应用。...在具体讲解之前,先介绍一下图像识别在测试中能够想到引用场景: 测试过程中,通过对待测软件进行屏幕截图,采用图像识别算法识别截图中是否包含预定义可操作控件,如果存在,则触发控制指令,也就达到了图像识别引导测试过程目的...- 测试结果验证,通过对待测软件界面进行截图操作,利用图像识别技术将截图与期望结果进行匹配,从而自动获取测试结果。- 通过图像识别对比来进行性能测试,比如app测试中常见响应时间测试。...,有了webdriver等ui自动化后为什么还要用图像识别呢?...2、一些游戏或者一些特殊应用ui控件比较难以识别,然而通过图像识别却可以轻易找到对应元素。 3、代码学习成本比较低,常用函数已经封装完毕,并且简单易懂。

    85320

    图像识别——突破与应用

    1.2 统计 统计数据突出了近年来对图像识别兴趣大增原因。...这是图像识别史上一个转折点,也是这个领域前途光明开始。这个成就将焦点从传统图像识别方法转移到了使用深度神经网络新方法。...图像识别的最新进展将极大地影响所有的商业用途。 4.3 检测事件 图像识别在视觉监控和安全方面有很多应用。视频图像高效处理提供了丰富信息来识别和分类感兴趣事件。...图像识别与虚拟和增强现实进步相结合,将继续为游戏产业带来革命性变化。 4.5 对物体和场景建模 图像识别最重要应用之一将是健康行业医疗和生物医学图像分析。...配备有先进图像识别能力智能移动机器人具有许多商业(例如服务业)和个人用途。最先进图像识别最新应用是协助自动驾驶汽车和汽车驾驶员。

    14.4K113

    基于TencentOS Tiny图像识别案例

    RISC-V芯片应用实例等。...例如:通过CH32V307芯片驱动OV2640摄像头采集指示灯运行状态,后续通过图像识别算法提取颜色特征,并将结果上报到云平台。...近来,在官方例程基础上进行了优化改进,解决了图像识别算法泛化能力差等弊端,具体内容如下所示:硬件 硬件结构极为简单,主要包含主控CH32V307、ESP8266 wifi模块、ST7789...图片优化改进 嵌入式设备应用场景一般较为复杂,很难通过颜色识别算法提取图像全部特征,例如:智能门禁系统中涉及的人脸识别,自动抄表系统涉及文字信息提取等。...因此,近来想要把人工智能算法嵌入到边缘计算端,最终实现云-边-端高效协同,优化嵌入式设备执行速度以及图像识别准确率。

    3K154
    领券