前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >图像自适应YOLO:恶劣天气下的目标检测

图像自适应YOLO:恶劣天气下的目标检测

作者头像
计算机视觉研究院
发布于 2022-01-27 12:47:44
发布于 2022-01-27 12:47:44
2K0
举报

计算机视觉研究院专栏

作者:Edison_G

最近开车发现雾天和晚上视线不是很清楚,让我联想到计算机视觉领域,是不是也是因为这种环境情况,导致最终的模型检测效果不好。最近正好看了一篇文章,说恶劣天气下的目标检测,接下来我们一起深入了解下。

一、前言

尽管基于深度学习的目标检测方法在传统数据集上取得了可喜的结果,但从恶劣天气条件下捕获的低质量图像中定位目标仍然具有挑战性。现有方法要么难以平衡图像增强和目标检测的任务,要么经常忽略对检测有益的潜在信息。

为了缓解这个问题,有研究者提出了一种新颖的图像自适应YOLO (IA-YOLO) 框架,其中每个图像都可以自适应增强以获得更好的检测性能。

二、背景及相关目标检测回顾

基于CNN的方法已在目标检测中盛行。它们不仅在基准数据集上取得了可喜的性能,而且还被部署在自动驾驶等实际应用中。由于输入图像的域偏移,由高质量图像训练的一般目标检测模型在恶劣的天气条件下(例如,有雾和暗光)往往无法获得令人满意的结果。Narasimhan和Nayar以及You等人提出在恶劣天气下拍摄的图像可以分解为干净的图像及其对应的天气信息,而恶劣天气下的图像质量下降主要是由于天气信息和物体之间的相互作用造成的,这导致检测性能差。

上图显示了雾天条件下目标检测的示例。可以看出,如果图像可以根据天气状况进行适当的增强,则可以恢复更多有关原始模糊目标和错误识别目标的潜在信息。

为了解决这个具有挑战性的问题,Huang、Le和Jaw(DSNet: Joint semantic learning for object detection in inclement weather conditions)采用了两个子网络来联合学习可见性增强和目标检测,其中通过共享特征提取层来减少图像退化的影响。然而,在训练期间很难调整参数以平衡检测和恢复之间的权重。另一种方法是通过使用图像去雾(Multi-Scale Boosted Dehazing Network with Dense Feature FusionGridDehazeNet: Attention-Based Multi-Scale Network for Image Dehazing)和图像增强(Zero-reference deep curve estimation for low-light image enhancement)等现有方法对图像进行预处理来淡化天气特定信息的影响。然而,这些方法必须包含复杂的图像恢复网络,需要在像素级监督下单独训练。这需要手动标记要恢复的图像。这个问题也可以被视为无监督的domain adaptation任务。与具有清晰图像(源图像)的训练检测器相比,假设在恶劣天气下捕获的图像(目标图像)具有分布偏移。这些方法大多采用domain adaptation原则,侧重于对齐两个分布的特征,而通常忽略了基于天气的图像恢复过程中可以获得的潜在信息。

·亮点

具体来说,研究者提出了一个可微分图像处理 (DIP) 模块来考虑YOLO检测器的不利天气条件,其参数由小型卷积神经网络(CNN-PP)预测。以端到端的方式联合学习CNN-PP和YOLOv3,这确保了CNN-PP可以学习适当的DIP,以弱监督的方式增强图像以进行检测。提出的IA-YOLO方法可以在正常和不利的天气条件下自适应地处理图像。实验结果非常令人振奋,证明了提出的IA-YOLO方法在有雾和弱光场景中的有效性。

三、新框架分析

接下来我们直接开始分析新框架。

在恶劣天气条件下拍摄的图像,由于天气特定信息的干扰,导致目标检测困难。为了应对这一挑战,研究者建议通过删除特定天气信息并揭示更多潜在信息来构建图像自适应检测框架。如上图所示,整个pipeline由基于CNN的参数预测器(CNNPP)、可微分图像处理模块(DIP)和检测网络组成。

首先将输入图像resize为256×256的大小,并将其输入CNN-PP以预测DIP的参数。然后,将DIP模块过滤后的图像作为YOLOv3检测器的输入。提出了一种具有检测损失的端到端混合数据训练方案,以便CNN-PP可以学习适当的DIP以弱监督的方式增强图像以进行目标检测。

DIP Module

对于CNN-PP基于梯度的优化,过滤器应该是可微的,以允许通过反向传播来训练网络。由于CNN在处理高分辨率图像(例如4000×3000)时会消耗大量的计算资源,研究者从下采样的256×256大小的低分辨率图像中学习滤波器参数,然后将相同的滤波器应用于原始分辨率的图像。因此,这些过滤器需要独立于图像分辨率。

新提出的DIP模块由六个具有可调超参数的可微滤波器组成,包括去雾、白平衡 (WB)、Gamma、对比度、色调和锐化。例如WB、Gamma、对比度和色调,可以表示为逐像素过滤器。因此,研究者设计的过滤器可以分为去雾、像素过滤和锐化。在这些滤镜中,Defog滤镜是专门为有雾场景设计的。

CNN-PP Module

在图像信号处理 (ISP) pipeline中,通常采用一些可调滤波器来增强图像,其超参数由经验丰富的工程师通过visual inspection手动调整。通常,这样的调整过程对于为广泛的场景找到合适的参数是非常笨拙和昂贵的。为了解决这个限制,研究者建议使用一个小的CNN作为参数预测器来估计超参数,这是非常有效的。

Detection Network Module

最终选择one-stage检测器YOLOv3作为检测网络,它广泛用于实际应用,包括图像编辑、安全监控、人群检测和自动驾驶。它通过对多尺度特征图进行预测来实现多尺度训练,从而进一步提高检测精度,尤其是对于小物体。 采用与原始YOLOv3相同的网络架构和损失函数。

四、实验及可视化 整个算法流程可以总结为如下伪代码:

实验1

Performance comparison on foggy images

YOLOv3和IA-YOLO比较

实验2

Performance comparison on low-light images

实验3

Detection results by different methods on real-world RTTS foggy images

实验4

Detection results of different methods on synthetic VOC_Dark_test images

Efficiency analysis on the compared methods

© The Ending

转载请联系本公众号获得授权

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-12-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉战队 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
人员定位系统人员聚集风险监测预警功能为企业安全生产保驾护航!
近年来,因人员聚集而导致重大伤亡的事故时有发生,对此,国家高度重视。2023年10月,应急管理部印发《基于人员定位系统的人员聚集风险监测预警建设应用指南(试行)》,要求危化企业在建设人员定位系统基础上,对照指南要求,进一步提升人员定位精度,开发聚集预警模型算法,强化人员聚集风险管控,持续优化升级安全风险智能化管控平台相关模块,切实防控高危区域现场人员聚集风险。
新锐科创
2023/11/21
1.5K0
人员定位系统人员聚集风险监测预警功能为企业安全生产保驾护航!
GNSS RTK实时差分人员定位系统组成部分包括哪些?答案在这里
RTK(Real-Time Kinematic)即实时动态载波相位差分技术,GNSS RTK实时差分人员定位系统是一种广泛应用于各个领域、具有高精度实时定位功能的技术。该系统通过将全球卫星导航系统(GNSS)与无线通信技术相结合,实现对人员的精准定位。RTK实时差分人员定位系统由多个组件组成,包括卫星信号接收器(移动定位终端)、RTK差分基站、无线通信网络、服务器、后台管理系统等。
新锐科创
2023/07/28
7020
GNSS RTK实时差分人员定位系统组成部分包括哪些?答案在这里
室内外融合人员定位技术:提供全面而精确的定位服务
室内外融合人员定位是一项先进的技术,它能够准确地确定人员在室内和室外的位置。在过去,室内定位技术和室外定位技术是分别独立开发的,它们在特定环境中具有一定的优势,但无法实现全面的人员定位。然而,随着室内外融合人员定位技术的出现,这一问题得到了有效解决。
新锐科创
2023/06/05
7300
室内外融合人员定位技术:提供全面而精确的定位服务
北斗RTK差分定位原理、优势及应用领域
北斗卫星导航系统是中国自主建设的卫星导航系统,是继美国GPS、俄罗斯GLONASS和欧盟Galileo之后,全球第四个卫星导航系统。北斗系统非常重要,可用于国防、公共安全、民生等多个领域,包括交通运输、环境保护、渔业等。差分定位则是北斗系统中的一项重要功能,利用多个接收机来计算出相邻接收机之间的相对位置,以达到精确定位的目的。本文将介绍北斗RTK差分定位的原理以及在实际应用中的优势。
新锐科创
2023/05/31
2.1K0
北斗RTK差分定位原理、优势及应用领域
人员定位系统的功能及在不同领域的应用
人员定位系统是实时定位系统(RTLS)的一种,是用于跟踪人员位置的软硬件一体化系统。它使用无线通信技术和传感器来获取位置数据,并将其发送到监控中心或移动设备。它在多个领域使用,包括工业、医疗保健、军事、物流等。下面我们将讨论人员定位系统的功能及在不同领域的应用。
新锐科创
2023/05/31
5420
人员定位系统的功能及在不同领域的应用
4G+蓝牙+Lora融合定位在隧道中的应用
针对隧道定位痛点,新锐科创推出了4G+蓝牙+LoRa融合定位系统方案。该系统将4G的高速传输、蓝牙的高精度短距离定位以及LoRa的长距离低功耗传输优势相结合,为隧道提供了全面、精准、稳定的定位服务。
新锐科创
2025/03/19
1220
4G+蓝牙+Lora融合定位在隧道中的应用
@化工人|人员定位系统如何选择?从了解定位技术开始
伴随着科技日益发展,越来越多的化工企业选择建设以人员定位系统为核心的企业安全生产信息化管理平台,想要选择合适的人员定位系统也需从先了解人员定位技术开始。
新锐科创
2024/07/05
1820
@化工人|人员定位系统如何选择?从了解定位技术开始
BVS智能视频分析-智慧养老系统
据不完全统计,仅2017年,国家层面就有《智慧健康养老产业发展行动计划(2017-2020年)》《关于开展智慧健康养老应用试点示范的通知》等通知出台,鼓励智能产品适老化发展,鼓励开发面向老年人的健康管理类智能设备的内容。
倍特威视
2020/05/09
9580
BVS智能视频分析-智慧养老系统
NB-IoT+蓝牙+RTK人员定位方案的优势
随着人员定位技术的发展,融合定位技术开始出现。融合定位技术方案有很多种,不同的方案具有不同的优势,下面给大家介绍NB-IoT+蓝牙+RTK人员定位方案的优势。
新锐科创
2023/06/08
3530
NB-IoT+蓝牙+RTK人员定位方案的优势
智慧工地 AI 算法方案
用户11003665
2024/11/23
2950
智慧工地 AI 算法方案
「互联网+护理」最新行业政策解读
国家卫健委有关负责人指出,据国家统计局统计,截至2017年底,我国60岁及以上人口数为2.4亿人,占总人口的17.3%。我国患有慢性病的老年人有1.5亿人,占老年人总数的65%,失能、半失能的老年人4000万人左右。
齿轮易创说互联网
2019/03/15
1.5K0
「互联网+护理」最新行业政策解读
物联网(IoT)在企业应用中的三个例子
通过将物联网(IoT)设备集成到当前的IT基础设施中,企业能有良好的收益。而一旦通过设备捕获数据,并且分析和处理数据,才会发现物联网(IoT)的真正价值和影响。
无邪
2018/05/07
2.7K0
【极视角】315最强AI督查官上线ing!
3月的重头戏,一是妇女平权节,一是315打假日。前一个让世界认真聆听女性的声音,后一个则一次性给足了社会百姓全年的吃瓜量,从消费民生到媒体谣言,堪堪组成了个大型扒马甲现场。
极视角科技
2019/03/20
1K0
【极视角】315最强AI督查官上线ing!
石油开发企业部署人员定位系统的必要性及方案解析
石油开发企业作为危化行业的重要组成部分,作业环境的复杂性与危险性并存,使得人员定位管理成为企业运营管理中的关键难题。在当前科技不断进步的背景下,众多企业逐步意识到部署人员定位系统的重要性,对于石油开发企业而言,这更是一项具有战略意义的举措。本文将以RTK +蓝牙+ 4G融合定位系统为范例,深入阐释石油开发企业部署人员定位系统的必要性及该系统的卓越性能。
新锐科创
2025/03/24
220
石油开发企业部署人员定位系统的必要性及方案解析
有哪些主流的人员定位技术?答案在这里
人员定位技术是指一种用于确定一个或多个人员位置的技术方法。随着智能化、物联网等技术的不断发展,人员定位技术也越来越成熟和广泛应用。目前,常见的人员定位技术主要有以下几种:
新锐科创
2023/06/21
6440
有哪些主流的人员定位技术?答案在这里
RTK+UWB+蓝牙+4G融合定位在物业管理中的应用
针对物业管理人员定位痛点,新锐科创提出了北斗RTK+UWB+蓝牙+4G融合技术方案。该方案将四种定位技术有机结合,实现了室内外无缝高精度定位,为综合管廊人员定位提供了强有力的技术支持。
新锐科创
2025/03/20
440
RTK+UWB+蓝牙+4G融合定位在物业管理中的应用
【愚公系列】《工业数字孪生与企业应用实践》024-数字孪生在智慧工厂中的应用场景
随着工业4.0时代的到来,数字化转型已成为制造业发展的必然趋势。在这一进程中,数字孪生技术作为一种前沿的创新理念,正逐渐成为智慧工厂的重要组成部分。数字孪生通过创建物理实体的虚拟模型,使得企业能够实现实时监控、分析与优化,从而在生产效率、资源管理和决策支持等方面带来显著提升。
愚公搬代码
2025/02/09
1940
M91A安全帽识别布控球 安全帽穿戴AI视频分析功能
AI布控球基于前端边缘AI计算及后端云平台计算,AI布控球集成人脸识别、安全帽识别等的AI视频图像分析算法,通过计算机视觉技术对图像、人脸、场景、视频等进行深度学习,识别并标示图像、场景、视频内容,并对自定义的行为、意图进行识别并预警。 AI识别能力介绍: 着装检测:针对施工区域的人员是否戴安全帽。 人脸检测:针对施工区域的人员是否陌生人(黑名单)。 行为检测:针对施工区域内人员是否吸烟。 区域检测:针对规定的区域划线后检测是否在区域内或区域外。
全栈程序员站长
2022/08/30
2.1K0
M91A安全帽识别布控球 安全帽穿戴AI视频分析功能
洞察|大数据渗透到各行各业,融入教育或将取代高考
大数据的研究应用,到底与普通老百姓有多大关系?普通人能享受到多少大数据带来的便捷服务?在11月17日-18日的2016全球大数据应用研究论坛的分论坛上,“大咖”们描绘出我们眼前正在享受及未来将会享受到
灯塔大数据
2018/04/08
1.1K0
洞察|大数据渗透到各行各业,融入教育或将取代高考
GPS/北斗RTK差分定位系统的原理以及应用领域
导语:现代定位技术在国内外的发展与应用越来越广泛,其中GPS和北斗是两大被广泛使用的全球卫星定位系统。本文将介绍GPS/北斗RTK差分定位系统的原理以及其在各个领域的应用。
新锐科创
2023/08/04
1.1K0
GPS/北斗RTK差分定位系统的原理以及应用领域
推荐阅读
相关推荐
人员定位系统人员聚集风险监测预警功能为企业安全生产保驾护航!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档