论文地址:https://arxiv.org/pdf/2201.03243v1.pdf
计算机视觉研究院专栏
作者:Edison_G
一种改进且高效的基于深度学习的自主系统,该系统可以高精度地检测和跟踪非常小的无人机。 整体的介绍都比较基础简单,初学者可以简单了解!
一、前言
如今,无人机等被广泛用于各种用途,例如从航空图像中捕获和目标检测等。这些小型ariel车辆轻松进入公众可能会造成严重的安全威胁。例如,关键地点可能会被混入公共场所的间谍使用无人机监控。
Study in hand提出了一种改进且高效的基于深度学习的自主系统,该系统可以高精度地检测和跟踪非常小的无人机。所提出的系统由一个定制的深度学习模型“Tiny YOLOv3”组成,这是一种非常快速的目标检测模型“You Look Only Once”(YOLO)被构建并用于检测。目标检测算法将有效地检测无人机。与之前的YOLO版本相比,所提出的架构显示出明显更好的性能。在资源使用和时间复杂度方面得到了改进。
二、背景
随着世界在融合最新技术的同时不断进步,安全系统也在快速发展,以利用创新的力量来应对可能出现的任何安全威胁。在过去的几年里,无人机的使用量急剧增加,包括对公众的可及性,这进一步增加了其使用量。随着无人机使用量的增加,安全威胁也随之增加。我们已经看到了一些无人机飞越不同建筑物的事件,包括一些需要安全的敏感区域。
无人机还提出了许多威胁,包括无人机被用作毒品走私工具、入侵无人机导致它们爆炸或使用它们窃取敏感信息,无人机还被用于进行非法监视,造成安全和隐私威胁。这些事件对安全和隐私构成了巨大威胁。因此,解决这些安全问题的方法是检测和跟踪这些无人机,以便采取反制技术来阻止这些无人机,以确保安全和隐私。
此外,大多数安全或防御系统都具有检测可能发生的威胁程度的能力,但是,很少有人能够深入分析威胁。随着机器学习和人工智能的进步,通过减少人为干预使此类系统变得智能化,有效的目标检测可以帮助提高安全系统的效率并执行更好的分析。
三、新框架分析
前期主要介绍了深度学习的一些基础知识:
Image matrix convolution operation with multiplies filter matrix
Convolution with 3 x3 filter using Stride 2
ReLU operation
Max-Pooling
Fully Connected Layer
如上展示,尽管Tiny YOLOv3比YOLOv3快得多,但它因为它在2个尺度上执行检测,并没有提供更好的准确度。
为了更好地实现准确性,研究者引入了一个修改后的Tiny YOLOv3架构。该架构总共包括31层:16个卷积层,3个检测层,其余是用最大池化和ReLU层。以前的YOLOV3微型架构由总共24层组成,其中包括13个卷积层、3个检测层。
研究者修改了Tiny YOLOv3架构,通过使用前几层的ReLU层提取特征,将在三个尺度上进行检测。这意味着3个yolo层将负责检测对象。锚框用于计算预测边界框的宽度和高度。通常,YOLOv3为每个单元使用3个锚点,这些锚点预测三个边界框,总共9个锚点框。对于研究者的自定义目标检测器,总共使用了6个锚框。
预测特征图将分别为3个尺度上的13x13、26x26和52x52。随着网络向前传播图像,在第一个yolo层,得到一个13x13的输出特征图。在放置第一个yolo层之后,对下一层进行了两倍的采样,然后将具有相似大小的前一层的特征图连接起来。对于第二个yolo层,得到26x26的输出特征图,在第三个yolo层,得到一个52x52的特征图。这种架构比原始的yolov3架构更简洁、更小,后者在3个尺度上进行检测。此外,研究者的小而轻的架构可以检测具有高置信度分数的小物体。
四、实验
Results Evaluated
AVG FPS
© The Ending