首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Self-Supervision & Meta-Learning for One-ShotUnsupervised Cross-Domain Detection

    深度检测模型在受控环境下非常强大,但在不可见的领域应用时却显得脆弱和失败。 所有改进该问题的自适应方法都是在训练时获取大量的目标样本,这种策略不适用于目标未知和数据无法提前获得的情况。 例如,考虑监控来自社交媒体的图像源的任务:由于每一张图像都是由不同的用户上传的,它属于不同的目标领域,这在训练期间是不可能预见到的。 我们的工作解决了这一设置,提出了一个目标检测算法,能够执行无监督适应跨领域,只使用一个目标样本,在测试时间。 我们引入了一个多任务体系结构,它通过迭代地解决一个自我监督的任务,一次性适应任何传入的样本。 我们进一步利用元学习模拟单样本跨域学习集,更好地匹配测试条件。 此外,交叉任务的伪标记程序允许聚焦于图像前景,增强了自适应过程。 对最新的跨域检测方法的全面基准分析和详细的消融研究显示了我们的方法的优势。

    02

    [强基固本-视频压缩] 第十章:上下文自适应二进制算术编码 第五部分

    现在我们对算术编解码算法进行了简要的分析,并讨论了将编码流中描述视频帧内容的语法元素的值转换为二进制 bin 流的过程,这才是实际进行二进制算术的过程编码。然而,有一些重要的事情我们还没有讨论。首先,在迄今为止所考虑的算法中,编码和解码都是通过分割当前区间来完成的。区间长度始终小于 1,因此必须使用非整数算术执行计算。其次,编码和解码需要有关被编码符号出现概率的信息,即最不可能出现的符号 的概率 以及该符号的值。编码器和解码器从哪里获取这些信息?最后,我们仍然没有解决 CABAC 术语中“上下文自适应”的实际含义。现在让我们来解决这些剩下的问题。

    01

    人员聚众监控视频分析检测系统

    人员聚众监控视频分析检测系统通过python+yolov5深度网络模型技术,人员聚众监控视频分析检测算法对现场监控画面中人员异常聚众时,不需人为干预人员聚众监控视频分析检测算法提醒后台值班人员及时去处理、避免发生更大的不可控的局面。Python是一种由Guido van Rossum开发的通用编程语言,它很快就变得非常流行,主要是因为它的简单性和代码可读性。它使程序员能够用更少的代码行表达思想,而不会降低可读性。与C / C++等语言相比,Python速度较慢。也就是说,Python可以使用C / C++轻松扩展,这使我们可以在C / C++中编写计算密集型代码,并创建可用作Python模块的Python包装器。这给我们带来了两个好处:首先,代码与原始C / C++代码一样快(因为它是在后台工作的实际C++代码),其次,在Python中编写代码比使用C / C++更容易。OpenCV-Python是原始OpenCV C++实现的Python包装器。

    04

    渣土车智能识别系统

    渣土车智能识别系统通过yolov5网络模型深度学习技术,渣土车智能识别系统对禁止渣土车通行现场画面中含有渣土车时进行自动识别监测,渣土车智能识别系统并自动抓拍告警。YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。主要的改进思路如下所示:输入端,在模型训练阶段,提出了一些改进思路,主要包括Mosaic数据增强、自适应锚框计算、自适应图片缩放;Mosaic数据增强:Mosaic数据增强的作者也是来自YOLOv5团队的成员,通过随机缩放、随机裁剪、随机排布的方式进行拼接,对小目标的检测效果很不错。

    03

    工人规范操作识别检测 yolov5

    工人规范操作识别检测通过yolov5+python网络模型技术,工人规范操作识别检测对工人的操作进行实时监测,当工人规范操作识别系统检测到工人操作不符合规范时,将自动发出警报提示相关人员采取措施。行为检测合规算法中应用到的YOLOv5中在训练模型阶段仍然使用了Mosaic数据增强方法,该算法是在CutMix数据增强方法的基础上改进而来的。CutMix仅仅利用了两张图片进行拼接,而Mosaic数据增强方法则采用了4张图片,并且按照随机缩放、随机裁剪和随机排布的方式进行拼接而成。这种增强方法可以将几张图片组合成一张,这样不仅可以丰富数据集的同时极大的提升网络的训练速度,而且可以降低模型的内存需求。

    02

    EagleEye: Fast Sub-net Evaluation for Efficient Neural Network Pruning(论文阅读)[通俗易懂]

    找出训练好的深度神经网络(DNN)的计算冗余部分是剪枝算法要解决的关键问题。许多算法都试图通过引入各种评估方法来预测修剪后的子网的模型性能 。在这个工作中,我们提出了一种称为EagleEye的剪枝方法,其中使用了一个基于自适应批归一化adaptive batch normalization 的简单而有效的评估组件,以揭示不同的修剪DNN结构与其最终确定精度之间的强相关性。这种强相关性使我们能够以最高的潜在准确率快速发现修剪后的候选对象,而无需实际对它们进行微调。该模块对一些已有的剪枝算法也具有通用性,便于插件化和改进。在我们的实验中,EagleEye获得了比所有研究的剪枝算法都要好的剪枝性能。具体而言,要修剪MobileNet V1和ResNet-50,EagleEye的性能要比所有比较方法高出 3.8 % 3.8% 3.8%。即使在更具挑战性的修剪MobileNet V1紧凑模型的实验中,EagleEye修剪了50%的操作(FLOP),可达到70.9%的精度。所有精度结果均为Top-1 ImageNet分类精度。

    01

    Texture Underfitting for Domain Adaptation

    全面的语义分割是鲁棒场景理解的关键组成部分之一,也是实现自动驾驶的要求。在大规模数据集的驱动下,卷积神经网络在这项任务上表现出了令人印象深刻的结果。然而,推广到各种场景和条件的分割算法需要极其多样化的数据集,这使得劳动密集型的数据采集和标记过程过于昂贵。在分割图之间结构相似的假设下,领域自适应有望通过将知识从现有的、潜在的模拟数据集转移到不存在监督的新环境来解决这一挑战。虽然这种方法的性能取决于神经网络学习对场景结构的高级理解这一概念,但最近的工作表明,神经网络倾向于过度适应纹理,而不是学习结构和形状信息。 考虑到语义分割的基本思想,我们使用随机图像风格化来增强训练数据集,并提出了一种有助于纹理适配的训练程序,以提高领域自适应的性能。在使用有监督和无监督方法进行合成到实域自适应任务的实验中,我们表明我们的方法优于传统的训练方法。

    02

    视频监控边缘分析盒

    视频监控边缘分析盒通过计算机视觉深度学习+边缘计算视频监控分析技术,共同构成了基于边缘计算分析的视频图像识别技术。视频监控边缘分析盒通过对现场多路监控视频图像进行预处理,提高视频分析的速度。视频监控边缘分析盒可以应用于加油站智能视频分析、明厨亮灶视频监控智能分析、工地监控分析、城管视频监控分析、工厂视频监控智能分析、煤矿监控视频分析等场景。YOLO不会在输入图像中搜索可能包含对象的感兴趣区域,而是将图像分割成单元格,通常是19×19网格。每个细胞负责预测K个包围框。具有最大概率的类被选择并分配给特定的网格单元。类似的过程发生在图像中的所有网格单元格上。

    03
    领券