前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >关注度越来越高的行人重识别,有哪些热点?

关注度越来越高的行人重识别,有哪些热点?

作者头像
HyperAI超神经
发布于 2020-09-14 08:09:09
发布于 2020-09-14 08:09:09
2.1K0
举报
文章被收录于专栏:HyperAI超神经HyperAI超神经

By 超神经

内容提要:行人重识别技术,广泛应用于智慧城市、自动驾驶等场景中,近年取得飞速发展。这也得益于训练数据规模的扩大、深度学习的发展。

关键词:行人重识别 数据集 前沿技术

在茫茫人海中,你能不能一眼就找到想找的那个人?

如今,这个任务对于计算机来说,可能是小菜一碟了。而这得益于近年行人重识别技术的飞速发展。

行人重识别(Person Re-identification),也称行人再识别,简称 ReID,是利用计算机视觉技术,判断图像或者视频序列中,是否存在特定行人的技术。直观点来说,就是能够通过穿着、体态、发型等特征,识别出不同场景中的同一个目标人物,因此它也被称作跨境追踪技术。

行人重识别被称为人脸识别之后的「杀手级应用」

行人重识别已经成为人脸识别之后,计算机视觉领域的一个重点研究方向。

尽管人脸识别技术已经十分成熟,但在很多情况下,比如人群密集、或监控摄像头分辨率低、拍摄角度较偏等,人脸常常无法被有效识别。行人重识别便成为了重要补充。

因此,人脸重识别近年来也得到越来越多的关注,其相关应用也日益广泛。

了解一项技术,我们首先要了解它解决的问题是什么,如何取得突破,发展到什么阶段了,又存在哪些挑战。接下来,我们将进行全面解析。

行人重识别用在哪儿?

首先,上文中已提到,行人重识别是人脸识别技术的一个重要补充。

人脸识别的前提是:清晰的正脸照。但在图像只有背面、或其它看不到人脸的角度时,人脸识别便失效了。这时候,行人重识别便可通过姿态、衣着等特征,继续追踪目标人物。

目前,行人重识别技术在安防领域、自动驾驶等领域都有着广泛的应用。比如:

智能安防:警方办案人员能够借助 ReID 帮助快速筛查可疑人员;

智能寻人系统:在人流量较大的场所如机场、火车站,通过 ReID 寻找走失儿童和老人;

智能商业:ReID 可以根据行人外观的照片,实时动态跟踪用户轨迹,以此了解了解用户在商场的兴趣所在,以便优化用户体验;

自动驾驶系统:通过 ReID,能够更好地识别行人,提升自动驾驶安全性。

某安防领域解决方案提供商,借助 ReID 快速寻回走失少年

技术突破的关键:大规模数据集

根据相关研究者总结,实现行人重识别技术,一般需要以下五个步骤:

  1. 数据收集;
  2. 包围框生成;
  3. 训练数据标注
  4. 模型训练;
  5. 行人检索

其中,数据收集作为第一步,是整个行人重识别研究的基础。近年来,行人重识别之所以取得重大突破,离不开大规模数据集的推动与支撑。

本篇将介绍几个行人检测常用数据集,以供大家研究和训练模型。

INRIA Person Dataset 行人检测数据集

INRIA Person 数据集目前是最流行的、使用最多的静态行人检测数据集之一,由 INRIA(法国国家信息与自动化研究所)于 2005 年发布。该数据集用来对图像和视频中的直立行人进行检测。

该数据集包含两类格式的数据。

第一类:原始图像和相应的直立行人标注;

第二类:标准化为 64x128 像素的直立行人正类和对应图片的负类图像。

数据集中每张图片上只标出身高 > 100cm 的直立的人

该数据集基本信息如下:

INRIA Person Dataset

发布机构: INRIA

包含数量:训练集与测试集共 2573 张图像

数据格式:正样本为 .png 格式,负样本为 .jpg 格式

数据大小:969MB

更新时间:2005 年

下载地址:https://hyper.ai/datasets/5331

相关论文:

https://lear.inrialpes.fr/people/triggs/pubs/Dalal-cvpr05.pdf

UCSD Pedestrian 行人视频数据集

UCSD Pedestrian 行人视频数据由加州大学和香港城市大学收集整理,于 2013 年 2 月发布。

该数据集用于运动分割和人群计数。数据集包含了 UCSD(加州大学圣迭戈分校)人行道上行人的视频,均来自一个固定的摄像机。

其中,所有视频为 8 位灰度,尺寸 238×158,10 帧/秒。原始视频是 740×480,30 帧/秒,如果有需求可以提供。

视频目录包含两个场景的视频(分为 vidf 和 vidd 两个目录)。每个场景都在自己的 vidX 目录中,并被分割成一组 .png 片段。

数据集示例

该数据集基本信息如下:

UCSD Pedestrian Dataset

发布机构: UCSD,香港城市大学

包含数量:长度约 10 小时的视频

数据格式:.png

数据大小:vidf:787MB;vidd:672MB

更新时间:2013 年 2 月

下载地址:https://hyper.ai/datasets/9370

相关论文:

http://visal.cs.cityu.edu.hk/static/downloads/crowddoc/README-vids.pdf

Caltech Pedestrian Detection Benchmark

Caltech Pedestrian Detection Benchmark 数据库,由加州理工学院于 2009 年发布,并且每年都持续更新。

该数据库是目前规模较大的行人数据库,包含约 10 个小时的视频,主要由行驶在城市中正常交通环境的车辆的车载摄像头拍摄,视频的分辨率为 640x480,30 帧/秒。

视频中标注了共计约 250000 帧(约 137 分钟),350000 个矩形框,2300 个行人,另外还对矩形框之间的时间对应关系及其遮挡的情况进行标注。

该数据集基本信息如下:

Caltech Pedestrian Dataset

发布机构: 加州理工学院

包含数量:训练集与测试集共2573 张图像

数据格式:.jpg

数据大小:11.12GB

更新时间:2019 年 7 月

下载地址:https://hyper.ai/datasets/5334

相关论文:

http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/files/CVPR09pedestrians.pdf

先进方法有哪些?

行人重识别领域的研究已有近三十年,近年来,该技术得益于数据集的大规模化、深度学习的发展,取得了长足的发展。

我们在此例举两个最新提出的方法,以供大家学习与参考。

消除不同摄像机的风格差异问题

在计算机视觉国际顶会 CVPR 2020 中,中科院发表的论文《Unity Style Transfer for Person Re-Identification》(《行人重识别的一致风格转移》)中,提出了一种 UnityStyle 自适应方法,该方法可以统一不同摄像机之间的风格差异。

论文地址:http://r6a.cn/dbWQ

无论是同一摄像头还是不同摄像头,在拍摄画面时,受时间,光照,天气等影响,都会产生较大的差异,为目标查询带来困难。

为了解决这个问题,研究团队首先创建了 UnityGAN 来学习相机之间的风格变化,为每个相机生成形状稳定的 styleunity 图像,将其称之为 UnityStyle 图像。

同时,他们使用 UnityStyle 图像来消除不同图像之间的风格差异,使得 query(查询目标)和 gallery(图像库)之间更好地匹配。

然后,他们将所提出的方法应用于重新识别模型,期望获得更具有风格鲁棒性的深度特征用于查询。

团队在广泛使用的基准数据集上进行了大量的实验来评估所提框架的性能,实验结果证实了所提模型的优越性。

解决行人遮挡问题

旷视研究院在 CVPR 2020 中发表的论文《High-Order Information Matters: Learning Relation and Topology for Occluded Person Re-Identification》中,解决了该领域中,经常出现也最具挑战性的问题——行人遮挡问题。

论文地址:https://arxiv.org/pdf/2003.08177.pdf

该论文中,旷视研究院提出的框架,包括:

  • 一个一阶语义模块(S),它可以取人体关键点区域的语义特征;
  • 一个高阶关系模块(R),它能对不同语义局部特征之间的关系信息进行建模;
  • 一个高阶人类拓扑模块(T),它可以学习到鲁棒的对齐能力,并预测两幅图像之间的相似性。

这三个模块以端到端的方式进行联合训练。

论文中对高阶信息和拓扑关系的说明

此前,我们还曾在《史上最火 ECCV 已开幕,这些论文都太有意思了》中介绍了,由华中科技大学,中山大学,腾讯优图实验室发表的论文《请别打扰我:在其他行人干扰下的行人重识别》,该论文提出的方法,解决了拥挤场景中、背景行人干扰或人体遮挡造成的错误检索结果问题。感兴趣的同学,可以再次回顾。

热点技术,尚存难点

目前,行人重识别仍然面临不小的挑战,包括数据、效率、性能等方面。

拿数据方面来说,不同场景(如室内和室外)、不同季节风格的变换、不同时间(如白天和晚上)光线差异等,获取的视频数据都会有很大差异,这些都是行人重识别的干扰因素。这些干扰因素不仅影响模型识别准确度,也会影响识别效率。

非可控环境下行人识别存在的难点

因此,尽管在现有应有案例中,我们看到行人重识别甚至已经超过了人类的分辨能力,但仍然有很多问题需要解决。

转至以下链接:https://hyper.ai/datasets,搜索「行人」

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-09-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 HyperAI超神经 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
赞(/≧▽≦/)
赞(/≧▽≦/)
回复回复点赞举报
推荐阅读
大地经纬度坐标与地心地固坐标的的转换
要解决这个问题首先得理解地球椭球这个概念,这里直接用武汉大学《大地测量学基础》(孔详元、郭际明、刘宗全)的解释吧:
charlee44
2021/09/07
3.5K0
坐标系与矩阵(4):球心坐标与NEU坐标系
前三篇介绍了坐标系和矩阵的数学知识,从本篇开始,我们试图运用这些知识来解决实际问题。
Peter Lu
2021/07/20
3.5K0
坐标系与矩阵(4):球心坐标与NEU坐标系
GIS坐标系测绘原理:大地水准面/基准面/参考椭球体/EPSG/SRI/WKT
预热文章系列:《GIS历史概述与WebGis应用开发技术浅解》、《GIS坐标系:WGS84,GCJ02,BD09,火星坐标,大地坐标等解析说与转换》、《OGC标准WMTS服务概念与地图商的瓦片编号流派》、《GIS基础知识 - 坐标系、投影、EPSG:4326、EPSG:3857 》我们过一遍如下概念:
周陆军
2021/07/13
5.2K0
【教程】详解相机模型与坐标转换
由于复制过来,如果有格式问题,推荐大家直接去我原网站上查看: 相机模型与坐标转换 - 生活大爆炸
小锋学长生活大爆炸
2024/05/25
8090
【教程】详解相机模型与坐标转换
地理坐标系与投影坐标系的区别
1、首先理解地理坐标系(Geographic coordinate system),Geographic coordinate system直译为 地理坐标系统,是以经纬度为地图的存储单位的。很明显,Geographic coordinate syst em是球面坐标系统。我们要将地球上的数字化信息存放到球面坐标系统上,如何进行操作 呢?地球是一个不规则的椭球,如何将数据信息以科学的方法存放到椭球上?这必然要求 我们找到这样的一个椭球体。这样的椭球体具有特点:可以量化计算的。具有长半轴,短
用户1075292
2018/01/23
2.2K0
GIS世界里坐标系“黑话”
世界大地测量系统(World geodetic system,简称WGS)是指1960年以来, 由美国国防制图局(DMA)建立的四个世界大地测量系统(WGS60、WGS66、WGS72和WGS84)的统称
追风骚年
2021/11/19
2.4K0
让GIS三维可视化变得简单-地理坐标系统
地理位置也就是坐标说是 GIS 的灵魂不为过吧,像天气预报、火箭发射包括地震、火山等事故发生时,新闻媒体就会说东经 XX 度、北纬 YY 度发生了什么什么,还有高德百度的地图导航、定位等等都需要用到坐标系统,因为没有准确的位置信息就无法表达地物的位置关系,地图查询分析等等也就无从谈起了
isboyjc
2022/03/28
1.1K0
让GIS三维可视化变得简单-地理坐标系统
地心地固坐标系(ECEF)与站心坐标系(ENU)的转换
我在《大地经纬度坐标与地心地固坐标的的转换》这篇文章中已经论述了地心坐标系的概念。我们知道,基于地心坐标系的坐标都是很大的值,这样的值是不太方便进行空间计算的,所以很多时候可以选取一个站心点,将这个很大的值变换成一个较小的值。以图形学的观点来看,地心坐标可以看作是世界坐标,站心坐标可以看作局部坐标。
charlee44
2021/10/13
9K0
让GIS三维可视化变得简单-投影坐标系统
投影坐标系统 PCS(Projection Coordinate System),它也叫非地球投影坐标系统 (notearth),或者再简单点叫平面坐标系统,也就是使用基于 X,Y 值的坐标系统来描述地球上某个点所处的位置
isboyjc
2022/03/28
1.3K0
让GIS三维可视化变得简单-投影坐标系统
地图坐标
1、椭球面 地图坐标系由大地基准面和地图投影确定,大地基准面是利用特定椭球体对特定地区地球表面的逼近,因此每个国家或地区均有各自的大地基准面,我们通常称谓的北京54坐标系、西安80坐标系实际上指的是我国的两个大地基准面。我国参照前苏联从1953年起采用克拉索夫斯基(Krassovsky)椭球体建立了我国的北京54坐标系,1978年采用国际大地测量协会推荐的IAG 75地球椭球体建立了我国新的大地坐标系--西安80坐标系, 目前GPS定位所得出的结果都属于WGS84坐标系统,WGS84基准面采用WGS84
用户1075292
2018/01/23
2.3K0
自动驾驶中的时空坐标系
下面我们介绍自动驾驶技术中几种常用的坐标系统,以及他们之间如何完成关联和转换,最终构建出统一的环境模型。 所谓时空坐标系,包括三维空间坐标系和一维时间坐标系。在此基础上,用解析的形式(坐标)把物体在空间和时间的位置、姿态表示出来。一般三维空间坐标系用三个正交轴X,Y,Z表示物体的位置,用绕这三个正交轴的旋转角度(roll 横滚角, pitch 俯仰角, yaw 偏航角)表示物体的姿态。时间坐标系只有一个维度。为了表述方便,我们一般将空间坐标和时间坐标分开讨论。 摄像机坐标系统 摄像机/摄像头以其低廉的价格、
刘盼
2018/03/16
4.9K0
自动驾驶中的时空坐标系
三重积分中换元法涉及的两个坐标系
在三重积分里面因为多半是一个立体的区域,还有就是这个重积分的换元法,有一种是球面坐标系,里面有几个角度,这里现在辨认一下。
云深无际
2024/11/28
920
三重积分中换元法涉及的两个坐标系
大地经纬度坐标系与Web墨卡托坐标系的转换
我在《大地经纬度坐标与地心地固坐标的的转换》这篇文章中已经论述了大地坐标系/地理坐标系的概念,简单来说就是由经度、纬度以及高程(BLH)确定的坐标系,它是一种曲面坐标。
charlee44
2021/10/26
3.7K0
【Cesium】Cesium坐标转换
4、Cartographic(地理坐标系下经纬度的弧度表示),通常情况下通过它和WGS84坐标系之间互转。
Ning@
2021/11/10
3.1K0
【Cesium】Cesium坐标转换
重新认识ArcGIS中的坐标系
原文链接:http://blog.sciencenet.cn/blog-290812-1016263.html
遥感大数据学习
2022/09/20
2.1K0
重新认识ArcGIS中的坐标系
RTKLIB源码解析(一)——单点定位(pntpos.c)
RTKLIB源码解析(一)——单点定位(pntpos.c) 标签: GNSS RTKLIB 单点定位 前段时间一直忙着写毕业论文,所以也没有太多时间来阅读 RTKLIB源码,最近好歹把 pntpos中的相关代码看了一遍,知道了 RTKLIB是如何实现单点伪距定位的。这里把每一个函数都做成了小卡片的形式,每个函数大都包含函数签名、所在文件、功能说明、参数说明、处理过程、注意事项和我的疑惑这几个部分,介绍了阅读代码时我自己的看法和疑惑。所以希望诸位看官能帮忙解答我的疑惑,与我交流,也希望能帮助后来也有需要阅读
用户1653704
2018/07/05
1.6K0
(数据科学学习手札75)基于geopandas的空间数据分析——坐标参考系篇
  在上一篇文章中我们对geopandas中的数据结构展开了较为全面的学习,其中涉及到面积长度等计算的过程中提到了具体的计算结果与所选择的投影坐标系关系密切,投影坐标系选择的不恰当会带来计算结果的偏差,直接关乎整个分析过程的有效与否。
Feffery
2020/02/19
1.7K0
大地高、正常高、正高
大地水准面是最接近地球整体形状的重力位水准面,也是正高系统的高程基准面。由静止海水面并向大陆延伸所形成的不规则的封闭曲面。它是重力等位面,即物体沿该面运动时,重力不做功(如水在这个面上是不会流动的)。大地水准面是指与全球平均海平面(或静止海水面)相重合的水准面。大地水准面是描述地球形状的一个重要物理参考面,也是海拔高程系统的起算面。大地水准面的确定是通过确定它与参考椭球面的间距-大地水准面差距(对于似大地水准面而言,则称为高程异常)来实现的。
为为为什么
2024/07/18
3410
大地高、正常高、正高
【森城市】GIS数据漫谈(四)— 坐标系统
地球表面并不是一个标准的正球体,根据2020年的测量成果,珠穆朗玛峰高程为8848.86m,而地球上最深的海沟——马里亚纳海沟深度为11034 m。两者相差了将近 20 km!由于地球的自然表面凹凸不平,形态复杂,显然不能作为测量的基准面。所以人们开始寻求一种与地球自然表面接近的规则曲面来代替不规则的地球表面。地球表面积中海洋面积约占71%,陆地面积仅占29%。于是利用水准面表示地球的物理表面,简单说就是假设有一个静止的海水面(一个无波浪、无潮汐、无水流、无大气压变化,处于流体平衡状态的静止海平面),向陆地延伸形成的一个封闭曲面来表示地球的物理表面。
thingjs
2022/07/15
7700
【森城市】GIS数据漫谈(四)— 坐标系统
6_工作台坐标系理论_向量叉积_1
向量叉积(Cross product)又译为交叉积(交叉积的名称来自于其运算规则,因为两个向量作叉积运算时,是把向量的元素交叉相乘;当然其计算符号a×b刚好也是叉叉),也可称为外积,因为叉积会产生新的一维向量。两个向量确定了一个二维的平面,叉积又会产生垂直于这个平面的向量。
用户5908113
2024/06/18
1370
6_工作台坐标系理论_向量叉积_1
相关推荐
大地经纬度坐标与地心地固坐标的的转换
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档