Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略

Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略

作者头像
全栈程序员站长
发布于 2022-11-02 02:15:02
发布于 2022-11-02 02:15:02
25.7K0
举报

Dataset之COCO数据集:COCO数据集的简介、安装、使用方法之详细攻略

目录

COCO数据集的简介

0、COCO数据集的80个类别—YoloV3算法采用的数据集

1、COCO数据集的意义

2、COCO数据集的特点

3、数据集的大小和版本

COCO数据集的下载

1、2014年数据集的下载

2、2017的数据集的下载

COCO数据集的使用方法

1、基础用法


COCO数据集的简介

MS COCO的全称是Microsoft Common Objects in Context,起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。 COCO数据集是一个大型的、丰富的物体检测,分割和字幕数据集。这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,000影像和2,500,000个label。目前为止有语义分割的最大数据集,提供的类别有80 类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。

官网地址http://cocodataset.org

0、COCO数据集的80个类别—YoloV3算法采用的数据集

person(人) bicycle(自行车) car(汽车) motorbike(摩托车) aeroplane(飞机) bus(公共汽车) train(火车) truck(卡车) boat(船) traffic light(信号灯) fire hydrant(消防栓) stop sign(停车标志) parking meter(停车计费器) bench(长凳) bird(鸟) cat(猫) dog(狗) horse(马) sheep(羊) cow(牛) elephant(大象) bear(熊) zebra(斑马) giraffe(长颈鹿) backpack(背包) umbrella(雨伞) handbag(手提包) tie(领带) suitcase(手提箱) frisbee(飞盘) skis(滑雪板双脚) snowboard(滑雪板) sports ball(运动球) kite(风筝) baseball bat(棒球棒) baseball glove(棒球手套) skateboard(滑板) surfboard(冲浪板) tennis racket(网球拍) bottle(瓶子) wine glass(高脚杯) cup(茶杯) fork(叉子) knife(刀) spoon(勺子) bowl(碗) banana(香蕉) apple(苹果) sandwich(三明治) orange(橘子) broccoli(西兰花) carrot(胡萝卜) hot dog(热狗) pizza(披萨) donut(甜甜圈) cake(蛋糕) chair(椅子) sofa(沙发) pottedplant(盆栽植物) bed(床) diningtable(餐桌) toilet(厕所) tvmonitor(电视机) laptop(笔记本) mouse(鼠标) remote(遥控器) keyboard(键盘) cell phone(电话) microwave(微波炉) oven(烤箱) toaster(烤面包器) sink(水槽) refrigerator(冰箱) book(书) clock(闹钟) vase(花瓶) scissors(剪刀) teddy bear(泰迪熊) hair drier(吹风机) toothbrush(牙刷)

1、COCO数据集的意义

MS COCO的全称是Microsoft Common Objects in Context,起源于是微软于2014年出资标注的Microsoft COCO数据集,与ImageNet 竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。 当在ImageNet竞赛停办后,COCO竞赛就成为是当前目标识别、检测等领域的一个最权威、最重要的标杆,也是目前该领域在国际上唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀创新企业共同参与的大赛。 该数据集主要解决3个问题:目标检测,目标之间的上下文关系,目标的2维上的精确定位。COCO数据集有91类,虽然比ImageNet和SUN类别少,但是每一类的图像多,这有利于获得更多的每类中位于某种特定场景的能力,对比PASCAL VOC,其有更多类和图像。

1、COCO目标检测挑战

  • COCO数据集包含20万个图像;
  • 80个类别中有超过50万个目标标注,它是最广泛公开的目标检测数据库
  • 平均每个图像的目标数为7.2,这些是目标检测挑战的著名数据集。

2、COCO数据集的特点

COCO is a large-scale object detection, segmentation, and captioning dataset. COCO has several features:

Object segmentation Recognition in context Superpixel stuff segmentation 330K images (>200K labeled) 1.5 million object instances 80 object categories 91 stuff categories 5 captions per image 250,000 people with keypoints

对象分割; 在上下文中可识别; 超像素分割; 330K图像(> 200K标记); 150万个对象实例; 80个对象类别; 91个类别; 每张图片5个字幕; 有关键点的250,000人;

  • Object segmentation
  • Recognition in context
  • Superpixel stuff segmentation
  • 330K images (>200K labeled)
  • 1.5 million object instances
  • 80 object categories
  • 91 stuff categories
  • 5 captions per image
  • 250,000 people with keypoints
  1. 对象分割;
  2. 在上下文中可识别;
  3. 超像素分割;
  4. 330K图像(> 200K标记);
  5. 150万个对象实例;
  6. 80个对象类别;
  7. 91个类别;
  8. 每张图片5个字幕;
  9. 有关键点的250,000人;

3、数据集的大小和版本

大小:25 GB(压缩) 记录数量: 330K图像、80个对象类别、每幅图像有5个标签、25万个关键点。 COCO数据集分两部分发布,前部分于2014年发布,后部分于2015年,2014年版本:82,783 training, 40,504 validation, and 40,775 testing images,有270k的segmented people和886k的segmented object;2015年版本:165,482 train, 81,208 val, and 81,434 test images。 (1)、2014年版本的数据,一共有20G左右的图片和500M左右的标签文件。标签文件标记了每个segmentation的像素精确位置+bounding box的精确坐标,其精度均为小数点后两位。

COCO数据集的下载

官网地址:http://cocodataset.org/#download

1、2014年数据集的下载

train2014:http://images.cocodataset.org/zips/train2014.zip val2014:http://images.cocodataset.org/zips/val2014.zip

http://msvocds.blob.core.windows.net/coco2014/train2014.zip

2、2017的数据集的下载

http://images.cocodataset.org/zips/train2017.zip http://images.cocodataset.org/annotations/annotations_trainval2017.zip

http://images.cocodataset.org/zips/val2017.zip http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip

http://images.cocodataset.org/zips/test2017.zip http://images.cocodataset.org/annotations/image_info_test2017.zip

train2017

train2017:http://images.cocodataset.org/zips/train2017.zip train2017 annotations:http://images.cocodataset.org/annotations/annotations_trainval2017.zip

val2017

val2017:http://images.cocodataset.org/zips/val2017.zip val2017 annotations:http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip

test2017

test2017:http://images.cocodataset.org/zips/test2017.zip test2017 info:http://images.cocodataset.org/annotations/image_info_test2017.zip

COCO数据集的使用方法

1、基础用法

(1)、Download Images and Annotations from [MSCOCO]

后期更新……

(2)、Get the coco code

后期更新……

(3)、Build the coco code

后期更新……

(4)、Split the annotation to many files per image and get the image size info

后期更新……

(5)、 Create the LMDB file

后期更新……

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/181032.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年10月17日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
YOLOv4: Darknet 如何于 Docker 编译,及训练 COCO 子集
YOLO 算法是非常著名的目标检测算法。从其全称 You Only Look Once: Unified, Real-Time Object Detection ,可以看出它的特性:
GoCoding
2021/05/06
1.5K0
YOLOv4: Darknet 如何于 Docker 编译,及训练 COCO 子集
【教程】COCO 数据集:入门所需了解的一切
本文为机器翻译,推荐直接看原文:COCO Dataset: All You Need to Know to Get Started
小锋学长生活大爆炸
2024/05/25
11.8K0
【教程】COCO 数据集:入门所需了解的一切
文本生成图像工作简述2--常用数据集分析与汇总
文本到图像的 AI 模型仅根据简单的文字输入就可以生成图像。用户可以输入他们喜欢的任何文字提示——比如,“一只可爱的柯基犬住在一个用寿司做的房子里”——然后,人工智能就像施了魔法一样,会产生相应的图像。
中杯可乐多加冰
2024/04/19
1.1K0
今天来看一下MS-COCO数据集的内容说明,数据的定义,标注信息
http://cocodataset.org/#download 官网地址 Mask API 中介绍 COCO为每个目标实例都提供了分割Msak { "info" : info, "images" : [image], "annotations" : [annotation], "licenses" : [license], } info{ "year" : int, "version" : str, "description" : str, "contributor" : str, "
水球喵子
2018/04/24
3.2K0
利用Pytorch torchvision完成Faster-rcnn目标检测demo及源码详解
Torchvision更新到0.3.0后支持了更多的功能,其中新增模块detection中实现了整个faster-rcnn的功能。本博客主要讲述如何通过torchvision和pytorch使用faster-rcnn,并提供一个demo和对应代码及解析注释。
全栈程序员站长
2022/09/07
1.9K0
利用Pytorch torchvision完成Faster-rcnn目标检测demo及源码详解
YOLOv3目标检测有了TensorFlow实现,可用自己的数据来训练
现在,有位热心公益的程序猿 (Yunyang1994) ,为它做了纯TensorFlow代码实现。
量子位
2019/04/24
1.6K0
YOLOv3目标检测有了TensorFlow实现,可用自己的数据来训练
目标检测 | 常用数据集标注格式及生成脚本
目标检测是计算机视觉任务中的一个重要研究方向,其用于解决对数码图像中特定种类的可视目标实例的检测问题。目标检测作为计算机视觉的根本性问题之一,是其他诸多计算机视觉任务,例如图像描述生成,实例分割和目标跟踪的基础以及前提。而在解决此类问题时,我们常常需要使用自己的脚本或者利用标注工具生成数据集,数据集格式往往会多种多样,因此对于目标检测任务而言,为了更好地兼容训练,大多数目标检测模型框架会默认支持几种常用的数据集标注格式,常见的分别是COCO,Pascal VOC,YOLO等等。本文主要介绍上述几种数据集格式以及我写的Python脚本(一般需要根据实际情况再改改)。
Justlovesmile
2021/12/14
5.1K0
目标检测 | 常用数据集标注格式及生成脚本
COCO 2017 数据集下载
标注信息使用 JSON 格式存储( annotations ), 预处理通过COCO API用于访问和操作所有“标注”
狼啸风云
2020/12/28
12.7K0
COCO 2017 数据集下载
使用Python分析姿态估计数据集COCO的教程
当我们训练姿势估计模型,比较常用的数据集包括像COCO、MPII和CrowdPose这样的公共数据集,但如果我们将其与不同计算机视觉任务(如对象检测或分类)的公共可用数据集的数量进行比较,就会发现可用的数据集并不多。
AI算法与图像处理
2021/01/20
2.7K0
使用Python分析姿态估计数据集COCO的教程
实践 | 目前最快精度最高检测框架(EfficientDet)
项目链接:https://github.com/signatrix/efficientdet
计算机视觉研究院
2020/07/28
7620
实践 | 目前最快精度最高检测框架(EfficientDet)
如何将VOC XML文件转化成COCO数据格式
在一个项目中,我需要将已有的VOC的xml标注文件转化成COCO的数据格式,为了方便理解,文章按如下顺序介绍:
marsggbo
2019/08/14
1.9K0
PyTorch版CenterNet训练自己的数据集
CenterNet(Objects as points)已经有一段时间了,之前这篇文章-【目标检测Anchor-Free】CVPR 2019 Object as Points(CenterNet)中讲解了CenterNet的原理,可以回顾一下。
BBuf
2020/07/22
1.8K0
Caffe2 - (二十二) Detectron 之数据集加载与处理函数
如果处理新的数据集时,强烈推荐将数据集转化为 COCO json 格式,重用先有数据代码即可.
AIHGF
2019/02/27
1.3K0
博客 | AI 从业者都应该知道的实验数据集
少了数据,我们的机器学习和深度学习模型什么也干不了。这么说吧,那些创建了数据集、让我们可以训练模型的人,都是我们的英雄,虽然这些人常常并没有得到足够的感谢。让人庆幸的是,那批最有价值的数据集后来成了「学术基准线」——被研究人员广泛引用,尤其在算法变化的对比上;不少名字则成为圈内外都耳熟能详的名称,如 MNIST、CIFAR 10 以及 Imagenet 等。
AI研习社
2018/12/07
5240
【ImageNet后计算机视觉顶级赛事】中国团队力克谷歌等包揽MS COCO竞赛3项冠军
【新智元导读】图像识别领域的权威标杆 MS COCO 2017 竞赛结果公布。COCO 竞赛代表了继 ImageNet 后图像识别的最高水平。今年,来自旷视、商汤、北大、北航、中科院自动化所的众多中国团队,几乎占据了各项任务的第一,超越了谷歌、Facebook。 MS COCO(Microsoft Common Objects in Context,常见物体图像识别)竞赛是继 ImageNet 竞赛(已停办)后,计算机视觉领域最受关注和最权威的比赛之一,是图像(物体)识别方向最重要的标杆(没有之一),也是目
新智元
2018/03/21
1.5K0
【ImageNet后计算机视觉顶级赛事】中国团队力克谷歌等包揽MS COCO竞赛3项冠军
mask rcnn实现教程
链接:https://pan.baidu.com/s/1htJYyNy 密码:0r2b
全栈程序员站长
2022/11/09
6840
mask rcnn实现教程
coco数据集语义分割_实例分割模型
JSON文件的基本格式,以实例分割为例,主要有五个部分:info、licenses、images、annotations、categories
全栈程序员站长
2022/09/23
1.2K0
双编码器的自然语言图像搜索
该示例演示了如何构建一个双编码器(也称为双塔)神经网络模型,以使用自然语言搜索图像。该模型的灵感来自于Alec Radford等人提出的CLIP方法,其思想是联合训练一个视觉编码器和一个文本编码器,将图像及其标题的表示投射到同一个嵌入空间,从而使标题嵌入位于其描述的图像的嵌入附近。
LiveVideoStack
2021/09/01
1.3K0
双编码器的自然语言图像搜索
妙啊!MMDetection 训练自定义数据集
上一篇讲到如何安装MMDetection,今天要分享如何使用 MMDetection 训练自定义数据集,其实非常简单!
AI算法与图像处理
2021/03/14
2.2K0
【目标检测数据集】一、PASCAL VOC数据集简介
PASCAL VOC数据集是目标检测领域比较知名的数据集,该数据集分为VOC2007和VOC2012两个子集,其官方下载地址如下:
AI那点小事
2022/01/21
4.9K0
【目标检测数据集】一、PASCAL VOC数据集简介
推荐阅读
相关推荐
YOLOv4: Darknet 如何于 Docker 编译,及训练 COCO 子集
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档