深度学习中常用的标注文件
mat文件是matlab专用的文件,第一次见是再COCOstuff-10k数据集中。
遇到的问题:如果用sublime打开的话,会显示16进制格式,可以猜想matlab是打开该文件的重要工具。但是如果使用python读取并打印显示的话,可以正常显示字符串模式。
解决办法:通过python读取mat文件内容写入txt或者json文件。
代码如下:
from scipy.io import loadmat
mat=loadmat("<filename>.mat")
matStr=str(mat)
f=open("<filename>.json","w")
f.write(matStr)
f.close
e或者notepad++或者txt打开文件进行阅读
mat文件打开显示
用sublime打开。全是16进制
一个小男孩在镜子面前刷牙
文中caption用于给图片上字幕,‘S’,‘regionLabelsStuff’,'regionMapStuff’用于分割图像。
这是常见的一类实例分割、语义分割、目标检测的标注文件。使用python语言进行编写,易读性以及易使用性强。我在cocostuff-10k数据集中见到该文件,另外导师给的内窥镜数据集也是该标注文件。
如果是labelme标注的图像,还可以通过labelme_json_to_dataset命令转换为png文件。
labelme标注后生成的json文件
“shapes”记录每一个标注区域,其中有‘label’、‘line_color’、‘fill_color’、‘points’、‘shape_type’等信息。即每一个标注区域都有自己特定的属性与位置信息,方便使用者使用。
xml的风格类似于html,但是并不相同,python也可读取(这个我不会,之前只用过C#语言尝试过,个人感觉这种文件可以转发为json文件,毕竟都是易读的标记语言,有待取证)。不过,还是很容易读懂。我在PASCAL VOC 2012数据集中见到该标注文件。该数据集可用于目标检测。
xml文件显示
标签+位置信息,用于定位。文中即标注了object是person,也标注了person的位置信息(xmin=174,ymin=101,xmax=349,ymax=351)
该文件也可以使用sublime和notepad++打开
我试着使用labelme自己标注图像,生成的json文件,然后使用label_json_to_dataset生成png文件。
因为图像分割要分类每一个像素,所以图像分割除了使用标记语言还可以直接使用png文件。只不过该png文件一个标记物体只有一个像素值。
能打开图片的软件都能打开它,强大的sublime竟然也能打开。
CSV,xlsx,txt,word
这些都是常见的文档格式。这里为大家展示csv文件格式的标注数据。
A栏是源图片的路径,B栏是类别。类别为0(negative)、1(positve)。该数据为MURA 数据集,用于判断骨骼是否异常,属于二值分类。
labelme并不是标记文件,而是一个软件。通过该软件可以标注图像,保存的文件时json文件。 推荐给玩一玩,很快的,一个小时就能拥有自己标注的图像,有助于我们更深刻地了解图像标注。 label学习 展示一下标记效果。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。