我正在与蒙克-RCNN工作,并希望培训我自己的共同风格的数据集与少数类别。首先,我只有两个班(除了背景)。
尽管Mask附带了示例数据集,但它们要么只包含一个类,要么自己生成数据,使我无法理解如何加载带注释的图像并开始培训。我在Python函数上花了很多时间,但一直收到错误,如:
TypeError: list indices must be integers or slices, not str
这让我几乎一无所知。
我拥有的当前加载器(用于加载coco样式的数据集)如下(来自Mask存储库中的coco加载程序)
def load_components(self, dataset_dir,
我想训练YOLOv3在航空图像上检测人类。在图像数据集中使用VisDrone对象检测:
我写了一个脚本,把标签转换成黑网格式,这样我就可以按照pjreddie的“培训YOLO关于可可”的指令来训练它,我反复检查转换后的标签是否与对象匹配,并且它们也匹配,我还创建了一个正确的coco.names文件,根据在github上的VisDpir2018-DET-工具箱上的标签描述。我通过运行trainvalno5k.txt文件创建了
python 5kGenerator.py > trainvalno5k.txt
5kGenerator.py:
import os
for filename in
我试图编辑我的数据,但似乎找不到我需要的功能,以解决这个问题。
我有一个大概是这样的数据格式:
Title Description Rating
Beauty and the Beast a 2.5
Aladdin b 3
Coco c 2
等。
(评级介乎1至3之间)
我试图编辑我的数据,以便我得到一个新的数据,其中没有十进制数字的评级列。
新的数据将是:
Title
我一直在尝试用CNN对VOC2007数据集进行分类。数据集存在不平衡,多个图像具有“person”类,而所有其他类的图像非常少,我的模型一直存在过度拟合的问题。为了过采样,我一直在我的数据加载器中使用WeightedRandomSampler。 weights=[0.00000001,1/112,1/116,1/180,1/81,1/139,1/97,1/376,1/163,1/224,1/69,1/97,1/203,1/139,1/120,0.00001,1/133,1/48,1/111,1/127,1/128]
sample_weights=[0]*len(ds_train)
for
我使用了tensorflow对象检测API。
这是我的环境。
所有图片来自coco。
Tensorflow version : 1.13.1
Tensorboard version : 1.13.1
Number of test images : 3000
Number of train images : 24000
Pre-trained model : SSD mobilenet v2 quantized 300x300 coco
Number of detecting class : 1(person)
这是我的train_config。
train_config: {
batch_
# define the model
model = MaskRCNN(mode='training', model_dir='./', config=config)
# load weights (mscoco) and exclude the output layers
model.load_weights('mask_rcnn_coco.h5', by_name=True, exclude=["mrcnn_class_logits", "mrcnn_bbox_fc", "mrcnn_bbox&
我正在尝试使用COCO 2014数据在PyTorch中进行语义分割训练。我有一个带有交叉熵损失函数的PSPNet模型,它在2012年的PASCAL VOC数据集上工作得很好。现在,我正在尝试使用COCO图片的一部分来做同样的过程。但是Coco使用json数据而不是.png图像进行注释,我不得不以某种方式将一个转换为另一个。我已经注意到在cocotools中有annToMask,但是我不知道如何在我的例子中使用这个函数。这就是我的数据加载器的pull项的样子 def pull_item(self, index):
I DONT KNOW WHAT TO DO HERE
我想应用数据增强从PyTorch的波澜到图像与包围框。
当我应用HorizontalFlip转换时,我会收到这个错误ValueError: Expected x_max for bbox (0.6505353259854019, 0.517013871576637, 1.1234809015877545, 0.6447916687466204, 3) to be in the range [0.0, 1.0], got 1.1234809015877545.
我使用以下代码
A.Compose([
A.HorizontalFlip(p=1),
ToT