在使用LabelImg标注完目标检测的数据之后,由于很多样本是负例(没有目标的样本),将其输入到模型中意义不大,因此需要进行剔除。 那么实现思路就是根据xml的名称来筛选对应的jpg图片。
如图,image是原始图片,xml是标注数据,image_out是筛选后输出的图片。

import os
import shutil
if __name__ == '__main__':
xml_src = "xml/"
img_src = "image/"
img_out = "image_out/"
img_list = []
for name in os.listdir(xml_src):
img_list.append(name[:-4])
print(name[:-4])
for i in img_list:
new_obj_name = i + '.jpg'
shutil.copy(img_src + '/' + new_obj_name, img_out)