如何为具有单个对象检测类的多个边界框准备标签数据?

问题描述

我正在尝试解决一个对象检测问题,我想用提供的图像数据集训练数据。它有每个图像的掩码信息,有些图像有多个边界框。我如何准备带有多个边界框的标签数据,以便我可以将其用于训练。

解决方法

在其中一个网站上进行了大量冲浪和礼节后,我知道如何准备掩码数据。我创建了一个零 numpy 数组作为图像的大小,并将给定边界框内的 numpy 数组中的值更改为 1。

mask = np.zeros([image_height,image_width],dtype='float32')
for i in range(len(bboxes)):
     bbox = bboxes[i]
     x0,x1 = int(bbox[1]),int(bbox[3])
     y0,y1 = int(bbox[0]),int(bbox[2])
     mask[x0:x1,y0:y1] = 1

bboxes 是数据的边界框