首先,您似乎要做的是图像分类(将类/类别/标签分配给图像的任务)。
对于 YOLO,它做了两件事:定位(定位图像中某个物体的存在并在其周围绘制一个边界框)然后对里面的物体进行分类边界框。这种组合称为物体检测(见下图)
对于对象检测任务,重要的是在训练数据集中的未裁剪图像中表示目标对象。这允许 YOLO 了解哪些是背景,哪些是目标对象。
就您而言,您的数据集已被裁剪。如果您的测试集未裁剪
,YOLO 将无法学习如何区分您的“对象”和“背景”
但是,如果您的测试集也被裁剪,我建议使用图像分类模型而不是 YOLO。