神经网络架构可从图像背景中分割大型对象

我目前正在执行一个实例细分任务，其目标是检索以灰色图像显示的一堆项目的顶部元素的边界矩形。

这是一个简化的示例来说明任务：

在这里，目标是检索黑色矩形的边界多边形。由于堆栈上的项目数不受限制，每个对象的旋转角度是任意的，并且项目的表面是任意复杂的，因此实际上很难实现基于线检测或其他任何算法的算法。还要求生成的多边形以某种方式包含旋转角度，因此没有对象检测算法（如YOLO，SSD或Mask-RCNN）可以正确解决该任务。

我目前的方法是使用全卷积神经网络，该神经网络输出一个遮罩，背景为黑色，所需对象为白色。低于所需对象的对象也被标记为背景。由于限制，我无法使用不同的类来标记图像中的每个对象，或者将它们组合到多个类中，例如背景，堆栈项目和顶部堆栈项目等。

通过一些算法后处理，这种方法可以以大约70％的正确检测率解决该任务，但是我想进一步改进它。

当前网络类似于U-Net，具有更大的内核，以炸毁网络的接收范围。因为原始的U-Net通常用于性能较好的较小对象。但是在这里，对于大型物体，其方式有所不同。

因此，我很高兴听到一些有关如何改善标签，体系结构等的想法。

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）