问题描述
我目前正在执行一个实例细分任务,其目标是检索以灰色图像显示的一堆项目的顶部元素的边界矩形。
这是一个简化的示例来说明任务:
在这里,目标是检索黑色矩形的边界多边形。由于堆栈上的项目数不受限制,每个对象的旋转角度是任意的,并且项目的表面是任意复杂的,因此实际上很难实现基于线检测或其他任何算法的算法。还要求生成的多边形以某种方式包含旋转角度,因此没有对象检测算法(如YOLO,SSD或Mask-RCNN)可以正确解决该任务。
我目前的方法是使用全卷积神经网络,该神经网络输出一个遮罩,背景为黑色,所需对象为白色。低于所需对象的对象也被标记为背景。由于限制,我无法使用不同的类来标记图像中的每个对象,或者将它们组合到多个类中,例如背景,堆栈项目和顶部堆栈项目等。
通过一些算法后处理,这种方法可以以大约70%的正确检测率解决该任务,但是我想进一步改进它。
当前网络类似于U-Net,具有更大的内核,以炸毁网络的接收范围。因为原始的U-Net通常用于性能较好的较小对象。但是在这里,对于大型物体,其方式有所不同。
因此,我很高兴听到一些有关如何改善标签,体系结构等的想法。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)