神经网络架构可从图像背景中分割大型对象

问题描述

我目前正在执行一个实例细分任务,其目标是检索以灰色图像显示的一堆项目的顶部元素的边界矩形。

这是一个简化的示例来说明任务:

enter image description here

在这里,目标是检索黑色矩形的边界多边形。由于堆栈上的项目数不受限制,每个对象的旋转角度是任意的,并且项目的表面是任意复杂的,因此实际上很难实现基于线检测或其他任何算法的算法。还要求生成的多边形以某种方式包含旋转角度,因此没有对象检测算法(如YOLO,SSD或Mask-RCNN)可以正确解决该任务。

我目前的方法是使用全卷积神经网络,该神经网络输出一个遮罩,背景为黑色,所需对象为白色。低于所需对象的对象也被标记为背景。由于限制,我无法使用不同的类来标记图像中的每个对象,或者将它们组合到多个类中,例如背景,堆栈项目和顶部堆栈项目等。

通过一些算法后处理,这种方法可以以大约70%的正确检测率解决该任务,但是我想进一步改进它。

当前网络类似于U-Net,具有更大的内核,以炸毁网络的接收范围。因为原始的U-Net通常用于性能较好的较小对象。但是在这里,对于大型物体,其方式有所不同。

因此,我很高兴听到一些有关如何改善标签,体系结构等的想法。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...