如何为定位任务训练 CNN?

问题描述

给定一张地图和来自该地图的补丁,我如何训练 CNN 将补丁作为输入并给我补丁在地图上的位置? (假设补丁在地图上是唯一的)

欢迎任何线索!谢谢:)

解决方法

我最初的猜测是使用 siamise 网络(具有两个输入的 cnn)并使用补丁之间的一些距离损失(例如三元组损失)进行训练,在推理过程中,您可以在图像上移动滑动窗口并获得内部的补丁此窗口并与“您的补丁”进行比较。

此外,如果您有不同的尺寸,您可以尝试使用类似 yolo 锚框的东西(请查看这篇文章 https://towardsdatascience.com/anchor-boxes-the-key-to-quality-object-detection-ddf9d612d4f9)并将这种方法与上述方法合并。