多张图像上的 ML.NET 对象检测？

问题描述

我正在尝试使用 ML.NET 的对象检测来检测来自视频流的图像中的对象。我正在以大约 20FPS 的速度捕捉 5 秒的镜头，最后我想通过我的模型运行这些帧。

我已经使用 prediction engine pooling implementation 成功地完成了这项工作，但是由于它一次只能处理一张图像，所以当它有 100 张图像要翻动时，速度相当慢。我研究了使用基于 MS multiple predictions 的 IDataView.Transform 进行批处理，但这似乎更适合其他 ML 方法。无论如何，我实现了它并且正在从 Transform 中得到结果，尽管我不确定我如何解释它以获得每个图像的概率、边界框坐标等（如果它甚至可能的话）。我尝试参考使用相同方法的 this MS object detection 指南，但它仅适用于单一图像。

也许我的解析逻辑需要调整以应对，但在我花时间研究这个之前，我想先知道它是否可行。

这是否可以用于物体检测，还是我一次只能处理一张图像？我似乎找不到任何人通过对象检测来执行此操作的示例。

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

c#c#deep-learning machine-learning ml.net object-detection