多张图像上的 ML.NET 对象检测?

问题描述

我正在尝试使用 ML.NET 的对象检测来检测来自视频流的图像中的对象。我正在以大约 20FPS 的速度捕捉 5 秒的镜头,最后我想通过我的模型运行这些帧。

我已经使用 prediction engine pooling implementation 成功地完成了这项工作,但是由于它一次只能处理一张图像,所以当它有 100 张图像要翻动时,速度相当慢。我研究了使用基于 MS multiple predictions 的 IDataView.Transform 进行批处理,但这似乎更适合其他 ML 方法。无论如何,我实现了它并且正在从 Transform 中得到结果,尽管我不确定我如何解释它以获得每个图像的概率、边界框坐标等(如果它甚至可能的话)。我尝试参考使用相同方法this MS object detection 指南,但它仅适用于单一图像。

也许我的解析逻辑需要调整以应对,但在我花时间研究这个之前,我想先知道它是否可行。

这是否可以用于物体检测,还是我一次只能处理一张图像?我似乎找不到任何人通过对象检测来执行此操作的示例。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)