如何使用Firebase / ML Kit识别和计数对象

问题描述

我想识别和计数图片中的对象,例如在一张邻居的图片中计算房屋数量。使用ML Kit做到这一点的最佳方法是什么?

我需要使用Object Detection API吗?还是可以使用简单的图像标签器获得多个“房屋”标签?

解决方法

ML Kit Object Detection API(请注意,它现在已作为独立的SDK提供)可以对图像/视频流中的对象进行计数,但仅限于5个最大的对象。另外,您应该评估对象检测是否适用于您的用例。这是一个非常通用的定位器,适用于大多数对象,但是当对象靠近/重叠时,可能无法区分它们。

如果您需要检测5个以上的物体,我建议直接使用TensorFlow LiteTF Hub上可用的一些经过预先训练的模型,或者使用AutoML Vision Edge自己进行训练如果通用模型不适合您的用例。

首先,图像标签分配描述图像场景的标签。但是,它不计算对象的数量,通常会得到一个单独的标签“ house”。

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...