使用H20.aiDriverless ai进行多标签分类

问题描述


我们正在测试无人驾驶AI的功能。我们的第一个数据集就是这样。 X1,X2 .... X400,Y1,Y2 ... Y200
在这里,我们要对数据集进行多标签分类。 但是,在无人驾驶AI Web客户端中,只能选择仅指定一个目标。

另一种选择是,我尝试将所有Y变量都压缩到一个列表中。

enter image description here


但是,h20.ai不会预测每个Y变量,而只是将每个数字序列都视为一个类。
就像有3个Y变量一样。
然后是[0 0 1]和[0 1 0],依此类推,直到8个班级。
然后在训练时,它只是抱怨这8个班级中的某些班级没有足够的行而将其丢弃。就我而言,我有200多个Y变量,因此它会丢弃很多此类。

有人知道在无人驾驶AI中有什么解决方案吗?

谢谢

解决方法

无人驾驶AI目前不支持多标签。一种选择是为每个类创建一个模型(无论如何,这是多类建模所做的事情)。 200个Y变量/类很多,因此您可能想使用Python客户端对其进行自动化,但这将需要一些时间来运行它们并进行评估。也许尝试一下前5类,看看它们的表现如何。考虑将200个类减少为一组可能会有所帮助。

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...