熵和决策树

问题描述

假设我有一张客户信息表,其中包含客户 ID、姓名、出生日期、国籍、收入等属性

表中的每个客户都有一个唯一的客户 ID。我知道每个客户 ID 值的基尼系数为零,因此客户 ID 的整体基尼系数为零。

我也可以假设客户 ID 的熵也是零吗?为什么或为什么不?

解决方法

是的。基尼系数和熵都量化了杂质,值为 0 表示完美的纯度。因此,如果 Gini 等于 0,那么熵也是。