决策树图中的值列表是什么意思

问题描述

在查看此问题 scikit learn - feature importance calculation in decision trees 时,我无法理解 Decision Tree 的值列表。例如,顶部节点的值=[1,3]。 1和3究竟是什么?这是否意味着如果 X[2]

  1. 为什么右边三片叶子有 [0,1],左边一片叶子有 [1,0]?
  2. [1,0] 或 [0,1] 到底是什么意思?一假零真还是零假一真?但是叶子上没有条件(比如

非常感谢您的建议!

解决方法

value=[1,3] 意味着,在这棵树的完全叶子中(在应用过滤器 x[2]

  • 0 类的 1 个样本
  • 1 类的 3 个样本

一旦你从树上下来,你就是在过滤。您的目标是拥有完全分离的类。所以你倾向于有类似 value=[0,1] 的东西,这意味着在应用所有过滤器之后,你有 0 个类 0 的样本和 1 个类 1 的样本。

您还可以检查值的总和是否始终与样本相似。这是完全有道理的,因为 value 只是告诉你到达这个叶子的所有样本是如何分布的。