在ID3决策树分类器中如何选择子集的数量及其阈值?

问题描述

我正在尝试实现ID3决策树分类器。我知道,熵是用来决定拆分依据的属性。我不了解的是如何选择此属性的“阈值”值,即创建了多少个子集以及它们代表该属性的哪些“箱”。因为,如果我理解正确,ID3每个节点可以有两个以上的子集。

假设数据是64个要素,值从0到100,具有10个类。我猜我会遍历所有这些功能。在此循环的特定迭代中:

  1. 我该如何选择应该有多少个bin(和子集)?
  2. 我将如何选择这些垃圾箱的阈值?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)