问题描述
我正在尝试实现ID3决策树分类器。我知道,熵是用来决定拆分依据的属性。我不了解的是如何选择此属性的“阈值”值,即创建了多少个子集以及它们代表该属性的哪些“箱”。因为,如果我理解正确,ID3每个节点可以有两个以上的子集。
假设数据是64个要素,值从0到100,具有10个类。我猜我会遍历所有这些功能。在此循环的特定迭代中:
- 我该如何选择应该有多少个bin(和子集)?
- 我将如何选择这些垃圾箱的阈值?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)