问题描述
我使用了 sklearn
的 Isolation Forest,并用它来预测其他样本(来自同一群体)。由于样本量很大,我无法在整个数据上拟合 Forest(因为我无法将该数据转换为 Pandas 数据帧),因此采用了这种方法。
因为这需要时间,所以我在考虑减少树木的最大深度。根据{{3}},“
每棵树的最大深度设置为 ceil(log_2(n)),其中是用于构建树的样本数(参见(Liu et al.,2008) 更多详情)
”
但由于我只想要最顶端的异常,我想我可以将树的深度限制为甚至小于 ceil(log_2(n))。而且我认为这可能会减少使用该模型进行拟合和进行预测所需的时间。但是 sklearn
不支持参数 max_depth
。有没有办法在 max_depth
sklearn
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)