问题描述
我将建立一个模型来识别数据集中的异常。我做了很多研究,发现隔离林是最好的隔离林。在我的数据集中,我没有任何标签(这意味着数据集仅包含解释变量)。但是我不知道在隔离林中设置污染参数(大多数解释该文章的文章已经具有输出变量[标记为异常],使用它们来计算离群比率,然后将其设置为污染值)。是否必须设置?污染的默认值为0.1。可以忽略它吗? 如果我没有为此付出任何价值,这会影响模型结果吗?
model = IsolationForest(contamination=0.1,n_estimators=1000)
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)