我正在处理一个区域案例,最终模型应该适合。 它具有多种类型的数值和分类特征,如下面的快照所示。
我的主要问题与 E 列有关。如何正确转换此列以在我的回归问题中用作预测变量?我可以简单地使用 one-hot 编码吗?
我还需要对区域进行编码还是应该将它们分组?
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)