问题描述
我会尽量不绕圈子。 如果您使用 k-Nearest Neighbors 插补器对大量数值特征进行插补,然后想在所有特征上获得一些 MI 分数,您会如何处理?
因为您无法将提到的数字特征存储回您的“旧”数据框(因为您必须首先对值进行标准化并且数据框也包含对象特征)并且您不能使用您的“旧”数据框来构建由于各种空值,MI 得分。
现在尝试解决这个问题大约 2 个小时,也许我再也看不到森林中的树了 :D
PS:我想用 KNN 来估算这个想法(刚刚了解到它),所以我不想费心使用一个替代解决方案来提供同样的鲁棒性。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)