问题描述
我需要对几个分类列进行编码,为了将来使用,我需要同时将原始列保留在数据框中。如果原始数据帧看起来像这样(请注意,第0行和第4行具有相同的分类值):
Index color taste price
0 Red Good 10$
1 Red Bitter 5$
2 Green Good 10$
3 Red Bitter 2$
4 Red Good 35$
结果数据框应如下所示:
Index color taste price color=Red color=Green taste=Good taste=Bitter
0 Red Good 10$ 1 0 1 0
1 Red Bitter 5$ 1 0 0 1
2 Green Good 10$ 0 1 1 0
3 Red Bitter 2$ 0 1 0 1
4 Red Good 35$ 1 0 1 0
如何使用dictvectorizer来做到这一点(我需要同时编码几个分类列,并避免与必须使用dictvectorizer的错误索引合并)?而且,如果不能使用dictvectorizer进行除霜,还有另一种方法可以做到这一点吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)