Python在DictVectorizer之后保留原始列

问题描述

我需要对几个分类列进行编码,为了将来使用,我需要同时将原始列保留在数据框中。如果原始数据帧看起来像这样(请注意,第0行和第4行具有相同的分类值):

Index   color  taste  price
  0      Red    Good   10$
  1      Red    Bitter 5$
  2      Green  Good   10$
  3      Red    Bitter 2$
  4      Red    Good   35$  

结果数据框应如下所示:

Index   color  taste  price color=Red   color=Green   taste=Good   taste=Bitter
  0      Red    Good   10$    1             0              1            0
  1      Red    Bitter 5$     1             0              0            1
  2      Green  Good   10$    0             1              1            0
  3      Red    Bitter 2$     0             1              0            1
  4      Red    Good   35$    1             0              1            0

如何使用dictvectorizer来做到这一点(我需要同时编码几个分类列,并避免与必须使用dictvectorizer的错误索引合并)?而且,如果不能使用dictvectorizer进行除霜,还有另一种方法可以做到这一点吗?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)