如何拆分和正确重命名列熊猫

问题描述

我正在处理Movielens数据集,我想将“流派”列拆分为多列(每种流派一个),重命名它们并插入0或1,具体取决于电影是否在相应流派中。 / p>

数据集原样

item_id title               genre   
    1   Toy Story (1995)    Animation|Children's|Comedy
    150 Apollo 13 (1995)    Drama
    260 Star Wars (1977)    Action|Adventure|Fantasy|Sci-Fi 

我希望拥有的东西

item_id       title            Action  Animation   Children's  Comedy  Fantasy  Musical  Sci-Fi 
        1   Toy Story (1995)    0        1           1          1       0       0         0
        150 Apollo 13 (1995)    0        0           0          1       0       0         0
        260 Star Wars (1977)    1        0           0          0       1       0         1

因此,我想将该列分为几列,对这些列进行重命名(也许应该首先完成,因为存在许多不同的流派),如果该电影属于给定的电影流派,那么我要填充1。

df.genre.str.split("|",expand= True)

代码会拆分但不能正确执行,因为在同一列中存在不同的流派:

    0             1            2     3       4        5
0   Animation   Children's  Comedy  None    None    None
1   Animation   Children's  Musical Romance None    None

提前谢谢!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)