我是否使用循环,df.melt或df.explode来实现扁平化的数据帧?

问题描述

任何人都可以帮助实现以下转换的某些代码吗?我尝试了df.meltdf.explode的变体,也尝试了循环语句,但只得到错误语句。我认为它可能需要嵌套,但是没有经验。

index  A   B   C  D
0      X   d   4  2
1      Y   b   5  2

其中D列代表C列的频率。

所需的输出是:

index  A   B   C  
0      X   d   4  
1      X   d   4
2      Y   b   5
3      Y   b   5     

解决方法

如果要重复行,为什么不使用GitHub: LibrariesHacked / openlibrary-search

import pandas as pd

#recreate the sample dataframe    
df = pd.DataFrame({"A":["X","Y"],"B":["d","b"],"C":[4,5],"D":[3,2]},columns=list("ABCD"))

df = df.reindex(df.index.repeat(df["D"])).drop("D",1).reset_index(drop=True)

print(df)

样本输出

   A  B  C
0  X  d  4
1  X  d  4
2  X  d  4
3  Y  b  5
4  Y  b  5