问题描述
任何人都可以帮助实现以下转换的某些代码吗?我尝试了df.melt
,df.explode
的变体,也尝试了循环语句,但只得到错误语句。我认为它可能需要嵌套,但是没有经验。
index A B C D
0 X d 4 2
1 Y b 5 2
其中D
列代表C
列的频率。
所需的输出是:
index A B C
0 X d 4
1 X d 4
2 Y b 5
3 Y b 5
解决方法
如果要重复行,为什么不使用GitHub: LibrariesHacked / openlibrary-search?
import pandas as pd
#recreate the sample dataframe
df = pd.DataFrame({"A":["X","Y"],"B":["d","b"],"C":[4,5],"D":[3,2]},columns=list("ABCD"))
df = df.reindex(df.index.repeat(df["D"])).drop("D",1).reset_index(drop=True)
print(df)
样本输出
A B C
0 X d 4
1 X d 4
2 X d 4
3 Y b 5
4 Y b 5