我有这样的DataFrame:
1 2 1 3 1 4
2 4 5 1 1 4
1 3 5 3 1 4
1 3 1 3 1 4
另一个像这样
1 1 0 0 0 0
我希望将它们与我得到的相乘
1 2 0 0 0 0
2 4 0 0 0 0
1 3 0 0 0 0
1 3 0 0 0 0
所以发生的事情是,每秒在第二个df中带有1的列将每个值乘以1,每个列用零将第一个数据帧中的所有列都更改为0.
解决方法:
使用底层数组可能最简单,让numpy做广播魔术:
>>> df1.values * df2.values
array([[1, 2, 0, 0, 0, 0],
[2, 4, 0, 0, 0, 0],
[1, 3, 0, 0, 0, 0],
[1, 3, 0, 0, 0, 0]])
您可以使用以下列将其放回到与df1具有相同列的数据框中:
>>> pd.DataFrame(df1.values * df2.values, columns=df1.columns)
0 1 2 3 4 5
0 1 2 0 0 0 0
1 2 4 0 0 0 0
2 1 3 0 0 0 0
3 1 3 0 0 0 0
或者,如果你不介意覆盖df1:
>>> df1[:] = df1.values * df2.values
>>> df1
0 1 2 3 4 5
0 1 2 0 0 0 0
1 2 4 0 0 0 0
2 1 3 0 0 0 0
3 1 3 0 0 0 0
或者,如果您愿意,可以使用np.broadcast_to获得一些乐趣:
>>> df1*np.broadcast_to(df2,df1.shape)
0 1 2 3 4 5
0 1 2 0 0 0 0
1 2 4 0 0 0 0
2 1 3 0 0 0 0
3 1 3 0 0 0 0