python – 划分两个pandas DataFrames并保留非数字列

我有两个包含数字和非数字值的pandas DataFrame.我想将一个除以另一个,但保留非数字列.这是一个MWE:

a = pd.DataFrame(
    [
        ['group1', 1., 2.],
        ['group1', 3., 4.],
        ['group1', 5., 6.]
    ], 
    columns=['Group', 'A', 'B']
)

b = pd.DataFrame(
    [
        ['group1', 7., 8.],
        ['group1', 9., 10.],
        ['group1', 11., 12.]
    ],
    columns=['Group', 'A', 'B']
)

试图做:

b.div(a)

结果是:

TypeError: unsupported operand type(s) for /: 'str' and 'str'

所以为了解决这个问题,我做了:

result = b.drop(["Group"], axis=1).div(a.drop(["Group"], axis=1))
print(result)
#     A    B
#0  7.0  4.0
#1  3.0  2.5
#2  2.2  2.0

哪个是正确的,但我还想保留“Group”列.

获得我想要的输出的一种方法是:

desired_output = b[["Group"]].join(result)
print(desired_output)
#    Group    A    B
#0  group1  7.0  4.0
#1  group1  3.0  2.5
#2  group1  2.2  2.0

但我真正的DataFrames有许多非数字列.是否有更清洁/更快/更有效的方法来告诉大熊猫只划分数字列?

解决方法:

您可以使用np.divide,将掩码传递给where参数.

np.divide(b, a, where=a.dtypes.ne(object))

假设DataFrame中的非数字列相同,请使用combine_first / fillna将其返回:

np.divide(b, a, where=a.dtypes.ne(object)).combine_first(a)


    Group    A    B
0  group1  7.0  4.0
1  group1  3.0  2.5
2  group1  2.2  2.0

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...