如何将函数应用于变量为两列的熊猫数据框?

问题描述

因此,我正在尝试优化分类功能。我只有一个数据框,但是需要同时处理两列,而不是一列然后再处理另一列。基本上,需要比较第一列的记录[0]与记录[0]的第二列。根据分类规则,然后它将二进制代码输出到新列。我现在所使用的是利用.items来遍历整个系列,显然效率不高。我只是无法弄清楚如何使用.apply或类似的pandas方法将两列用作变量。

def series_compare(s1,s2):
    tmp= []
    for index,values in s1.items():
        if (values == 0) | (s2[index] == 0):
            tmp.append(0)
        elif (values == 1) | (values == 2):
            tmp.append(1)
        elif (values == 3) & (s2[index] == 4):
            tmp.append(0)
        elif (values == 3) & (s2[index] != 4):
            tmp.append(1)
        elif (values == 4) & (s2[index] == 4):
            tmp.append(0)
        elif (values == 4) & (s2[index] != 4):
            tmp.append(-99999)
        else:
            tmp.append(10)
    return(pd.Series(tmp))

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)