python – 返回将pandas dataframe作为参数的函数输出

我有一个pandas数据框,看起来像:

d = {'some_col' : ['A', 'B', 'C', 'D', 'E'],
     'alert_status' : [1, 2, 0, 0, 5]}
df = pd.DataFrame(d)

我工作中的很多任务需要在熊猫中完成相同的任务.我开始编写标准化函数,将数据帧作为参数并返回一些东西.这是一个简单的:

def alert_read_text(df, alert_status=None):
    if (alert_status is None):
        print 'Warning: A column name with the alerts must be specified'
    alert_read_criteria = df[alert_status] >= 1
    df[alert_status].loc[alert_read_criteria] = 1
    alert_status_dict = {0 : 'Not Read',
                         1 : 'Read'}
    df[alert_status] = df[alert_status].map(alert_status_dict)
    return df[alert_status]

我希望函数返回一个系列.这样,可以将列添加到现有数据框:

df['alert_status_text'] = alert_read_text(df, alert_status='alert_status')

但是,目前,此函数将正确返回一个系列,但也会修改现有列.如何使传入的原始列不被修改

解决方法:

正如您所发现的,传入的数据帧将被修改为params通过引用传递,这在python中是正确的,与pandas无关.

因此,如果您不想修改传递的df,那么请复制一份:

def alert_read_text(df, alert_status=None):
    if (alert_status is None):
        print 'Warning: A column name with the alerts must be specified'
    copy = df.copy()
    alert_read_criteria = copy[alert_status] >= 1
    copy[alert_status].loc[alert_read_criteria] = 1
    alert_status_dict = {0 : 'Not Read',
                         1 : 'Read'}
    copy[alert_status] = copy[alert_status].map(alert_status_dict)
    return copy[alert_status]

另见:pandas dataframe, copy by value

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...