用args定义要在df.transform中使用的函数

问题描述

对于当前项目,我计划对由两个列/对象df['Policies']df['ProCon']组成的Pandas DataFrame进行Winsorize。这意味着应该删除集合中高端和低端的离群值。

根据0.05部分中显示的值,应在0.95df['ProCon']进行抽奖,而如果发现异常值,则应将这两列都删掉。>

但是下面的代码不接受对def winsorize_series(df['ProCon']):行中'ProCon'列的直接引用,从而产生有关无效语法的错误。

是否有任何明智的方法来表明ProCon将成为温升的决定性价值?

import pandas as pd
from scipy.stats import mstats

# Loading the file
df = pd.read_csv("3d201602.csv")

# Winsorizing
def winsorize_series(df['ProCon']):
    return mstats.winsorize(df['ProCon'],limits=[0.05,0.95])

# Defining the winsorized DataFrame
df = df.transform(winsorize_series)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)