pandas qcut 到新的 bin 并检索 bin 间隔

问题描述

我正在尝试使用 pandas.qcut 将我的数据放入 4 个箱中。但是我得到了非唯一边缘错误。我已按照步骤纠正此问题,例如:

df['recency']=pd.qcut(df['recency'].rank(method='first'),4)
df['monetary']=pd.qcut(df['monetary'].rank(method='first'),4)
df['volume']=pd.qcut(df['volume'].rank(method='first'),4)

#this solves the issue.. however when I calculate the bin values : 
recency_4 = pd.qcut(df['recency'].rank(method='first'),4,retbins=True)[1].tolist()
monetary_4 = pd.qcut(df['monetary'].rank(method='first'),retbins=True)[1].tolist()
volume_4 = pd.qcut(df['volume'].rank(method='first'),retbins=True)[1].tolist()

quartile_spread = pd.DataFrame(list(zip(recency_4,monetary_4,volume_4)),columns=['Q_recency','Q_monetary','Q_volume'],index = ['min','first_part','second_part','third_part','max'])
quartile_spread:

enter image description here

它们都是一样的 ^... 我怎样才能正确地进行基于分位数的分箱并检索分箱边缘..?如果我放了“dulicates drop”,这到底是做什么的?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)