如何在不使用qcut的情况下将数字熊猫系列分类为n个大小近似相同的组?

问题描述

我想将我的系列分成正好n个组(假设系列中至少有n个不同的值),其中组的大小大致相等。

代码必须是通用的,所以我无法提前知道数据的分布,因此对预定义的bin使用pd.cut并不是我的选择。

我尝试将pd.qcutpd.cutpd.Series.quantile一起使用,但是当在该系列中非常频繁地重复某些值时,它们都不足。

例如,如果我要三个组:

series = pd.Series([1,1,3,4,4])
pd.qcut(series,q=3,duplicates="drop")

仅创建2个类别:Categories (2,interval[float64]): [(0.999,3.0] < (3.0,4.0]],而我想得到类似[(0.999,1.0] < (1.0,4.0]]的东西。

有什么方法可以通过熊猫的内置方法轻松地做到这一点?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)