问题描述
我想将我的系列分成正好n个组(假设系列中至少有n个不同的值),其中组的大小大致相等。
代码必须是通用的,所以我无法提前知道数据的分布,因此对预定义的bin使用pd.cut
并不是我的选择。
我尝试将pd.qcut
或pd.cut
与pd.Series.quantile
一起使用,但是当在该系列中非常频繁地重复某些值时,它们都不足。
例如,如果我要三个组:
series = pd.Series([1,1,3,4,4])
pd.qcut(series,q=3,duplicates="drop")
仅创建2个类别:Categories (2,interval[float64]): [(0.999,3.0] < (3.0,4.0]]
,而我想得到类似[(0.999,1.0] < (1.0,4.0]]
的东西。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)