R-将数据分成多个bin,以最大程度地减少波动并最大化行数

问题描述

我有一个看起来像这样的数据框:

  date_fichier   pitd            pce frequence date_debut segment profil  car
1 202009160247 GD0991 01100144549731        6M 2020-09-15     RES   P011  183
2 202009130430 GD0991 01100144556930        1M 2016-05-06     RES   P012 6176
3 202009130430 GD0991 01100144558956        6M 2020-05-15     RES   P011 5520
4 202009130430 GD0991 01100144559745        6M 2018-02-25     RES   P011 2845
5 202009130430 GD0991 01100144564817        6M 2013-11-19     RES   P011 4434
6 202009130430 GD0991 01100144565492        6M 2012-11-05     RES   P011 3790

我刚好有9个配置文件P011至P019。汽车列是对我很重要的数据列。我想为每个配置文件将数据拆分到车厢中。这些垃圾箱需要同时具有较低的相对挥发性和较高的行数。所以这基本上是一个优化问题,

  1. 最小化相对体积=仓位的波动率/平均值
  2. 最大化箱的行号

容器的大小不必相同,并且每个概要文件的数目相同。例如,对于P011,我可以有3个容器,每个容器10的行数如下,25、50,对于P015,我可以有7个垃圾箱,每个垃圾箱具有以下行数:100、50、30、10、68、63、12

我知道这有点自相矛盾,因为大量数据更有可能是易失的,这就是为什么我需要这样做的原因。

提前感谢您的提示

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)