Pandas 新列在累积和达到阈值时查找

问题描述

我在 Pandas 中有一个表,它的 ID 为每个日期时间重复。我有一行 Cumulative Sum 项目,我想创建一个新列,用于标识每个 ID 何时满足某个阈值。我在下图中有一个示例。在这里我有 ID,并且我正在寻找 Cumulative Sum 列何时达到 6。有时,ID 的 Cumulative Sum 是 8,但那是达到最小计数 6 的行。一旦达到 6,我希望每个 ID 的下一个累积总和(如果有)为假。例如,一旦达到 6,如果 ID 有另一行的累积总和为 11,我希望它为 False。

enter image description here

感谢任何帮助!

谢谢

解决方法

让我们做

idx = df['cumsum value'].ge(6).groupby(df['incident number']).transform('idxmax')
df['new'] = df.index.eq(idx)