问题描述
我在 Pandas 中有一个表,它的 ID 为每个日期时间重复。我有一行 Cumulative Sum 项目,我想创建一个新列,用于标识每个 ID 何时满足某个阈值。我在下图中有一个示例。在这里,我有 ID,并且我正在寻找 Cumulative Sum 列何时达到 6。有时,ID 的 Cumulative Sum 是 8,但那是达到最小计数 6 的行。一旦达到 6,我希望每个 ID 的下一个累积总和(如果有)为假。例如,一旦达到 6,如果 ID 有另一行的累积总和为 11,我希望它为 False。
感谢任何帮助!
谢谢
解决方法
让我们做
idx = df['cumsum value'].ge(6).groupby(df['incident number']).transform('idxmax')
df['new'] = df.index.eq(idx)