python – Pandas – 行是否属于具有列值和相同id的行

我是熊猫的新手.我有一个像这样的Pandas数据框:

df = pd.DataFrame(data={'id': [1,1,2,2],'val1': [0,0]})

我想添加一个列val2,它指示一行是否落在另一行具有与其自身相同的id的行中,其中val1 == 1.

结果将是一个数据框,如:

df = pd.DataFrame(data={'id': [1,0],'val2': [0,1]})

我的第一个想法是使用apply语句,但这些只是按行进行.从我的循环经验来看,永远不是答案.任何帮助将不胜感激!

解决方法

让我们尝试在groupby中移动cumsum.

df['val2'] = df.groupby('id').val1.apply(
    lambda x: x.shift().cumsum()
).ge(1).astype(int)

或者,为了避免lambda,

df['val2'] = (    
   df.groupby('id')
     .val1.shift()
     .groupby(df.id)
     .cumsum()
     .ge(1)
     .astype(int)
)
df
   id  val1  val2
0   1     0     0
1   1     1     0
2   1     0     1
3   2     0     0
4   2     1     0
5   2     0     1
6   2     0     1

相关文章

功能概要:(目前已实现功能)公共展示部分:1.网站首页展示...
大体上把Python中的数据类型分为如下几类: Number(数字) ...
开发之前第一步,就是构造整个的项目结构。这就好比作一幅画...
源码编译方式安装Apache首先下载Apache源码压缩包,地址为ht...
前面说完了此项目的创建及数据模型设计的过程。如果未看过,...
python中常用的写爬虫的库有urllib2、requests,对于大多数比...