问题描述
我有一个DataFrame,其中包含几个提交项目的人。人们的名字在DF中多次出现。其中一栏包含有关每个人启动项目年份的信息:我想创建一个新列,称为“以前的项目”,其中包含任何人在任何时间提交的项目数量。 以下是DF的概述(我已经根据Year对它进行了排序):df1。
我尝试运行以下代码:
df = pd.read_excel('Cartel3.xlsx')
df1 = df.sort_values(by=['Year'],ascending=True)
df1
creatorlist = []
df1['previous_projects']=""
for row in df1.itertuples():
creatorlist.append(row.Creator)
if creatorlist.count(row.Creator) > 0:
df1['previous_projects']= creatorlist.count(row.Creator)
df1
我认为问题在于,使用for循环,所有名称都会自动添加到列表中,因此,当我运行list.count()时,无论出现时间如何,我都会获得名称出现的总数
希望一切都清楚, 预先感谢
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)