熊猫：计算每“年”的总列值的标准差

问题描述

我有一个数据框，代表餐厅的顾客签到（访问）。 year仅仅是在餐厅办理登机手续的年份。

我想做的是在我的初始数据框std_checkin中添加一列df，该列代表每年访问次数的标准差。因此，我需要计算每年总访问量的标准差。

data = {
        'restaurant_id':  ['--1UhMGODdWsrMastO9DZw','--1UhMGODdWsrMastO9DZw','--6MefnULPED_I942VcFNA','--6MefnULPED_I942VcFNA'],'year': ['2016','2016','2017','2011','2012','2012'],}
df = pd.DataFrame (data,columns = ['restaurant_id','year'])

# total number of checkins per restaurant
d = df.groupby('restaurant_id')['year'].count().to_dict()
df['nb_checkin'] = df['restaurant_id'].map(d)


grouped = df.groupby(["restaurant_id"])
avg_annual_visits = grouped["year"].count() / grouped["year"].nunique()
avg_annual_visits = avg_annual_visits.rename("avg_annual_visits")
df = df.merge(avg_annual_visits,left_on="restaurant_id",right_index=True)

df.head(10)

从这里，我不确定如何用熊猫写我想要的东西。如果需要任何澄清，请询问。

谢谢！

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

dataframe feature-engineering pandas python standard-deviation