python – 用偶数列和奇数列计算pandas中的平均值

假设我有这个数据框:

df = pd.DataFrame({'col1': [1, 2, 3, 4, 5], 
              'col2': [7, 45, 12, 56, 14],
              'col3': [56, 67, 8, 12, 39],
              'col4': [16, np.nan, 25, 6, 19],
              'col5': [1, 9, 23, 56, np.nan],
              'col6': [13, 3, 53, 72, 88]})

我想要的只是计算这个数据帧的偶数列和奇数列的平均值.我试过这些代码

df['avg_odd'] = df[[df.columns[0],df.columns[2],df.columns[4]]].mean(axis=1)
df['avg_even'] = df[[df.columns[1],df.columns[3],df.columns[5]]].mean(axis=1)

但有没有办法更快地做到这一点?如果我有100列或更多列,我该如何计算?

解决方法:

使用modulo按列长度创建辅助arange,并创建新列:

arr = np.arange(len(df.columns)) % 2

df['avg_odd']  = df.iloc[:, arr == 0].mean(axis=1)
df['avg_even'] = df.iloc[:, arr == 1].mean(axis=1)

print (df)
   col1  col2  col3  col4  col5  col6    avg_odd   avg_even
0     1     7    56  16.0   1.0    13  19.333333  12.000000
1     2    45    67   NaN   9.0     3  26.000000  24.000000
2     3    12     8  25.0  23.0    53  11.333333  30.000000
3     4    56    12   6.0  56.0    72  24.000000  44.666667
4     5    14    39  19.0   NaN    88  22.000000  40.333333

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...