python – 列出每行中Dataframe的NULL / Empty列名

我有一个带有null / empty值的数据帧.
通过执行以下操作,我可以轻松获取空值的每一行的计数:

df['NULL_COUNT'] = len(df[fields] - df.count(axis=1)

这将在字段NULL_COUNT中放置NULL的列数.

有没有办法将列标题以相同的方式写入另一个字段,如果它为null?

df['NULL_FIELD_NAMES'] = "<some query expression>"

例:

df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=['A', 'B', 'C'])

在上面的df中,第二行应该有df [‘NULL_FIELD_NAME’] =’B’,第三行应该有df [‘NULL_FIELD_NAME’] =’C’

解决方法:

您可以使用:

df['new'] = (df.isnull() * df.columns.to_series()).apply(','.join,axis=1).str.strip(',')

另一种方案:

df['new'] = df.apply(lambda x: ','.join(x[x.isnull()].index),axis=1)

样品:

df = pd.DataFrame([range(3), [np.NaN, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], 
                  columns=['A', 'B', 'C'])
print (df)
     A    B    C
0  0.0  1.0  2.0
1  NaN  NaN  0.0
2  0.0  0.0  NaN
3  0.0  1.0  2.0
4  0.0  1.0  2.0

df['new'] = df.apply(lambda x: ','.join(x[x.isnull()].index),axis=1)
print (df)
     A    B    C  new
0  0.0  1.0  2.0     
1  NaN  NaN  0.0  A,B
2  0.0  0.0  NaN    C
3  0.0  1.0  2.0     
4  0.0  1.0  2.0     

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...