问题描述
我有以下数据框
data = {'first_set_of_numbers': [3,9,6,np.nan],'second_set_of_numbers': [np.nan,13,np.nan,np.nan]
}
df = pd.DataFrame(data,columns=['first_set_of_numbers','second_set_of_numbers'],index=['A','B','C','D'])
df
我现在如何获得一个新的数据框,该框显示所有不丢失的值及其赋值功能和索引?它应该看起来像这样:
解决方法
您可以使用df.stack()
和df.reset_index
:
In [2493]: df.stack().reset_index(level=[1],name='value').rename(columns={'level_1':'feature'})
Out[2493]:
feature value
A first_set_of_numbers 3.0
B first_set_of_numbers 9.0
B second_set_of_numbers 13.0
C first_set_of_numbers 6.0
,
您可以在将ignore_index
参数设置为False
的情况下使用df.melt
,并在此处使用df.dropna
。
df.melt(ignore_index=False,var_name='features',value_name='value').dropna()
# default values of `var_name` -> 'variable',`value_name`->'value'
features value
A first_set_of_numbers 3.0
B first_set_of_numbers 9.0
C first_set_of_numbers 6.0
B second_set_of_numbers 13.0