如何创建具有特征,值和索引且不丢失数据不是NaN的DataFrame?

问题描述

我有以下数据框

data = {'first_set_of_numbers':  [3,9,6,np.nan],'second_set_of_numbers': [np.nan,13,np.nan,np.nan]
       }
df = pd.DataFrame(data,columns=['first_set_of_numbers','second_set_of_numbers'],index=['A','B','C','D'])
df

enter image description here

我现在如何获得一个新的数据框,该框显示所有不丢失的值及其赋值功能和索引?它应该看起来像这样:

enter image description here

解决方法

您可以使用df.stack()df.reset_index

In [2493]: df.stack().reset_index(level=[1],name='value').rename(columns={'level_1':'feature'})
Out[2493]: 
                 feature  value
A   first_set_of_numbers    3.0
B   first_set_of_numbers    9.0
B  second_set_of_numbers   13.0
C   first_set_of_numbers    6.0
,

您可以在将ignore_index参数设置为False的情况下使用df.melt,并在此处使用df.dropna

df.melt(ignore_index=False,var_name='features',value_name='value').dropna() 
# default values of `var_name` -> 'variable',`value_name`->'value'

                features  value
A   first_set_of_numbers    3.0
B   first_set_of_numbers    9.0
C   first_set_of_numbers    6.0
B  second_set_of_numbers   13.0