如何创建具有特征，值和索引且不丢失数据不是NaN的DataFrame？

问题描述

我有以下数据框

data = {'first_set_of_numbers':  [3,9,6,np.nan],'second_set_of_numbers': [np.nan,13,np.nan,np.nan]
       }
df = pd.DataFrame(data,columns=['first_set_of_numbers','second_set_of_numbers'],index=['A','B','C','D'])
df

我现在如何获得一个新的数据框，该框显示所有不丢失的值及其赋值功能和索引？它应该看起来像这样：

解决方法

您可以使用df.stack()和df.reset_index：

In [2493]: df.stack().reset_index(level=[1],name='value').rename(columns={'level_1':'feature'})
Out[2493]: 
                 feature  value
A   first_set_of_numbers    3.0
B   first_set_of_numbers    9.0
B  second_set_of_numbers   13.0
C   first_set_of_numbers    6.0

您可以在将ignore_index参数设置为False的情况下使用df.melt，并在此处使用df.dropna。

df.melt(ignore_index=False,var_name='features',value_name='value').dropna() 
# default values of `var_name` -> 'variable',`value_name`->'value'

                features  value
A   first_set_of_numbers    3.0
B   first_set_of_numbers    9.0
C   first_set_of_numbers    6.0
B  second_set_of_numbers   13.0

dataframe missing-data pandas pandas python