问题描述
我正在尝试在数据清理后检查分类列中的任何数据丢失(例如整个类别的数据)。我有 2 个系列,其中包含数据框中每个分类列的唯一值。
数据清理前
- dataframe1.nunique()
第一列 | 10 |
第2列 | 20 |
数据清理后
- dataframe2.nunique()
第一列 | 10 |
第2列 | 15 |
知道如何获得以下格式的表格以获得更好的展示吗?两个数据框具有相同的列,但行数不同。
第一列 | 10 | 10 |
第2列 | 20 | 15 |
解决方法
您可以使用 concat()
方法:
df=pd.concat([df1,df2],axis=1)
df.columns=['Unique Value Count_before','Unique Value Count_after']
或
通过 to_frame()
和 merge()
方法
df=df1.to_frame().merge(df2.to_frame(),on='Column Name',suffixes=('_before','_after'))
输出:
Column Name Unique Value Count_Before Unique Value Count_After
Column 1 10 10
Column 2 20 15