标签编码器 - 使用 Inverse_transform 函数

问题描述

我正在尝试弄清楚如何使用 LabelEncoder() 中的 inverse_transform 函数。例如,在下面的代码中,

from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
df['Label'] = le.fit_transform(df[['Actual']]

如果我想反转,我可以简单地调用

le.inverse_transform(df['Label'])

但是,我需要将相同的变换/逆应用到一个新的数据集中,这可能是从上面的模型中预测出来的。即,它是在新笔记本中完成的,因此,似乎我必须存储标签。任何想法如何做到这一点?我唯一的想法是导出一个包含 2 列的数据框,并使用 pd.merge。

解决方法

  1. 制作一个字典,其中包含您在第一个笔记本中使用的 LabelEncoder 的逆变换。 here
  2. 然后使用该字典重新映射第二个笔记本中的值。 here