问题描述
我正在将sklearn.preprocessing.MinMaxScaler()
应用于DataFrame并将该DataFrame用于机器学习。训练后,我有一个单独的代码和DataFrame进行预测。在预测代码中,我对要用来预测的DataFrame做MinMaxScaler()
。训练数据框和预测数据框将具有不同的最小值和最大值。我的问题是,Training DataFrame和Prediction DataFrame是否应使用相同的Min和Max值才能获得准确的预测?
解决方法
是的,您应该在火车上进行相同的MinMaxScaler()
测试。
说明:假设您的训练数据集具有min = 10和max = 20的某些特征,而您的测试数据集具有min = 1和max = 10的特征。如果对单独的定标器进行测试训练,则与训练数据集相比,测试数据值将更低。