标准化特征以计算方差膨胀因子

问题描述

我正在计算方差膨胀因子

from patsy import dmatrices
from statsmodels.stats.outliers_influence import variance_inflation_factor
y,X = dmatrices('A ~ B + C + D + E + F + G,data=df,return_type='dataframe')

vif = pd.DataFrame()
vif['VIF'] = [variance_inflation_factor(X.values,i) for i in range(X.shape[1])]
vif['variable'] = X.columns
vif

现在如何使用 StandardScaler() 对特征进行标准化,然后重新计算标准化特征的方差膨胀因子?

解决方法

使用“patsy import dmatrices”已经可以扩展和标准化功能。因此没有必要用 StandardScaler() 做第二步