问题描述
当我尝试对我的数据执行 pca 时,出现此错误。 如果我的数据包含字符串,则无法执行 pca ?
from sklearn.decomposition import PCA
from tabulate import tabulate
from sklearn.decomposition import PCA
from tabulate import tabulate
#perform pca
#pca = PCA(0.9).fit(X)
pca = PCA(0.8)
pca.fit(X)
X_pca = pca.transform(X)
[enter image description here][2]
解决方法
PCA 的工作原理是将您的数据乘以它们的最高 n 个主成分,即它们具有 n 个最高特征值的特征向量。讨论非数值数据的特征向量是没有意义的。在执行 PCA 之前,您应该将字符串转换为适当的数字表示。