问题描述
我有点困惑:我计算了同一数据集的PCA。这是工作流程:
- 橙色3.26:读取.csv,4台PC上的PCA(标准化变量),散点图
- scikit-learn:读取相同的.csv,标准化数值
(StandardScaler(with_mean=True,with_std=True)),PCA (copy=True,iterated_power='auto',n_components=4,random_state=None,svd_solver='auto',tol=0.0,whiten=False)
结果与单个PC的数值不同:
橙色3.26:
这是我的scikit-learn-fu代码:
我有一个pd.DataFrame,形状为(268,16)。第一步,我将数据帧分成两个daframe:
- A1:包含所有行和所有要素;形状(268,13)
- B1:包含目标和每一行的ID;形状(268,3)
下一步,我使用sklearn.preprocessing的StandardScaler标准化数据帧A1:
a1 = StandardScaler(with_mean=True,with_std=True).fit_transform(A1)
下一步是PCA:
pca1 = PCA(n_components=4)
principalComponents1 = pca1.fit_transform(a1)
输出是得分和负荷-没什么特别的。
也许初始数据集的归一化有所不同? 有什么建议吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)