机器学习模型能否将X作为稀疏矩阵使用

问题描述

我必须在One Hot中编码7个特征，因此结果创建了稀疏矩阵。我的问题是：

由于我看不到稀疏矩阵背后的实际数据，因此我必须先对其进行缩放，因为索引变得混乱。有什么办法可以避免创建稀疏矩阵，使我无法处理索引。
机器学习模型从稀疏矩阵中学习会很好吗？
当OneHotEncoding多个功能时，如何不陷入稀疏矩阵？（我检查了是否仅编码2列，否则不会创建稀疏矩阵，但会创建7个。）

下面是我的代码

#Standard Scaling
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
Xtrain[:,(3,5)] = sc.fit_transform(Xtrain[:,5)])
Xtest[:,5)] = sc.transform(Xtest[:,5)])

#One Hot Encoding
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers = [('encoder',OneHotEncoder(),[1,2,4,6,7])],remainder = 'passthrough')
Xtrain = ct.fit_transform(Xtrain)
Xtest = ct.fit_transform(Xtest)

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

feature-engineering python scikit-learn