机器学习模型能否将X作为稀疏矩阵使用

问题描述

我必须在One Hot中编码7个特征,因此结果创建了稀疏矩阵。 我的问题是:

  1. 由于我看不到稀疏矩阵背后的实际数据,因此我必须先对其进行缩放,因为索引变得混乱。有什么办法可以避免创建稀疏矩阵,使我无法处理索引。
  2. 机器学习模型从稀疏矩阵中学习会很好吗?
  3. 当OneHotEncoding多个功能时,如何不陷入稀疏矩阵? (我检查了是否仅编码2列,否则不会创建稀疏矩阵,但会创建7个。)

下面是我的代码

#Standard Scaling
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
Xtrain[:,(3,5)] = sc.fit_transform(Xtrain[:,5)])
Xtest[:,5)] = sc.transform(Xtest[:,5)])

#One Hot Encoding
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers = [('encoder',OneHotEncoder(),[1,2,4,6,7])],remainder = 'passthrough')
Xtrain = ct.fit_transform(Xtrain)
Xtest = ct.fit_transform(Xtest)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...