如何使用具有数值特征的 TF-IDF 向量稀疏矩阵?

问题描述

我发现 this question 提到在 tf-idf 稀疏矩阵上使用 toarray() 然后从中制作一个数据帧并与另一个数据帧连接。

但是,使用 Google Colab 时会话会崩溃(我认为是内存问题)。有解决方法吗?

我想使用 LIWC(Linguistic Inquiry Word Count)类别和 TF-IDF 的数值特征来构建使用逻辑回归的分类模型。

如果这个问题的格式不正确,我深表歉意,这是我的第一个问题。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)