如何链接2个数据集？

问题描述

我有两个数据集（每个大小= 12500），并且创建了一个数据集（50000）。

Dataset = pos_data + neg_data

我的新数据集的大小= 50000：

cv = CountVectorizer(binary=True,stop_words=('english'))

＃cv_neg = CountVectorizer（binary = True，stop_words =（'english'））

cv.fit（数据集）

X = cv.fit_transform（Dataset）.A

print（cv.get_feature_names（））

我有此错误代码： _process_toarray_args中的文件“ C：\ Users \ selai \ Anaconda3 \ lib \ site-packages \ scipy \ sparse \ base.py”，行1186 返回np.zeros（self.shape，dtype = self.dtype，order = order）

MemoryError

请帮助我解决这个问题；预先感谢

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

arrays arrays arrays python-3.x

如何链接2个数据集？

问题描述

解决方法

相关问答