问题描述
我正在使用 TFIDF 来量化文本
X 是一个具有多列(RepID、RepText)的数据框
xtrain,xval,ytrain,yval = train_test_split(X,y,test_size=0.2,random_state=9)
tfidf_vectorizer = TfidfVectorizer(max_df=0.8,max_features=10000)
xtrain_tfidf = tfidf_vectorizer.fit_transform(xtrain)
xval_tfidf = tfidf_vectorizer.transform(xval)
当我尝试获取 xtrain_tfidf
的值时我收到此错误消息
xtrain_tfidf
Out[32]:
<799x10000 sparse matrix of type '<class 'numpy.float64'>'
with 454926 stored elements in Compressed Sparse Row format>
如何获取xtrain_tfidf
的值解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)