如何在 Python 中查看 TFIDF 结果

问题描述

我正在使用 TFIDF 来量化文本

X 是一个具有多列(RepID、RepText)的数据框

xtrain,xval,ytrain,yval = train_test_split(X,y,test_size=0.2,random_state=9)
tfidf_vectorizer = TfidfVectorizer(max_df=0.8,max_features=10000)
xtrain_tfidf = tfidf_vectorizer.fit_transform(xtrain)
xval_tfidf = tfidf_vectorizer.transform(xval)

当我尝试获取 xtrain_tfidf

的值时

我收到此错误消息

xtrain_tfidf
Out[32]: 
<799x10000 sparse matrix of type '<class 'numpy.float64'>'
    with 454926 stored elements in Compressed Sparse Row format>

如何获取xtrain_tfidf

的值

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)