问题描述
我正在使用大型文本数据库。我有一句话,有几个特点,我正在努力减少它。
我正在测试PCA,t-SNE和Isomap等不同尺寸的异径管。但是,我还没有找到一种方法来比较这些减少量并确定什么是对我的数据最好的技术。
我正在尝试使用R的dimRed软件包,但不适用于非常大的数据库。
library(dimRed)
library(tm)
dtm <- DocumentTermMatrix(corpus)
data_emb<- lapply(c("PCA","Isomap","tSNE"),function(x)
embed(dtm,x))
plot_R_NX(data_emb)
请,有人可以告诉我一些替代或特定的指标,以比较不同的降维算法吗?如果可能的话,我想在R或python中看到一个例子。
谢谢!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)