如何使用sklearn获取在LDA中生成每个主题的文档

问题描述

嗨,我需要检索使用sklearn的潜在狄利克雷分配中的每个主题(文档ID)。

我正在使用数据库存储语料库。

例如,我有表语料库:

corpus =(doc_id,text)

我在语料库上运行LDA。

我需要检索:

主题1

是由doc_id =(ID3,ID9,ID12,...)

生成的

主题2

是由doc_id =(ID2,ID9,ID66,...)

生成的

主题K

是由doc_id(d1,d2,...)

生成的

我能这样做吗?一旦LDA将语料库放到BOW中并且doc_id丢失了,我只能检索到文件的序号,而不是数据库中的doc_id。

我可以这样做吗?

谢谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...