findSynonyms 与 pySpark 中的 work2vec

问题描述

我在大约 500,000 个单词的字典中创建了所有单词的表示。该表示是使用包 pyspark.mllib.feature.Word2Vec 创建的。我想为字典中的每个单词找到 10 个“同义词”。但是同义词属于该词典的一个较小的集合(约 20,000 个单词)。有人能给我一些建议吗?在 pyspark 中会很棒。真的很感谢!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)