Scala / Java word2vec阅读器

问题描述

我有几个具有以下标准布局的word2vec文本文件

numWords vecSize
word1 vec1 vec2 ...
word2 vec1 vec2 ...
...

是否有任何Scala或Java库可以读取这些内容并计算诸如以下的简单内容

  • isWordInVocab
  • getWordVectors
  • nearestNeighbours
  • cosdistance
  • ...

我只能找到一些二进制格式的文件,有没有办法使用它们(除了编写自己的二进制文件以外)?

解决方法

为了避免整个dl4j / nd4j导入/设置/运行过程,我刚刚结束了自己的课程。