问题描述
我有几个具有以下标准布局的word2vec文本文件:
numWords vecSize
word1 vec1 vec2 ...
word2 vec1 vec2 ...
...
是否有任何Scala或Java库可以读取这些内容并计算诸如以下的简单内容:
- isWordInVocab
- getWordVectors
- nearestNeighbours
- cosdistance
- ...
我只能找到一些二进制格式的文件,有没有办法使用它们(除了编写自己的二进制文件以外)?
解决方法
为了避免整个dl4j / nd4j导入/设置/运行过程,我刚刚结束了自己的课程。