询问 Deeplearning4j 库中 Word2Vec 中词汇的“默认”大小

问题描述

我目前正在学习这个库:来自 Deeplearning4j 的 Word2Vec (Homepage,Github)

以下是该方法的示例用法

//build Word2Vec model
Word2Vec vec = new Word2Vec.Builder()
                .layerSize(100)
                .windowSize(5)
                .stopWords(stopList)
                .tokenizerFactory(t)
                .learningRate(0.025)
                .build();

我知道我可以用这个方法限制词汇量:

vec.limitVocabularySize(100) //limit the vocab size as 100

上面的例子是如果我想将词汇大小限制为 100 的命令

我的问题:
谁能告诉我词汇的大小是多少(即,如果我没有设置限制)?

最好,

解决方法

默认情况下没有限制。这意味着它将把它找到的所有单词添加到词汇表中。

另请注意,您链接的示例已超过 4 年。我建议您使用官方示例:https://github.com/eclipse/deeplearning4j-examples