问题描述
我目前正在学习这个库:来自 Deeplearning4j 的 Word2Vec (Homepage,Github)
//build Word2Vec model
Word2Vec vec = new Word2Vec.Builder()
.layerSize(100)
.windowSize(5)
.stopWords(stopList)
.tokenizerFactory(t)
.learningRate(0.025)
.build();
我知道我可以用这个方法限制词汇量:
vec.limitVocabularySize(100) //limit the vocab size as 100
上面的例子是如果我想将词汇大小限制为 100 的命令
我的问题:
谁能告诉我词汇的默认大小是多少(即,如果我没有设置限制)?
最好,
解决方法
默认情况下没有限制。这意味着它将把它找到的所有单词添加到词汇表中。
另请注意,您链接的示例已超过 4 年。我建议您使用官方示例:https://github.com/eclipse/deeplearning4j-examples