训练 SVM 分类器词嵌入与句子嵌入

问题描述

我想尝试不同的嵌入,例如 Word2Vec、ELMo 和 BERT,但我对是使用单词嵌入还是句子嵌入以及原因有点困惑。我将嵌入用作 SVM 分类器的特征输入。

谢谢。

解决方法

虽然这两种方法都可以证明对不同的数据集有效,但根据经验,我建议您在输入几个单词时使用词嵌入,而在输入较长(例如大段落)时使用句子嵌入。