在快速文本监督学习模型的框架下发生了什么?

问题描述

我们可以使用快速文本来训练监督模型

import fasttext
model = fasttext.train_supervised(input="cooking.train")

我的问题是它如何表示特征(单词或tf / idf或单词嵌入的包)以及用于文本分类的算法是什么?

解决方法

它仍在学习输入文本的单词向量-但随后将它们平均在一起,有点像无限窗口CBOW模式-然后使用它来预测标签,就像标签是(word2vec样式)预测字。