Fasttext量化无监督模型

问题描述

我正在尝试使用此命令以Fasttext量化无监督模型。

model.quantize(input=train_data,qnorm=True,retrain=True,cutoff=200000)

抛出一个错误,它仅受监督的模型支持。

enter image description here

有没有其他方法可以量化无监督模型?

解决方法

paper which introduced the FastText team's quantization strategy仅评估分类模型,并使用了一些修剪步骤,这些步骤仅对带有标签的培训文档有意义。 (不过,我看不到-quantize的论点包括原始的培训文档,因此不确定本文中所述的修剪技术是否已完全实现。)

虽然某些压缩步骤可以应用于无监督的密集向量,但我还没有看到提供这种功能的库,但是实现/添加可能是一件很整洁的事情。

但是,FastText工作完成的分类可能是这些技术的“最佳结合点”,并将其应用于其他词向量后,它们会对下游使用产生更大的负面影响。因此,应在扩展该技术的同时进行一些实验,以确认其价值。

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...