问题描述
我训练了一个自定义 SpaCy 命名实体识别模型来检测职位描述中的偏见词。现在我训练了 8 个变体(使用不同的基础模型、训练模型和管道设置),我想评估哪个模型表现最好。
但是.. 我找不到关于这些模型验证的任何文档。 输出文件夹中的 Meta.json 文件中有一些召回率、f1-score 和精度,但这还不够。
有人知道如何验证或可以将我链接到正确的文档吗?文档似乎无处可寻。
注意:谈论 SpaCy V3.x
解决方法
在培训期间,您应该提供可用于验证的“评估数据”。这将在训练期间定期评估并打印适当的分数。
请注意,有很多不同的术语在使用,但在 spaCy 中,有您实际训练的“训练数据”和不是训练的“评估数据”,它们仅用于训练过程中的评分。要评估保留的测试数据,您可以使用 cli evaluate 命令。
查看 this fashion brands example project 以了解如何配置和使用“eval”数据。