Spacy 3.0 训练自定义 NER --> 验证此自定义 NER 模型

问题描述

我训练了一个自定义 SpaCy 命名实体识别模型来检测职位描述中的偏见词。现在我训练了 8 个变体(使用不同的基础模型、训练模型和管道设置),我想评估哪个模型表现最好。

但是.. 我找不到关于这些模型验证的任何文档。 输出文件夹中的 Meta.json 文件中有一些召回率、f1-score 和精度,但这还不够。

有人知道如何验证或可以将我链接到正确的文档吗?文档似乎无处可寻。

注意:谈论 SpaCy V3.x

解决方法

在培训期间,您应该提供可用于验证的“评估数据”。这将在训练期间定期评估并打印适当的分数。

请注意,有很多不同的术语在使用,但在 spaCy 中,有您实际训练的“训练数据”和不是训练的“评估数据”,它们仅用于训练过程中的评分。要评估保留的测试数据,您可以使用 cli evaluate 命令。

查看 this fashion brands example project 以了解如何配置和使用“eval”数据。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...