使用不同语言的数据集重新训练来自 DeepPavlov 的多语言 NER 模型ner_ontonotes_bert_mult

问题描述

我已经成功安装了 DeepPavlov(ner_ontonotes_bert_mult) 的多语言 NER 模型。我想用阿尔巴尼亚语言的新数据(与他们在 documentation 页面中建议的格式相同)重新训练这个模型。一种不同的语言),或者只有当我们有英文数据时重新训练才有效??

解决方法

是的,您可以在用于多语言 BERT 训练 https://github.com/google-research/bert/blob/master/multilingual.md#list-of-languages 的任何语言上微调模型。

如果多语言词汇对您的语言有很好的覆盖,也可以对不在上面列表中的语言进行微调。