问题描述
我想使用spaCy进行实体链接(EL)。我已经用我的特定领域语料库上的自定义标签训练了spaCy命名实体识别(NER)模型。但是,我下面的示例将使用常规实体标签PERSON和LOCATION。
在知识库(KB)中设置别名后,KB会返回已识别实体出现的候选对象,例如“巴黎”的候选人可以是Wikidata条目Q47899(巴黎希尔顿),Q7137357(巴黎Themmen),Q5214166(丹巴黎),Q90(法国首都巴黎)或Q830149(巴黎,得克萨斯州拉马尔县县城,美国)。
我的问题与公认的实体标签有关。如果NER将“巴黎”识别为PERSON,则从候选人中排除Q90(法国首都巴黎)和Q830149(巴黎,美国得克萨斯州拉马尔县县城),剩下3名候选人。如果“巴黎”被认为是LOCATION,那么只有另外两个候选人。
在检测到NER标签的情况下,是否可以通过某种方式建议KB或EL模型从哪一组实体中选择候选者?在训练EL模型之前还是之后?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)