考虑到Spacy中的引理,是否可以获得单词列表?

问题描述

我正在尝试在法语文本中修复语法性别,并想知道是否有办法从某个引理中获取所有单词的列表,以及是否有可能在这样的列表中进行查找?

解决方法

尝试:

import spacy
lemma_lookup = spacy.lang.en.LOOKUP

reverse_lemma_lookup = {}

for word,lemma in lemma_lookup.items():
    if not reverse_lemma_lookup.get(lemma):
        reverse_lemma_lookup[lemma] = [word]
    elif word not in reverse_lemma_lookup[lemma]:
        reverse_lemma_lookup[lemma].append(word)

reverse_lemma_lookup["be"]
["'m",'am','are','arst','been','being','is','m','was','wass','were']

我将法语从spacy.lang.en.LOOKUP更改为spacy.lang.fr.LOOKUP