Spacy:使法语文本定形时的怪异行为

问题描述

我正在处理法语文本,但在我看来,存在一些一致性问题:

nlp = spacy.load('fr_core_news_md')
print([i.lemma_ for i in nlp('Bonjour,je souhaiterais imprimer ce document.')],[i.lemma_ for i in nlp('Bonjour,je souhaiterais ce document.')],je voudrais imprimer ce document.')])

输出

['bonjour',','je','souhaiterais','imprimer','ce','document','.'] 
 ['bonjour','souhaiter','vouloir','.']```

因此有时“ souhaiterais”一词被形容为“ souhaiter”,但有时并非如此。在同一个地方,“ voudrais”在应有的意义上被形容了。 而且,经过几次测试,似乎相同的句子可以有不同的输出,如

 [i.lemma_ for i in nlp('Bonjour,je souhaiterais ce document.')]

输出

['bonjour','.']

有没有办法获得更好的结果?谢谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)