从德语句子中提取动词

问题描述

我正在尝试从德语句子中提取动词。问题是,例如这句话

Ich rufe noch einmal an.

我将rufe作为动词,但其anrufe。我正在使用textBlob,对语言学一无所知。并且使用textblob我遇到了POS标签。它将an标记为“ RP”(不知道这意味着什么),并将rufe标记为“ VB”。我可以将所有“ RP”和“ VB”粘合在一起,但是在句子中又可以有多个动词。

正确的做法是什么?

解决方法

如果我正确理解,download_corpora方法将是textblob安装的一部分。像本例一样:

$ pip install -U textblob
$ python -m textblob.download_corpora

然后,您可以使用textblob进行文本分析:

>>> test = TextBlob("Ich rufe noch einmal an.")
>>> test.tags
[('Ich','PRON'),('rufe','VB'),...,('an','RP')]

这里还有一个有趣的德语子图书馆:https://pypi.org/project/textblob-de/

也许,这个答案可以帮助您深入POS标记,因为您的POS标记器可能使用了以下通用标记集:Java Stanford NLP: Part of Speech labels?

P.S。在德语中,单词an是动词的一部分。 “ RB”是分词。因此,POS标签“ VB”和“ RP”与一个动词相关。