POS 标签元组中的词形还原 - python

问题描述

我想对字符串列表中的字符串进行 POS 标记和词形还原。 所以我选择了例如第一个字符串和 pos 标记它:

temp = nltk.pos_tag(nltk.word_tokenize(str),tagset = 'universal')

>>> [('check','VERB'),('test','NOUN'),('failures',('next','ADJ'),('days',('send',('back','ADV')]

现在我想对所有单词进行词形还原,但我想保留 pos 标签。通过使用 wordnetlemmatizer,至少据我所知,pos 标签将被删除。我只想将元组字符串添加到字典中。

有人可以帮我解决这个问题吗?提前致谢!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)