问题描述
我想对字符串列表中的字符串进行 POS 标记和词形还原。 所以我选择了例如第一个字符串和 pos 标记它:
temp = nltk.pos_tag(nltk.word_tokenize(str),tagset = 'universal')
>>> [('check','VERB'),('test','NOUN'),('failures',('next','ADJ'),('days',('send',('back','ADV')]
现在我想对所有单词进行词形还原,但我想保留 pos 标签。通过使用 wordnetlemmatizer,至少据我所知,pos 标签将被删除。我只想将元组字符串添加到字典中。
有人可以帮我解决这个问题吗?提前致谢!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)