问题描述
我的句子中包含一些我需要用自定义标签标记的关键字(很长名称的缩写)。来自默认pos_tag
和StanfordPOSTagger
的标记器有时会将其返回为NNP或NN。我还需要其他东西
我拥有的当前代码:
standford_tagger = StanfordPOSTagger(path_to_tagger,path_to_jar)
standford_tagger.tag('This is the sentent with keyword ABCD'.split())
结果:
This_DT is_VBZ the_DT sentent_NN with_IN keyword_NN ABCD_NN
我需要类似的东西:
This_DT is_VBZ the_DT sentent_NN with_IN keyword_NN ABCD_KEYWORD
单词ABCD
被标记为KEYWORD
而不是NN
有没有一种方法可以在nltk
或任何其他库中实现?如果我可以在nltk
中使用它,那么我该如何使用斯坦福大学的标记器,因为它可以为其他单词(而不是我的关键字)提供更准确的结果?
谢谢
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)